slurm学习(1)

  1. slurm 指定节点
  2. SLURM 使用基础教程
  3. slurm节点,分区,作业信息说明
  4. slurm作业提交系统常用命令
  5. slurm nodelist
  6. 中国科大超算中心用户使用手册
  7. slurm:使用nodelist中的任何节点
  8. SLURM 使用参考
  9. Slurm执行的CPU管理步骤 (我想提高我的cpu利用率来着,可是没看明白这个博客)

Slurm使用四个基本步骤来管理一个job/step的CPU资源:

步骤1:节点选择
Slurm选择向作业或作业步骤分配CPU资源的节点集节点选择受到许多控制CPU分配的配置和命令行选项的影响(下面的步骤2)。如果配置了SelectType=select/linear,则所选节点上的所有资源都将分配给job/step。如果SelectType配置为select/con_res或select/con_tres,则可以从所选节点中分配单独的socket、core和thread作为消耗资源。消耗资源类型由SelectTypeParameters定义

步骤2:从选定的节点分配CPU
Slurm从步骤1中选择的一组节点中为一个job/step分配CPU资源CPU分配受与节点选择相关的配置和命令行选项的影响。如果配置了SelectType=select/linear,则所选节点上的所有资源都将分配给job/step。如果SelectType被配置为select/cons_res或select/ccons_tres,则可以从所选节点分配单独的socket、core和thread作为可消耗资源。消费资源类型由SelectTypeParameters定义。

当使用select/cons_res或select/cons_tres的SelectType时跨节点的默认分配方法是block分配(在使用另一个节点之前,分配一个节点中所有可用的CPU) 节点内的默认分配方法是循环分配(在节点内的socket之间以循环方式分配可用的CPU)用户可以使用下面描述的适当命令行选项覆盖默认行为。分配方法的选择可能会影响将哪些特定CPU分配给job/step。

步骤3:将任务分配给选定的节点
Slurm将任务分配给在步骤1中为job/step选择的节点每个任务只分发给一个节点,但可以将多个任务分发到每个节点。除非为作业指定CPU对任务的过度使用(over commitment),否则分配到节点上的任务数量受节点上分配的CPU数量和每个任务的CPU数量的限制如果配置了消耗资源,或允许资源共享,那么来自多个job/step的任务可以同时在同一节点上运行。

步骤4:将任务分配和绑定到节点内的CPU(可选)
在可选的步骤4中,Slurm将每个任务分发并绑定到步骤3中任务分发到的节点上分配的CPU。分布在同一节点上的不同任务可以绑定到相同的CPU子集或不同的子集。这一步被称为任务亲和或任务/CPU绑定。

  1. slurm作业提交系统常用命令
  2. [任务提交/队列管理] 求助如何修改slurm脚本,交作业到某个特定服务器上
  3. 别人的博客

–cpus-per-task
单个 task 需要的 cpu 核数。一个 task 进程可以多线程,需要使用多个 cpu 核。此选项 Slurm 系统会保证一个 task 进程所在的计算节点上有指定数量的 cpu 核可用。
例如,每个计算节点有 4 个 cpu 核,一个计算作业需要 24 个 cpu 核,直接声明 24 个 task,Slurm 系统将分配 6 个计算节点。(指定 --cpus-per-task=3,Slurm 系统将分配 8 个计算节点,确保一个 task 需要的 3 个 cpu 核是在同一个节点上。)???如果不设置此选项,Slurm 系统默认值是 1,即默认一个 task 分配一个 cpu 核。

–gres
申请每计算节点上 GPU 资源的数量,在作业脚本里加入
#SBATCH --gres=gpu:X
其中 X 是数量,目前 gpu 分区每计算节点有 4 张 Nvidia Tesla V100,因此 X 不超过 4

–nodes
申请计算节点的数量,在作业脚本里加入
#SBATCH --nodes=X
其中 X 是数量,需要的计算节点的个数

–ntasks
指定要运行的 task 数量,在作业脚本里加入
#SBATCH --ntasks=X 其中 X 是数量。sbatch 不启动 task,只向 Slurm 系统申请需要的 cpu 核数,默认一个 task 申请一个 cpu 核,如果设置了 --cpus-per-task 选项,则会改变此默认数量

–ntasks-per-node
控制每个计算节点上运行 task 的数量,一般与 --nodes 配合使用,例如: MPI 程序需要 3 个计算节点,每节点 4 个进程,一共 12 个 task,对应 12 个 cpu 核
#SBATCH --nodes=3
#SBATCH --ntasks-per-node=4
还可以与 --cpus-per-task 选项配合使用,例如:MPI 程序需要 3 个计算节点,每节点 2 个进程,每个进程使用 OpenMP 运行 8 个线程,一共 48 个 cpu 核
#SBATCH --nodes=3
#SBATCH --ntasks-per-node=2
#SBATCH --cpus-per-task=8

–partition
超算上不同类型的计算资源,以资源分区的形式组织,指定使用哪个分区,在作业脚本里加入,例如申请在 hpxg 分区计算
#SBATCH --partition=hpxg

–nodelist
指定要运行的计算节点名,节点名之间用逗号分隔,例如: 指定使用 n0050 n0051 n0052 n0053 n0180
#SBATCH --nodelist=n[0050-0053],n0180

–excludet
排除特定的计算节点,例如: 分配资源的时候不要分配计算节点 n0050 n0051 n0052 n0053 n0180
#SBATCH --exclude=n[0050-0053],n0180

查询计算节点和分区状态 运行以下命令查看计算节点的状态信息 sinfo 其中 STATE 常见的有
alloc,节点已经被分配给作业任务
down,节点当前不可用
drain,节点被管理员设置为退出服务
idle,节点当前空闲
mix,节点有部分计算资源已被分配,还有部分资源空闲可用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/204184.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

iOS常用第三方框架

1、网路请求 -- Moya 2、数据存储处理 -- SQLite.swift 3、数据解析、转换 -- SwiftyJSON、ObjectMapper 4、对NSUserDefaults的封装 -- SwiftyUserDefaults 5、图片加载、处理 -- SDWebImage 6、轮播图 -- FSPagerView 7、键盘管理 -- IQKeyboardManagerSwift 8、弹框提…

天线是什么

天线 电子元器件百科 文章目录 天线前言一、天线是什么二、天线的类别三、天线的应用实例四、天线的作用原理总结前言 不同种类和设计的天线用于不同的应用领域,如广播、电视、无线通信、雷达、卫星通信、导航系统等。常见的天线类型包括柱状天线、片状天线、螺旋天线、饼叶天…

JavaScript <关于AES/DES`代码+白话`讲解和对比>--案例(四)

前言: 有XX私信,说他对于aes和des的解密有点混淆;说实话,我当初也混淆.其实案例搞多了,就清楚了;但是,今天把它稍微梳理一下,整理出来,对你对我都是交代; 正文: AES(Advanced Encryption Standard)和 DES(Data Encryption Standard&#xf…

Node.js快速搭建简单的HTTP服务器并发布公网远程访问

文章目录 前言1.安装Node.js环境2.创建node.js服务3. 访问node.js 服务4.内网穿透4.1 安装配置cpolar内网穿透4.2 创建隧道映射本地端口 5.固定公网地址 前言 Node.js 是能够在服务器端运行 JavaScript 的开放源代码、跨平台运行环境。Node.js 由 OpenJS Foundation&#xff0…

TCP传输的三次握手四次挥手策略

TCP传输的三次握手四次挥手策略如下: 第一次握手:客户端发送一个带有SYN标志的数据包给服务器,并记为SYN_Client。第二次握手:服务器收到SYN_Client后,向客户端发送一个带有SYN和ACK标志的数据包,记为SYN_…

西工大计算机学院计算机系统基础实验一(函数编写15~17)

还是那句话,稳住心态,稳住心态,稳住心态。心里别慌,心里别慌,心里别慌。 第15题,howManyBits,返回用二进制补码形式表示x所需的最小二进制位数。比如howManyBits(12) 5,12可以被表…

初学vue3与ts:vue3选项式api获取当前路由地址

vue2的获取方法 this.$route.pathvue3选项式api获取方法 import { useRouter } from vue-router; const router useRouter(); console.log(router) console.log(router.currentRoute.value.path)

测开速成考点

用户登录界面需要做哪些测试? ⑴功能:  正确的用户名,正确的密码,点击提交按钮,验证能否正确登录 是否跳转正确页面。  错误的用户名 或 密码,点击提交,提示相应的错误信息。  记住用户名…

Word文件设置了只读模式,为什么还能编辑?

Word文档设置了只读模式,为什么还可以编辑呢?,不过当我们进行保存的时候会发现,word提示需要重命名并选择新路径才能够保存,是因为什么呢?今天我们学习一下如何解决问题。 这种操作,即使可以编辑…

Python-文件详解

一个计算机包括:CPU、存储器、输入设备、输出设备 存储器分为内存和硬盘 文件路径:一层一层文件目录组成的字符串 文件路径可以视为文件在硬盘中的身份标识,因为每一个文件的1路径唯一 文件之间使用/反斜杠和\正斜杠都一样 内存和硬盘的区别…

AI文本生成工具-免费AI文本生成软件

在当今数字时代,人工智能技术的快速发展不仅改变了我们的生活方式,还在创作领域崭露头角。其中,AI文本生成技术的迅猛发展引起了广泛关注。本文将深入探讨AI文本生成的方法、工具以及一些关键技巧,帮助读者更好地了解并利用这一前…

Run Micro-ROS on almost any stm32

Run Micro-ROS on almost any stm32 - Tech blog (guillaumebeuzeboc.github.io) Run Micro-ROS on almost any stm32 19 Sep 2021 c, cmake, stm32, micro-ros, clion 如果用的不是STM32F4,需要自己去生成micro_ros_stm32cubemx_utils库 Micro-ROS brings the…

你知道模拟养成游戏如何开发吗?

在游戏开发的世界中,模拟养成游戏一直以其引人入胜的玩法和独特的虚拟体验吸引着玩家的目光。从概念的孵化到最终的上线,模拟养成游戏的开发是一个富有挑战性又充满创意的过程。本文将带你深入了解这一过程,揭示模拟养成游戏背后的秘密&#…

UNIX 文件权限设置的相关函数

函数 umask umask 函数为进程设置文件模式创建屏蔽字&#xff0c;并返回之前的值。这个函数没有出错返回&#xff0c;它不会出错. #include <sys/stat.h> mode_t umask(mode_t cmask); // 返回值&#xff1a;为文件模式创建屏蔽字 其中&#xff0c;参数 cmask 是由 文…

qt 5.15.2 主窗体菜单工具栏树控件功能

qt 5.15.2 主窗体菜单工具栏树控件功能 显示主窗体效果&#xff1a; mainwindow.h文件内容&#xff1a; #ifndef MAINWINDOW_H #define MAINWINDOW_H#include <QMainWindow> #include <QFileDialog> #include <QString> #include <QMessageBox>#inc…

m1通过源码编译xgboost4j的jar

1、下载源码 git clone --recursive https://github.com/dmlc/xgboost cd xgboost 编译xgboost的动态链接库dylib&#xff0c;m1源码编译xgboost的动态链接库dylib文件 2、编译XGBoost的jar文件&#xff1a; A、如果没有安装maven可以通过以下命令进行安装&#xff0c;如果安…

【开发技能】-解决visio交叉线(跨线)交叉点弯曲问题

问题 平时工作中使用visio作图时&#xff0c;经常会遇到交叉线在相交时会形成一个弯曲弓形&#xff0c;这十分影响视图效果。可以采用下面的方法消除弓形。 方法 第一步&#xff1a;菜单栏--设计---连接线 第二步&#xff1a;选中这条交叉线---点击显示跨线 最终问题得到解决…

基于ssm学校运动会信息管理系统论文

摘 要 在当今社会上&#xff0c;体育运动越来越普及&#xff0c;参与运动会的人越来越多&#xff0c;但是目前对运动会信息管理还是处于手工记录的时代&#xff0c;这远远满足不了现在用户需求&#xff0c;因此建立一个运动会信息管理系统已经变的非常重要。 本文重点阐述了学…

16个UI设计小规则,但是却能产生巨大影响

我的新书《Android App开发入门与实战》已于2020年8月由人民邮电出版社出版&#xff0c;欢迎购买。点击进入详情 文章目录 1.使用空间对相关元素进行分组2.保持一致3.确保外观相似的元素功能相似4.创建清晰的视觉层次5.删除不必要的样式6.有目的地使用颜色7.确保界面元素的对比…

漫步者开放式耳机怎么样?南卡、漫步者开放式耳机哪个好?

现在开放式耳机的市场越来越混杂&#xff0c;我们作为消费者在挑选的时候&#xff0c;一定要找准需求点才能把踩坑几率降到最低。实在不会挑选的也不要紧&#xff0c;我最近入了2款目前市面最畅销的百元款开放式耳机&#xff1a;南卡OE CC和漫步者comfo fit&#xff0c;亲身上耳…