并行超算云计算使用步骤完整流程详情

本文目录

  • 一、将项目传入并运云。
  • 二、创建项目的虚拟环境
  • 三、编辑run.sh脚本
  • 四、提交作业
  • 五、查看作业输出
  • 六、查看提交的作业号
  • 七、结束作业

  

一、将项目传入并运云。

在这里插入图片描述
在这里插入图片描述

二、创建项目的虚拟环境

  1. 打开终端
    在这里插入图片描述
  2. 使用conda创建:conda create -n 环境名 python=3.8
  3. 查看conda下所有的环境:conda env list
  4. 激活环境:conda activate 环境名
  5. 安装项目所需模块:pip install 模块名 -i https://pypi.tuna.tsinghua.edu.cn/simple,如果项目有requirements.txt文件,则需要先cd到包含该文件的目录下,使用pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple来安装所有模块。
  6. 查看当前环境下所有的模块:module ava

三、编辑run.sh脚本

此处的脚本用于后续的提交作业。

#!/bin/bash     
module load anaconda/2021.05
export PYTHONUNBUFFERED=1source activate yolov5
cd /data/home/scv9187/yolov1
python train.py

一般只需要修改后三行即可。
source activate yolov5:激活刚才创建好的环境,这里yolov5是环境名,要根据自己所创建的环境修改。
cd /data/home/scv9187/yolov1:切换含有train.py文件的目录下。
python train.py:运行train.py文件。

四、提交作业

我们需要先cd到含有run.sh脚本文件的目录下,然后使用下面命令提交脚本文件。
使用命令:sbatch --gpus=GPU卡数 run.sh,这里GPU卡数不要超过8。
使用示例:sbatch --gpus=8 run.sh

在这里插入图片描述
  提交后会立刻获得一个作业号,但是这个作业号并不是.out文件,只是为了方便后续我们区别不同的作业而已。
  在提交完成后,等待片刻,终端会生成一个作业号.out文件。但是这并不是立刻生成的,当我们提交了作业后,云计算端会按照作业的排队顺序去分配计算资源,当作业被分配了资源后,才会生成.out文件。这时需要等待分配资源即可。

五、查看作业输出

使用命令:tail -f slurm-作业号.out
使用示例:tail -f slurm-1052867.out

特别注意:只有终端生成了.out文件后,我们才可以使用上面的命令就可以查看作业的输出内容。
在这里插入图片描述

六、查看提交的作业号

使用命令:squeue
在这里插入图片描述
作业运行状态:
R:正在运行
PD:正在排队
CG:即将完成
CD:已完成

七、结束作业

使用命令:scancel 作业号
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/801925.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

怎么搜索夸克网盘分享出来的文件

当您需要对大量的夸克网盘上的分享文件进行搜索时,您可以考虑以下五种优秀的网盘搜索工具: 6miu易搜 如果您正在寻找一个轻用且高效的网盘搜索工具,这里有一款非常优秀的工具可以帮助您。6miu易搜是一款十分方便于使用、易于操作的网盘搜索工具,使用该工具可以提高您对网盘搜索…

Java面试必问题29:MySQL篇(重点必问)

数据库的ACID特性 原子性(Atomicity):事务中的操作要么全部成功,要么全部失败。事务是一个不可分割的单元,要么全部执行,要么全部回滚。如果事务中的任何操作失败,所有操作都将被回滚到事务开始…

计算机网络:数据链路层 - CSMA/CD协议

计算机网络:数据链路层 - CSMA/CD协议 媒体接入控制CSMA/CD协议截断二进制指数退避算法帧长与帧间间隔信道利用率 媒体接入控制 如图所示,这是一根同轴电缆,有多台主机连接到这根同轴电缆上,他们共享这根传输媒体,形成…

【随笔】Git 高级篇 -- 整理提交记录(下)rebase(十六)

💌 所属专栏:【Git】 😀 作  者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! 💖 欢迎大…

蓝桥杯刷题-15-异或和之和-拆位+贡献法⭐⭐(⊙o⊙)

蓝桥杯2023年第十四届省赛真题-异或和之和 题目描述 给定一个数组 Ai,分别求其每个子段的异或和,并求出它们的和。或者说,对于每组满足 1 ≤ L ≤ R ≤ n 的 L, R ,求出数组中第 L 至第 R 个元素的异或和。然后输出每组 L, R 得到…

MySQL5.7导入MySQL8.0以上版本的几种错误

【错误原因1】/!40000 DROP DATABASE IF EXISTS springbootra863/; 【解决办法】给这一行删了

阿里通义千问开源 320 亿参数模型;文字和音频自动翻译成手语Hand Talk拉近人与人的距离

✨ 1: Qwen1.5-32B Qwen1.5-32B是Qwen1.5系列中性能与效率兼顾的最新语言模型,内存占用低,运行速度快。 Qwen1.5-32B是Qwen1.5语言模型系列的最新成员,这个模型是基于先进的技术研发的,旨在提供一种既高效又经济的AI语言理解和生…

CAXA实体设计教程 网盘下载

CAXA实体设计教程 网盘下载 https://pan.baidu.com/s/1tOIoWmAwl8Wepu7iFsKB_A?pwd2024 章节: 第一章 CAXA3D实体设计入门基础概述 (150分钟) 第二章 CAXA3D实体设计二维草图 (230分钟) 第三章 CAXA实体设计 特征生成…

OpenHarmony实战:瑞芯微RK3568移植案例

本文章是基于瑞芯微RK3568芯片的DAYU200开发板,进行标准系统相关功能的移植,主要包括产品配置添加,内核启动、升级,音频ADM化,Camera,TP,LCD,WIFI,BT,vibrato…

基于springboot实现在线教育平台系统项目【项目源码+论文说明】计算机毕业设计

基于springboot实现在线教育平台系统演示 摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了微服务在线教育系统的开发全过程。通过分析微服务在线教育系统管理的不足,创建了一个计算机管理微服务在线…

CASA模型教程

原文链接:CASA(Carnegie-Ames-Stanford Approach)模型教程https://mp.weixin.qq.com/s?__bizMzUzNTczMDMxMg&mid2247600635&idx6&sna655a8de570edcaa435d6e917b66d9b3&chksmfa82081ccdf5810a33a778e8771bb116bde9e5a1f795da…

深入剖析OR与UNION的区别及应用场景

深入剖析OR与UNION的区别及应用场景 引言一、概念与基本用法二、区别与联系三、实战应用与示例四、何时选用OR与UNION结论 引言 在SQL查询中,OR 和 UNION 这两个关键词虽然都可以用来合并数据集,但它们的工作方式和适用场景有着显著的不同。这里在通过实…

IRIS / Chronicles 数据结构备忘录

数据结构的内容主要涉及到索引和全局变量。 这部分的内容的问题在于概念多,和普通的数据库对应的内容也不太一样,需要花点时间了解。 networked items 有关英文的解释是: Networked items that point to databases that use padded-string…

Vue 打包或运行时报错Error: error:0308010C

问题描述: 报错:Error: error:0308010C 报错原因: 主要是因为 nodeJs V17 版本发布了 OpenSSL3.0 对算法和秘钥大小增加了更为严格的限制,nodeJs v17 之前版本没影响,但 V17 和之后版本会出现这个错误…

Map接口及其实现类及常用方法

1.Map接口及其实现类 java.util.Map : 存储一对一对的数据(key-value键值对)|----->HashMap : 主要实现类,线程不安全,效率高,可以添加null的键值对;底层使用数组单向链表红黑树。|------->LinkedHashMap : 是HashMap的子类,在HashMap的数据结构的基础上,添加了一对双向…

redis缓存穿透,雪崩,击穿

redis缓存穿透,雪崩,击穿 redis雪崩定义解决 redis缓存击穿定义解决 redis缓存穿透定义解决 redis雪崩 定义 当大量缓存数据在同一时间过期(失效)或者 Redis 故障宕机时,如果此时有大量的用户请求,都无法…

读博做FPGA上的AI加速能不能搞啊?

从企业的角度来看,选择在FPGA上进行AI加速仍然有其一定的优势和适用场景,但也有一些挑战需要考虑。我这里有一套嵌入式入门教程,不仅包含了详细的视频讲解,项目实战。如果你渴望学习嵌入式,不妨点个关注,给…

如何做数据库优化(一些常见的优化方式和经验总结)

数据库优化是提高应用性能的重要方面。以下是一些常见的数据库优化方式和特殊技巧: 查询优化 索引使用:为常用的查询字段创建索引。正确使用索引可以显著提高查询效率。避免全表扫描:尽量避免在 WHERE 子句中使用会导致全表扫描的操作。使用…

【经典算法】LCR187:破冰游戏(约瑟夫问题,Java/C/Python3/JavaScript实现含注释说明,Easy)

目录 题目思路及实现方式一:迭代模拟(用链表模拟这个游戏)思路代码实现Java版本C语言版本Python3版本 复杂度分析 方式二:数学迭代思路代码实现Java版本C语言版本Python3版本 复杂度分析 方式三:递归思路代码实现Java版…

【CSS疑难点汇总】1.bor-box失效情况总结以及高宽设置为auto的情况

1. box-sizing box-sizing是改变盒子宽高的计算方式,一般使用bor-box,消除padding和border对整个盒子的影响,但在没有明确给出宽高的情况下,box-sizing是没有效果的 1.1 box-sizing不生效的情况 1.1.1块级盒子嵌套 ​ 宽度继承…