tmux 替换 nohup

替换方案 tmux

训练PyTorch模型的时候一个基本步骤:

[terminal]: tmux new -s model-ft        # 创建一个会话,并设置会话名:model-ft

[tmux]: conda activate your_env        # 在tmux会话中,我们激活我们要使用的conda环境

[tmux]: python train.py                       # 在tmux会话中,开始训练我们的模型

[tmux]: [ Ctrl+b ] [ d ]                          # 将会话与窗口分离

[terminal]: tmux ls                              # 查看我们刚刚创建的会话

[terminal]: watch -n 0.5 nvidia-smi     # 监控我们的GPU使用信息

[terminal]: tmux attacth -t model-ft     # 激活到我们想要的窗口

使用方法:

Ubuntu 安装

sudo apt-get install tmux

启动

新建session,可以在terminal上输入tmux命令,会自动生成一个id为0的session

tmux

也可以在建立时显式地说明session的名字,这个名字可以用于解绑后快速的重新进入该session:

tmux new -s your-session-name

分离(转到后台)

在tmux窗口中,按下ctrl+b d或者输入以下命令,就会将当前session与窗口分离,session转到后台执行:

tmux detach

这里你直接关闭这个窗口(右上角X号),也是无所谓的,它也会默认执行 ctrl+b d 操作

 

查看都有什么窗口

tmux ls

打开已有的窗口

tmux attach -t your-session-name

你也可以使用下面的简写,将attach改为a是一样的 

tmux a -t your-session-name

在已经打开的窗口中切换窗口

  • ctrl+b w: 从列表中选择窗口(这个最好用)

tmux上下翻屏

使用快捷键ctrl+b [ ,就可以通过方向键上下移动 或者 使用PageUpPageDown可以实现上下翻页

退出/杀死

如果你想退出该session,可以杀死session:

tmux kill-session -t your-session-name

也可以使用ctrl+d关闭该session的所有窗口来退出该session。

Tmux教程 (一文就够)-CSDN博客

【nohup后台挂起的一种替代方式】TMUX命令使用技巧_使用tmux代替nuhup-CSDN博客

 为什么要使用tmux而不使用nohup?

 nohup可能出现的问题描述:torch.distributed.elastic.multiprocessing.api.SignalException: Process 5262 got signal: 1

 训练的时候,如果是保持命令行窗口不关闭,则不会出现这个问题;如果是使用nohup挂在后台运行,则没多久就会出现这个问题。

[2024-04-09 14:51:16,227] torch.distributed.elastic.agent.server.api: [WARNING] Received Signals.SIGHUP death signal, shutting down workers
[2024-04-09 14:51:16,228] torch.distributed.elastic.multiprocessing.api: [WARNING] Sending process 5302 closing signal SIGHUP
[2024-04-09 14:51:16,228] torch.distributed.elastic.multiprocessing.api: [WARNING] Sending process 5303 closing signal SIGHUP
Traceback (most recent call last):
  File "/root/miniconda3/envs/MDT/lib/python3.8/runpy.py", line 194, in _run_module_as_main
    return _run_code(code, main_globals, None,
  File "/root/miniconda3/envs/MDT/lib/python3.8/runpy.py", line 87, in _run_code
    exec(code, run_globals)
  File "/root/miniconda3/envs/MDT/lib/python3.8/site-packages/torch/distributed/launch.py", line 196, in <module>
    main()
  File "/root/miniconda3/envs/MDT/lib/python3.8/site-packages/torch/distributed/launch.py", line 192, in main
    launch(args)
  File "/root/miniconda3/envs/MDT/lib/python3.8/site-packages/torch/distributed/launch.py", line 177, in launch
    run(args)
  File "/root/miniconda3/envs/MDT/lib/python3.8/site-packages/torch/distributed/run.py", line 797, in run
    elastic_launch(
  File "/root/miniconda3/envs/MDT/lib/python3.8/site-packages/torch/distributed/launcher/api.py", line 134, in __call__
    return launch_agent(self._config, self._entrypoint, list(args))
  File "/root/miniconda3/envs/MDT/lib/python3.8/site-packages/torch/distributed/launcher/api.py", line 255, in launch_agent
    result = agent.run()
  File "/root/miniconda3/envs/MDT/lib/python3.8/site-packages/torch/distributed/elastic/metrics/api.py", line 124, in wrapper
    result = f(*args, **kwargs)
  File "/root/miniconda3/envs/MDT/lib/python3.8/site-packages/torch/distributed/elastic/agent/server/api.py", line 736, in run
    result = self._invoke_run(role)
  File "/root/miniconda3/envs/MDT/lib/python3.8/site-packages/torch/distributed/elastic/agent/server/api.py", line 877, in _invoke_run
    time.sleep(monitor_interval)
  File "/root/miniconda3/envs/MDT/lib/python3.8/site-packages/torch/distributed/elastic/multiprocessing/api.py", line 62, in _terminate_process_handler
    raise SignalException(f"Process {os.getpid()} got signal: {sigval}", sigval=sigval)
torch.distributed.elastic.multiprocessing.api.SignalException: Process 5262 got signal: 1

在网上找了下解决办法,发现使用tmux替代nohup是一个可行的方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/803237.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JVM_垃圾收集器

GC垃圾收集器 文章目录 GC垃圾收集器GC垃圾回收算法和垃圾收集器关系GC算法主要有以下几种四种主要的垃圾收集器SerialParallelCMSG1垃圾收集器总结查看默认垃圾收集器 默认垃圾收集器有哪些各垃圾收集器的使用范围部分参数说明 新生代下的垃圾收集器并行GC(ParNew)并行回收GC&…

【C++航海王:追寻罗杰的编程之路】探寻实用的调试技巧

目录 1 -> 什么是bug&#xff1f; 2 -> 调试是什么&#xff1f;有多重要&#xff1f; 2.1 -> 调试是什么&#xff1f; 2.2 -> 调试的基本步骤 2.3 -> Debug和Release的介绍 3 -> Windows环境调试介绍 3.1 -> 调试环境的准备 3.2 -> 学会快捷键…

:-1: error: Project ERROR: msvc-version.conf loaded but QMAKE_MSC_VER isn‘t set

qt报错 错误1 : error: Project ERROR: msvc-version.conf loaded but QMAKE_MSC_VER isnt set 错误1 : error: Project ERROR: msvc-version.conf loaded but QMAKE_MSC_VER isn’t set bug的现象:qtcreator无法通过点击pro文件来打开项目 方法:参考 根据上面的参考,我么找到…

【React】React hooks 清除定时器并验证效果

React hooks 清除定时器并验证效果 目录结构如下useTime hookClock.tsx使用useTime hookApp.tsx显示Clock组件显示时间&#xff08;开启定时器&#xff09;隐藏时间&#xff08;清除定时器&#xff09; 总结参考 目录结构如下 useTime hook // src/hooks/common.ts import { u…

如何批量获取商品详情数据(淘宝1688京东商品采集示例)

批量获取商品详情数据&#xff0c;尤其是在淘宝、1688和京东这样的电商平台上&#xff0c;通常涉及到网络爬虫技术。然而&#xff0c;需要注意的是&#xff0c;这些平台都有自己的反爬虫机制&#xff0c;直接爬取可能会违反其使用条款&#xff0c;甚至可能触犯法律。因此&#…

三角测量法恢复深度

参考&#xff1a;单目vo中的深度确定方法--三角测量_单目相机三角测量-CSDN博客 方法一&#xff1a;直接法 由于我们已经通过本质矩阵分解或者单应矩阵分解获得了R与t&#xff0c;此时想求的是两个特征点的深度 bool depthFromTriangulation(const SE3& T_search_ref,co…

电脑开机提示“no bootable device”,无法进入系统

当您的Windows 10电脑开机时提示“no bootable device”,这意味着计算机无法找到一个可以启动操作系统的设备。这个问题通常与硬件连接、BIOS设置、硬盘问题、引导扇区故障或系统文件损坏等有关。以下是一系列详细的解决步骤: 检查硬件连接:关闭电脑,拔掉电源线,打开机箱检…

如何创建Windows下google Chrome便携版?

创建google Chrome便携版教程 准备工作&#xff1a; 1&#xff0c;下载GoogleChromePortable启动器 2&#xff0c;下载谷歌浏览器 3&#xff0c;下载7-ZIP 解压提取器 用7zip解压GoogleChromePortable&#xff0c;得到GoogleChromePortable.exe启动器 解压谷歌浏览器 用7…

Java入门基础day29

day29 内部类 分类 非静态成员内部类 静态成员内部类 局部内部类 匿名内部类 概念 在一个类的内部&#xff0c;再定义一个完整的类 特点&#xff1a; 编译之后可以生成一个独立的字节码class文件 内部类可以直接访问外部类的私有成员&#xff0c;而不会破坏其封装性 可以为外…

Flutter之TabBar篇

总结了一下项目中用到的几种TabBar&#xff0c;针对不同的样式&#xff0c;有采用系统提供的&#xff0c;也有三方插件提供的&#xff0c;也有自定义的&#xff0c;效果如下&#xff08;后续如果遇到新的样式&#xff0c;会不间断地记录更新&#xff0c;避免重复造轮子…&#…

性能分析-数据库与磁盘知识

数据库 数据库&#xff0c;其实是数据库管理系统dbms。 数据库管理系统&#xff0c; 常见&#xff1a; 关系型数据库&#xff1a; mysql、pg、 库的表&#xff0c;表与表之间有关联关系&#xff1b; 表二维表统一标准的SQL&#xff08;不局限于CRUD&#xff09;非关系型数据…

ssm034学生请假系统+jsp

学生请假系统设计与实现 摘 要 现代经济快节奏发展以及不断完善升级的信息化技术&#xff0c;让传统数据信息的管理升级为软件存储&#xff0c;归纳&#xff0c;集中处理数据信息的管理方式。本学生请假系统就是在这样的大环境下诞生&#xff0c;其可以帮助管理者在短时间内处…

C++11 新特性:std::array

std::array是 C11 中引入的容器类型&#xff0c;它封装了固定大小的数组&#xff0c;提供了类似于 STL 容器的接口&#xff0c;同时保持了 C 风格数组的性能特性。 与普通数组相比&#xff0c;std::array更安全、更易于使用&#xff0c;并且支持迭代器。以下是std::array提供的…

-webkit-input-placeholder的意思

-webkit-input-placeholder是一个CSS伪类选择器&#xff0c;用于设置表单输入字段的占位文本样式。-webkit-input-placeholder是Webkit浏览器私有的前缀&#xff0c;用于适用于Webkit内核的浏览器&#xff08;如Chrome和Safari&#xff09;。 使用-webkit-input-placeholder&a…

鸿蒙HarmonyOS开发实例:【简单时钟】

简单时钟 介绍 本示例通过使用[ohos.display]接口以及Canvas组件来实现一个简单的时钟应用。 效果预览 主页 使用说明 1.界面通过setInterval实现周期性实时刷新时间&#xff0c;使用Canvas绘制时钟&#xff0c;指针旋转角度通过计算得出。 例如&#xff1a;"2 * M…

Microsoft Visio 参与者 [actor] - 人的形状图标

Microsoft Visio 参与者 [actor] - 人的形状图标 1. 更多形状 -> 搜索形状2. 参与者References 1. 更多形状 -> 搜索形状 2. 参与者 References [1] Yongqiang Cheng, https://yongqiang.blog.csdn.net/

网络入门基础:从概念到实践

导言 网络已经成为了我们日常生活和工作中不可或缺的一部分&#xff0c;无论是用于沟通、学习、娱乐还是商务交易&#xff0c;网络都扮演着至关重要的角色。本文将介绍网络的基础知识&#xff0c;从概念到实践&#xff0c;帮助初学者了解网络的基本原理和构成&#xff0c;以便…

【简单讲解下如何Java中文乱码浅析及解决方案】

&#x1f308;个人主页: 程序员不想敲代码啊 &#x1f3c6;CSDN优质创作者&#xff0c;CSDN实力新星&#xff0c;CSDN博客专家 &#x1f44d;点赞⭐评论⭐收藏 &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出指正&#xff0c;让我们共…

力扣经典150题(1)

文章目录 6.Z字形变换82.删除排序链表中的重复元素||61.旋转链表100.相同的树 6.Z字形变换 将一个给定字符串 s 根据给定的行数 numRows &#xff0c;以从上往下、从左到右进行 Z 字形排列。 比如输入字符串为 “PAYPALISHIRING” 行数为 3 时&#xff0c;排列如下&#xff1…

Spring循环依赖

Java开发常见面试题详解&#xff08;LockSupport&#xff0c;AQS&#xff0c;Spring循环依赖&#xff0c;Redis&#xff09;_java 常见面试题详解(locksupport-CSDN博客 循环依赖现象在spring容器中注入依赖的对象&#xff0c;有2种情况 构造器方式注入依赖&#xff08;不可行…