Linux nohup 命令
应用场景
使用 PyCharm 连接服务器跑模型虽然很方便,但是如果遇到网络不佳、PyCharm出BUG、急需转移阵地等情况就只能中断训练,前面的全白跑了。
因此可以尝试直接在服务器上使用命令跑模型,这个命令好说,笨一点的方法直接抄用 PyCharm 运行时输出的命令嘛:
但是这样依然有问题,如果在运行命令时,如果退出终端则依然会中断命令,问题依然没有解决。
最后可以尝试 nohup 命令解决上述问题。
nohup 命令介绍
nohup 英文全称 no hang up,即在系统后台不挂断地运行命令,因此退出终端不会影响程序的运行。
-
语法格式
nohup Command [ Arg … ] [ & ]
-
参数说明:
- Command:要执行的命令。
- Arg:一些参数,可以指定输出文件。
- &:让命令在后台执行,终端退出后命令仍旧执行。
nohup 命令,在默认情况下(非重定向时),会输出一个名叫 nohup.out 的文件到当前目录下,如果当前目录的 nohup.out 文件不可写,输出重定向到 $HOME/nohup.out 文件中。
实例:使用 nohup 命令在后台跑模型
-
首先应该保证你的训练代码不需要输入,然后执行以下命令
nohup /XXX/python3 -u /XXX/train.py > test.log 2>&1 &
命令注解:
- 开头的
nohup
保证命令不挂断,最后的&
保证终端退出后命令仍旧执行 /XXX/python3 -u /XXX/train.py
- 即为使用
/XXX/python3
(某个选定的解释器) 运行/XXX/train.py
(训练代码) - 中间的
-u
表示关闭缓存,保证把输出写入文件时无延迟
- 即为使用
> test.log
将输出重定向到 test.log 文件2>&1
将错误输出重定向到标准输出,也就是错误信息也会写到标准输出的位置- 0 表示 stdin 标准输入
- 1 表示 stdout 标准输出
- 2 表示stderr标准错误信息输出
- 开头的
-
注意事项:
-
如果数据集加载路径为相对路径,则需要 cd 到代码所在的文件夹再执行命令
-
否则会报地址错:
-
启动起来之后看一眼显卡跑起来了就对咯
-
-
> test.log
和2>&1
是可选的,写与不写的区别在于少一条提示少按一次回车: -
注意记住提示的进程号,
-
如果记不住,可以使用
jobs -l
命令查看这个进程的进程号, -
当然如果退出终端重新打开的话这个进程会变成僵尸进程,需要用
ps -aux
命令查看所有进程找找。
-
-
跑起来之和可以使用
tail -f test.log
命令实时查看输出(Ctrl+C 退出),瞅瞅有没有问题: -
可以使用
kill -9 PID
杀掉这个进程
-