在服务器上同时训练多个深度学习模型【nohup、后台、重定向】

在服务器上同时训练多个深度学习模型

在服务器上跑深度学习或其他程序时,如果程序没有提供命令行参数设置,我们常常需要多次修改代码后重新部署。本文将介绍如何通过命令行工具和编辑器查看代码特定行的方法,并展示如何同时训练多个基于不同ResNet层数的框架。

一、查看代码特定行的方法

当我们需要查看 train.py 文件的第 191 行,可以使用以下几种方法:

方法一:使用命令行工具

  1. sed 命令
    sed -n '191p' train.py
    
  2. awk 命令
    awk 'NR==191' train.py
    
  3. headtail 命令
    head -n 191 train.py | tail -n 1
    

方法二:使用文本编辑器

  1. nano 编辑器
    打开 train.py 文件并跳转到第 191 行:

    nano +191 train.py
    
  2. vim 编辑器
    打开 train.py 文件并跳转到第 191 行:

    vim +191 train.py
    
  3. less 命令
    使用 less 查看文件内容并跳转到第 191 行:

    less train.py
    

    less 中输入 191g,然后按 Enter 键跳转到第 191 行。
    请添加图片描述

方法三:使用 IDE

  1. Visual Studio Code
    在终端中打开 train.py 文件:

    code -g train.py:191
    
  2. PyCharm
    在 PyCharm 中打开 train.py 文件并跳转到第 191 行:

    1. 打开 train.py 文件。
    2. Ctrl + L(Windows/Linux)或 Cmd + L(Mac),然后输入 191 跳转到第 191 行。

二、将训练日志保存到不同文件

为了在服务器上同时训练多个基于不同ResNet层数的框架,我们可以使用 nohup 命令将训练任务放在后台运行,并将输出重定向到不同的日志文件中。

示例命令

nohup python train.py xxxx参数 > resnet18_nohup.out &

通过上述命令,我们可以同时运行多个训练任务,并将每个任务的输出保存到不同的日志文件中。

三、实时查看日志文件

方法一:tail -f

这是最常用的方法,可以实时查看文件的更新内容:

tail -f resnet18_nohup.out

方法二:less +F

使用 less 以更灵活的方式查看文件内容并保持更新:

less +F resnet18_nohup.out

less 中,你可以按 Ctrl+C 停止实时查看,进入正常的 less 查看模式。按 Shift+F 可以再次进入实时查看模式。
请添加图片描述

按下ctrl+C后,如下图所示
请添加图片描述

通过:q退出该模式

四、终止后台运行的程序

查看后台作业

  jobs -l

请添加图片描述

这将列出所有后台作业及其对应的 PID,它们的排列顺序通常是根据启动的顺序来显示的。每行包含以下信息:

  1. 作业编号(方括号内的数字):这是由 shell 分配给每个后台作业的唯一编号。
  2. 进程ID (PID):这是由操作系统分配给每个运行进程的唯一标识符。
  3. 作业状态:表示作业当前的状态,例如 “Running”。
  4. 命令:启动作业的完整命令。

解释每一列的内容:

  • [1] 是作业编号,3136874 是这个作业的进程 ID,Running 表示这个作业正在运行,后面是启动这个作业的完整命令及其输出重定向。
  • [2] 是第二个作业,以此类推。

作业编号的符号含义:

  • +- 是作业控制符,用来标记前台作业控制的优先级:
    • + 表示当前的作业。
    • - 表示上一个作业。
    • 没有符号表示较早的作业。

终止后台作业
可以通过 kill 命令终止指定的作业。使用作业编号或者 PID 都可以。

  • 通过作业编号终止(使用 % 前缀):

    kill %1  # 终止作业编号为1的作业
    kill %2  # 终止作业编号为2的作业
    kill %3  # 终止作业编号为3的作业
    kill %4  # 终止作业编号为4的作业
    
  • 通过 PID 终止:

    kill 3136874  # 终止进程ID为3136874的作业
    kill 3138054  # 终止进程ID为3138054的作业
    kill 3138988  # 终止进程ID为3138988的作业
    kill 3149585  # 终止进程ID为3149585的作业
    

如有需要,可以使用 kill -9 强制终止:

kill -9 %1  # 强制终止作业编号为1的作业
kill -9 3136874  # 强制终止进程ID为3136874的作业

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/50226.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

.NET程序集编辑器/调试器 dnSpy 使用介绍

原文链接:https://www.cnblogs.com/zhaotianff/p/17352882.html dnSpy dnSpy是一个.NET程序集调试器和编辑器。它可以用它来编辑和调试程序集,即使在没有源码的情况下。 主要功能: 调试.NET和Unity程序集 编辑.NET和Unity程序集 项目地…

【解决方案】华普微汽车智能钥匙解决方案

一、方案概述 1.什么是被动式无钥匙进入 "被动式无钥匙进入"(Passive Keyless Entry)是一种用于车辆、建筑物或其他设施的访问控制系统。它利用无线射频技术自动判断用户是否接近,并进行身份识别以执行开锁或落锁动作&#xff0c…

【23】Android高级知识之Window(四) - ThreadedRenderer

一、概述 在上一篇文章中已经讲了setView整个流程中,最开始的addToDisplay和WMS跨进程通信的整个过程做了什么。继文章Android基础知识之Window(二),这算是另外一个分支了,接着讲分析在performTraversals的三个操作中,最后触发pe…

基于Golang+Vue3快速搭建的博客系统

WANLI 博客系统 项目介绍 基于vue3和gin框架开发的前后端分离个人博客系统,包含md格式的文本编辑展示,点赞评论收藏,新闻热点,匿名聊天室,文章搜索等功能。 项目在线访问:http://bloggo.chat/ 或 http:/…

【Web】LitCTF 2024 题解(全)

目录 浏览器也能套娃? 一个....池子? 高亮主题(划掉)背景查看器 百万美元的诱惑 SAS - Serializing Authentication exx 浏览器也能套娃? 随便试一试,一眼ssrf file:///flag直接读本地文件 一个....池子? {…

OAK相机支持的图像传感器有哪些?

相机支持的传感器 在 RVC2 上,固件必须具有传感器配置才能支持给定的相机传感器。目前,我们支持下面列出的相机传感器的开箱即用(固件中)传感器配置。 名称 分辨率 传感器类型 尺寸 最大 帧率 IMX378 40563040 彩色 1/2.…

从0到1:理发店预约剪发小程序开发笔记(上)

背景 理发师可以在小程序上设置自己的可预约时间,价格,自我介绍,顾客可以根据理发师的日程安排选择合适的时间进行预约和支付。这样可以提高预约的效率,减少沟通成本,方便双方的安排。 功能规划 首页展示&#xff1…

基于多种机器学习的豆瓣电影评分预测与多维度可视化【可加系统】

有需要本项目的代码或文档以及全部资源,或者部署调试可以私信博主 在本研究中,我们采用Python编程语言,利用爬虫技术实时获取豆瓣电影最新数据。通过分析豆瓣网站的结构,我们设计了一套有效的策略来爬取电影相关的JSON格式数据。…

第1章 初识 C 语言

目录 1.1 C 语言的起源 1.2 选择 C 语言的理由 1.2.1 设计特性 1.2.2 高效性 1.2.3 可移植性 1.2.4 强大而灵活 1.2.5 面向程序员 1.2.6 缺点 1.3 C 语言的应用范围 1.4 计算机能做什么 1.5 高级计算机语言和编译器 1.6 语言标准 1.6.1 第 1 个 ANSI/ISO C 标准 …

手写模拟Spring底层原理-简易实现版

通过手写模拟Spring 了解Spring的底层源码启动过程了解BeanDefinition、BeanPostProcessor的概念了解Spring解析配置类等底层源码工作流程了解依赖注入,Aware回调等底层源码工作流程了解Spring AOP的底层源码工作流程 这里实现一个简化版的 Spring 框架的核心功能&a…

GraphRAG深入解析

GraphRAG深入解析 GraphRAG 深入解析概述索引查询 索引过程深入解析步骤 1:处理文本块步骤 2:图提取步骤 3:图增强步骤 4:社区总结步骤 5:文件处理步骤 6:网络可视化 查询过程深入解析本地搜索问题生成全局…

苹果安卓分发的秘密:如何选择正确的渠道(苹果安卓分发)

苹果安卓分发的重要性 随着移动互联网的普及,移动应用程序的开发和分发变得越来越重要。苹果安卓分发是移动应用程序开发者的首要任务之一,因为它直接关系到应用程序的推广和收益。 苹果安卓分发并不是一件简单的事情。开发者需要选择正确的渠道&#…

Pytorch使用教学5-视图view与reshape的区别

有同学后台留言问为什么view有时可对张量进行形变操作,有时就会报错?另外它和reshape功能好像一致,有什么区别呢?本文就带你了解PyTorch中视图的概念。 在PyTorch中对张量进行形变操作时,很多同学也会使用view方法&am…

监测Nginx访问日志状态码,并做相应动作

文章目录 引言I 监测 Nginx 访问日志情况,并做相应动作1.1 前提准备1.2 访问日志 502 情况,重启 bttomcat9服务1.3 其他案例:访问日志 502 情况,重启 php-fpm 服务II 将Shell 脚本check499.sh包装成systemd服务2.1 创建systemd服务2.2 配置service2.3 开机启动2.4 其他常用…

华为ICT大赛之ensp软件BGP原理与配置

BGP基础 1.用于不同自治系统AS(autonomous system)之间动态交换路由信息; BGP取代EGP(exterior gateway protocol)外部网关协议,BGP在其发布路由信息基础上可以进行路由优选,高效处理路由信息; AS:同一组织管理下,使…

RK3568平台(显示篇)显示系统基本概念

一.显示系统概述 linux内核中包含两类图形显示设备驱动框架: FB设备:Framebuffer图形显示框架;DRM:直接渲染管理器(Direct Rendering Manager),是linux目前主流的图形显示框架; 在实际场景中…

打通“链上数据脉络” 欧科云链数字生态建设成果凸显

7月25日,据Coindesk报道,全球领先的区块链技术和服务提供商欧科云链宣布旗下OKLink浏览器与Polygon Labs正式达成合作,成为AggLayer首个区块链搜索引擎及Web3数据分析平台,将为开发者提供精简易用的链上数据访问和开发工具&#x…

MATLAB学习教程(一)

目录 1.常见函数基本运算 2.二维绘制: plot(​..) 3.三维绘制: plot3(​..) / mesh(​..) 4.绘图美化 标题及标签 绘图命令:color 绘图命令:Line 5.代码 1.常见函数基本运算 方根函数sqrt() 自然指数函数exp() 以10为底的对数函…

巴斯勒相机(Basler) ACE2 dart 系列说明和软件

巴斯勒相机(Basler) ACE2 dart 系列说明和软件

了解高防 IP

一、高防 IP 的基本概念 高防 IP 是指拥有强大防御能力的 IP 地址。它主要通过将攻击流量引流到高防机房进行清洗和过滤,再将正常的流量回注到源站,从而保障源站服务器的稳定运行。 二、高防 IP 的工作原理 当用户的服务器遭受 DDoS 攻击时&#xff0…