nvidia-smi命令详解

参考:
https://zhuanlan.zhihu.com/p/664550672

NVIDAI-SMI Version 版本号;
Driver Version 驱动版本号;
CUDA Version 版本号;
GPU 型号及序号;
风扇;
温度;
Perf 性能状态;
Persistence-M 持续模式状态;
Pwr: Usage/Cap 显卡功率;
Bus-Id 总线;
Disp.A:Display Active GPU 初始化状态;
Memory-Usage 显存使用率;
Volatile GPU-Util GPU 使用率;
ECC 错误检查和纠错模式;
Compute M 计算模式;
MIG M MIG 功能;

每个指标详细解释一下,

“GPU 型号及序号” 应该很好理解,比如上图中我这里就是只有一块卡,所以序号是 “0”,然后型号是英伟达 A10;“Fan” 风扇表示你的 GPU 是主动散热还是被动散热的,比如像 RTX 那些消费级显卡一般都是主动散热的,从物理形态上来看就是带风扇的,我这里的 A10 是推理计算卡,是被动散热的,所以风扇一直其实都会是 0% (相当于 N/A);
“Temp” 温度,这个很好理解就是目前显卡的温度,我这啥都没干就 61 ℃,还是挺高的,说明这台机器的散热有点问题。“温度” 这个指标是需要在执行程序的时候经常关注的,特别是对于被动散热的卡,要是机器的散热做不好,就容易使卡达到降频保护的温度,从而卡的性能会下降,跑出来的性能就不准确了;
“Perf” 表示显卡的性能状态,有 p0 ~ p12,性能状态从高到底,也就是 p0 表示性能最大,p12 表示性能最小,在 linux 下可以使用 nvidia-settings 工具对这个参数进行配置;
“Persistence-M” 表示持续模式状态,这个参数默认是关闭的,若打开能够让 GPU 更加快速地响应任务,但相应待机功耗也会增加,我这里是默认的 Off 关闭状态;
“Pwr: Usage/Cap” 表示显卡的功耗,可以看到我这里 A10 的显卡功耗是 150W,而前面的 65W 是根据执行的任务动态变化的,是卡上所有执行进程所占显存的和;
“Bus-Id” 表示 GPU 的总线地址;
“Disp.A” 全称是 “Display Active” 表示显卡的显示功能是否初始化,这其实也比较好理解。如果当前的 GPU 正驱动一个活动的显示器,那么这个参数就会是 On,反之为 Off。可以看到我这里的是推理计算卡,是不带显示功能的,所以这个参数就是 Off 了;
“Memory-Usage” 表示显存占用情况,可以看到我这里的显存是 23028 MiB,前面的 9 MiB 也是随着执行的程序动态变化的,但是不能超过 23028 MiB,不然就会报 CUDA 显存不足的错误;
“Volatile GPU-UTil” 表示 GPU 的使用率。GPU 使用率 和 显存使用率 是两个比较重要的指标,一般来说,GPU 使用率高的时候显存使用率也会比较高,但反过来,显存使用率高的时候 GPU 使用率并不一定会高。比如在大量数据传输的时候,显存是被占用的,但是 GPU 本身还没开始计算,这个时候的显存占用是高的,但 GPU 使用率并不一定高,这种情况会经常出现在访存密集型的计算中;
“ECC” 全称为 Error Checking and Correcting,表示是否开启错误检查和纠错技术,“0” 代表关闭,“1” 代表开启。ECC 开启后功能可以用于保护 GPU 硬件,帮助其免受硬件故障和问题的影响。因为它还可以检查内存模块中的错误,并帮助 GPU 从错误中恢复。此外,ECC 还有助于降低电力消耗,因为它只需要较少的功耗就可以处理大量的内存纠错;
“Compute M” 表示计算模式,NVIDIA GPU 有 Default、Exclusive Process、Exclusive Thread、Prohibited 四种计算模式,一般就用默认的 Default 就可以了。在 Default 模式下,多个进程可以同时共享不同的 GPU;
最后一个是 “MIG M”,这是安培架构新提出的功能,可以用于创建 MIG 实例,在用户层实现 GPU 的物理隔离。一看我这 “MIG M” 是 “N/A”,这说明在 A10 上是不支持这个功能的呀。回头一查,发现目前 MIG 仅在 A100 和 H100 上支持,另外还有 “阉割版” 的 A800 和 H800 也是支持 MIG 功能的;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/30125.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

达梦数据库的分区表

达梦数据库的分区表 达梦数据库(DM Database)提供了灵活和强大的分区表功能,以更高效地管理和操作大规模数据集。分区表通过将数据分割成更小、更易管理的部分,可以显著提高查询性能、缩短维护时间、并提高系统的总体可扩展性。 …

统计信号处理基础 习题解答10-15

题目 对随机变量的随机性的一个度量是它的熵(entropy),熵定义为: 如果,求这个熵,并说明它与PDF集中度的关系。观察到数据后,后验PDF的熵可以确定为: 且它应该比小。因此&#xff0c…

《无与伦比》Centos7 开放端口

例如我想开放80端口,那么命令就是: firewall-cmd --zonepublic --add-port80/tcp --permanent firewall-cmd --reload centos 关闭防火墙 systemctl stop firewalld.service 查看防火墙状态 firewall-cmd --state centOS7.4 关闭防火墙 systemctl stop f…

前端常用6种数据加密方式的使用详解

在前端开发中,数据加密是一个重要的安全措施,可以保护用户数据不被轻易窃取或篡改。以下是六种常用的前端数据加密方式及其示例代码和详细讲解: 1. Base64 编码 Base64 是一种基于64个可打印字符来表示二进制数据的表示方法。它不是一种加密…

Python3的requests库,超时参数timeout设置和异常捕获

在Python的requests库中,get()和post()方法都接受一个名为timeout的参数,该参数用于设置请求的超时时间。如果你没有为这些方法设置timeout参数,那么默认情况下它们可能会等待很长时间,直到服务器响应或连接失败。 在Python的req…

Redis 高可用 sentinel

简介 Sentinel提供了一种高可用方案来抵抗节点故障,当故障发生时Redis集群可以自动进行主从切换,程序可以不用重启。 Redis Sentinel集群可以看成是一个Zookeeper集群,他是Redis集群高可用的心脏,一般由3-5个节点组成&#xff0…

人体接近传感器,ATM微波传感器,人体存在传感器 微波探测器YTMW8631

人体接近传感器,ATM微波传感器,人体存在传感器 微波探测器YTMW8631 史新华 批发Atm微波探测器,Atm传感器人体接近传感器,Dvr录像机专用微波感应器,Atm机录像系统专用感应器 微波传感器的多领域应用 微波探测器是利用微波的多普勒效应来探测运动物体&…

Linux系统编程——进程信号

目录 一,信号预备 1.1 生活中的信号 1.2 技术应用中的信号 1.3 signal函数捕捉信号 1.3 信号的发送与记录 1.4 信号的常见处理方式 二,信号的产生 2.1 核心转储 2.1.1 环境配置 2.1.2 利用core文件进行调试 2.1.3 core dump标志 2.2 通过系统…

程序猿大战Python——文件操作、异常、模块——导入模块

导入模块的方式 目标:了解导入模块的方式有哪些? 模块指的是:以.py结尾的Python文件。 注意:模块名属于标识符。 在模块中,能定义函数、变量和类等,也能包含其他一些可执行的代码,比如print(x…

【ClickHouse】简介入门、Clickhouse的特点、ClickHouse 的安装(一)

简介 ClickHouse入门 ClickHouse是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),使用C语言编写,主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告。 ClickHouse的特…

【质量】软件系统数据质量管理过程(Word原件)

软件系统数据做数据质量管理至关重要,原因有四: 首先,数据质量直接影响软件系统的性能和用户体验。高质量的数据能够确保系统稳定运行,提供准确、可靠的信息支持,从而增强用户的满意度和信任度。 其次,数据…

集团门户网站的设计

管理员账户功能包括:系统首页,个人中心,管理员管理,论坛管理,集团文化管理,基础数据管理,公告通知管理 前台账户功能包括:系统首页,个人中心,论坛&#xff0…

仓库管理系统的设计

管理员账户功能包括:系统首页,个人中心,管理员管理,公告管理,物资管理,基础数据管理,用户管理 用户账户功能包括:系统首页,个人中心,公告管理,物…

Stable Diffusion AI绘画助力建筑设计艺术创新——城市建筑设计大模型分享

大家好,我是向阳 今天我将针对建筑设计方面的AI大模型进行简单介绍,我们将通过富有想象力的关键词或结合Stable Diffusion 的ControlNet 给原本只有黑白线条的线稿变成彩色的效果图,可能你只需要短短几分钟就可以让黑白线稿变成几种甚至十几种…

【操作系统】操作系统实验03-页面置换算法

题目要求: 先读懂实验文档中的两个页面置换算法,参考文档中程序,实现以下要求: 假设某个进程P有6个页面,进程访问页的顺序自拟(不少于20个),在内存中分配给该进程4个页面&#xff…

web安全渗透测试十大常规项(一):web渗透测试之XML和XXE外部实体注入

#详细点: XML被设计为传输和存储数据,XML文档结构包括XML声明、DTD文档类型定义(可选)、文档元素,其焦点是数据的内容,其把数据从HTML分离,是独立于软件和硬件的信息传输工具。等同于JSON传输。XXE漏洞XML External Entity Injection,即xml外部实体注入漏洞,XXE漏洞发…

使用react-markdown 自定义组件在 Next.js 中进行渲染

在这篇文章中,我们将讨论如何在Next.js项目中使用react-markdown库来渲染Markdown内容,并自定义组件以扩展Markdown的功能。我们将使用TypeScript来确保代码的类型安全性。 Markdown是一种轻量级标记语言,常用于编写文档、博客等。react-mar…

【JavaScript脚本宇宙】用这些令人惊叹的库,让你的音频动起来!

创造惊人音效:六大音频处理库实操指南 前言 随着数字音频技术的发展,越来越多的库和工具被开发出来,用于处理音频数据。这些库可以用于各种应用场景,如音频可视化、声音合成、音频分析等。本文将介绍几个常用的音频处理库&#…

Java实现一个解析CURL脚本小工具

该工具可以将CURL脚本中的Header解析为KV Map结构;获取URL路径、请求类型;解析URL参数列表;解析Body请求体:Form表单、Raw Body、KV Body、XML/JSON/TEXT结构体等。 使用示例 获取一个http curl脚本: curl --locatio…

【YOLOv8改进[注意力]】使用CascadedGroupAttention(2023)注意力改进c2f + 含全部代码和详细修改方式 + 手撕结构图

本文将进行在YOLOv8中使用CascadedGroupAttention注意力改进c2f 的实践,助力YOLOv8目标检测效果的实践,文中含全部代码、详细修改方式以及手撕结构图。助您轻松理解改进的方法。 改进前和改进后的参数对比: 目录 一 CascadedGroupAttention 二 使用CascadedGroupAttention…