昇腾Ascend之npu-smi工具的简单使用

一、参考资料

npu-smi工具

二、npu-smi工具的常用操作

信息查询(info)

npu-smi info -t <type> -i <npu_id>

查询所有芯片的AI CPU、control CPU和data CPU数量

参数描述
-ttype: board, flash, memory, usages, sensors, temp, power, volt,
common, health, product, ecc, ip, sys-time, i2c_check,
ecc-enable, p2p-enable, ssh-enable, license, customized-info,
device-share, nve-level, aicpu-config, pcie-err, mcu-monitor,
err-count, boot-area, info-vnpu, key-manage, first-power-on-date,
tls-csr-get, tls-cert, tls-cert-period, proc-mem.
-iNPU设备id。通过 npu-smi info -l 命令查出的NPU ID即为设备id。

查询基本信息

# 每秒刷新一次
watch -n 1 npu-smi info
Every 1.0s: npu-smi info                                                                     davinci-mini: Sun Apr  7 06:37:32 2024+--------------------------------------------------------------------------------------------+
| npu-smi 21.0.4                       Version: 21.0.4                                       |
+-------------------+-----------------+------------------------------------------------------+
| NPU     Name      | Health          | Power(W)     Temp(C)           Hugepages-Usage(page) |
| Chip    Device    | Bus-Id          | AICore(%)    Memory-Usage(MB)                        |
+===================+=================+======================================================+
| 0       310       | OK              | 12.8         46                0    / 970            |
| 0       0         | NA              | 0            1154 / 7767                             |
+===================+=================+======================================================+
字段描述说明
npu-sminpu-smi 工具版本
Version驱动版本
NPUNPU 设备id
Name芯片名称,目前支持310B1和310B4两种芯片名称。
310B1:表示芯片算力规格为20T。
310B4:表示芯片算力规格为8T。
Health芯片的健康状态,有如下五种状态:
OK:正常
Warning:一般告警
Alarm:重要告警
Critical:紧急告警
UNKNOWN:该设备不存在或未启动
Power(W)芯片功率
Temp©芯片温度(单位°C)
Hugepages-Usage(page)大页占比(单位page),每一个page的大小是2048KB。
Chip芯片id
Device芯片编号
Bus-IdBUS id
AICore(%)AICore占用率
Memory-Usage(MB)内存占比

查询所有芯片监测数据

# 查询所有设备上所有芯片的监测数据
npu-smi info watch  # 查询指定设备上所有芯片的监测数据
npu-smi info watch -i <npu_id> 
HwHiAiUser@davinci-mini:~$ npu-smi info watch
NpuID(Idx)  ChipId(Idx) Pwr(W)      Temp(C)     AI Core(%)  AI Cpu(%)   Ctrl Cpu(%) Memory(%)   Memory BW(%)
0           0           12.8        46          0           0           0           14          0
0           0           12.8        46          0           0           3           14          0
0           0           12.8        46          0           0           0           14          0
0           0           12.8        45          0           0           0           14          0
0           0           12.8        46          0           0           0           14          0
0           0           12.8        46          0           0           0           14          0
0           0           12.8        46          0           0           0           14          0
0           0           12.8        46          0           0           0           14          0

参数解释

字段描述说明
NpuID(Idx)设备id
ChipId(Idx)芯片id
Pwr(W)功率(单位W)
Temp©温度(单位°C)
AI Core(%)AI Core占用率
AI Cpu(%)AI Cpu占用率
Ctrl Cpu(%)Ctrl Cpu占用率
Memory(%)内存占用率
Memory BW(%)内存带宽占用率

查询所有NPU设备

npu-smi info -l
HwHiAiUser@davinci-mini:~$ npu-smi info -lCard Count                     : 1NPU ID                         : 0Product Name                   : NASerial Number                  : 032WLS10K4000136Chip Count                     : 1
字段说明描述
Card CountNPU卡个数
NPU IDNPU设备id
Product Name产品名称
Serial Number产品序列号
Chip Count芯片个数

查询所有芯片统计信息

npu-smi info -t usages -i <npu_id>
HwHiAiUser@davinci-mini:~$ npu-smi info -t usages -i 0NPU ID                         : 0Chip Count                     : 1Chip ID                        : 0Memory Capacity(MB)            : 7767Memory Usage Rate(%)           : 14Hugepages Total(page)          : 970Hugepages Usage Rate(%)        : 0Aicore Usage Rate(%)           : 0Aicpu Usage Rate(%)            : 0Ctrlcpu Usage Rate(%)          : 1Memory Bandwidth Usage Rate(%) : 0
字段描述说明
NPU ID设备id
Chip ID芯片id
Chip Count芯片个数
Memory Capacity(MB)内存容量(单位MB)
Memory Usage Rate(%)内存占用率
Hugepages Total(page)大页容量(单位page),每一个page的大小是2048KB
Hugepages Usage Rate(%)大页占用率
Aicore Usage Rate(%)Aicore占用率
Aicpu Usage Rate(%)Aicpu占用率
Ctrlcpu Usage Rate(%)Ctrlcpu占用率
Memory Bandwidth Usage Rate(%)内存带宽占用率

查询指定芯片信息

npu-smi info -t board -i <npu_id> -c <chip_id>
HwHiAiUser@davinci-mini:~$ npu-smi info -t  board -i 0 -c 0NPU ID                         : 0Chip ID                        : 0Chip Type                      : AscendChip Name                      : 310Chip Version                   : V100Board ID                       : 0x3ecPCB ID                         : NABOM ID                         : 1Die ID                         : V100, 81CF2194 00A1431C B9B95C93 0100A8C0 FB10005F

参数解释

字段解释说明
NPU IDNPU 设备id
Chip ID芯片id
Chip Type芯片类型
Chip Name芯片名称,目前支持310B1和310B4两种芯片名称。
310B1:表示芯片算力规格为20T。
310B4:表示芯片算力规格为8T。
Chip Version芯片版本
Board ID整机类型
PCB IDPCB版本编号
BOM IDBOM版本编号
Die ID芯片Die编号

查询详细信息

npu-smi info -t board -i <npu_id>
HwHiAiUser@davinci-mini:~$ npu-smi info -t board -i 0NPU ID                         : 0Product Name                   : NAModel                          : NAManufacturer                   : NASerial Number                  : 032WLS10K4000136Software Version               : 21.0.4Firmware Version               :Board ID                       : 0x3ecPCB ID                         : BBOM ID                         : 1Chip Count                     : 1Faulty Chip Count              : 0

查询所有芯片常用信息

npu-smi info -t common -i <npu_id>
HwHiAiUser@davinci-mini:~$ npu-smi info -t common -i 0NPU ID                         : 0Chip Count                     : 1Chip ID                        : 0Memory Usage Rate(%)           : 14Aicore Usage Rate(%)           : 0Temperature(C)                 : 46Rated Power Dissipation(W)     : 12.8

查询产品类型

npu-smi info -t product -i <npu_id>
HwHiAiUser@davinci-mini:~$ npu-smi info -t product -i 0Product Type                   : Atlas 200 Model 3000

查询所有芯片的功率

npu-smi info -t power -i <npu_id>
HwHiAiUser@davinci-mini:~$ npu-smi info -t power -i 0NPU ID                         : 0Chip Count                     : 1Chip ID                        : 0Rated Power Dissipation(W)     : 12.8

查询指定芯片的算力档位

npu-smi info -t nve-level -i <npu_id> -c <chip_id>
root@davinci-mini:~# npu-smi info -t nve-level -i 0 -c 0nve level                      : Full

查询AI CPU数量

HwHiAiUser@davinci-mini:~$ npu-smi info -t aicpu-config -i 0 -c 0Current AI CPU number          : 4Current control CPU number     : 4Number of AI CPUs set          : 4Number of control CPUs set     : 4

配置功能(set)

设置AI CPU数量

npu-smi set -t aicpu-config -i <npu_id> -c <chip_id> -d <value>
字段描述说明
value芯片的AI CPU数量。可设置为2、4、6。
root@davinci-mini:~# npu-smi set -t aicpu-config -i 0 -c 0 -d 2Status                         : OKMessage                        : The aicpu-config of the chip is set successfully. Please reboot system.

使用说明

  • 若当前环境模型中无AICPU算子,且运行业务时通过查询芯片统计信息查询当前AICPU占用率持续为0,则可以配置为0。
  • 设置CPU数量后,需要复位(重启)系统生效。

CPU压力测试

# 8个CPU压力测试,实际仅使用6个CPU
# AI CPU number: 2
# control CPU number: 6stress --cpu 8

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/799549.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

4/7 QT_day1

#include "mainwindow.h"MainWindow::MainWindow(QWidget *parent): QMainWindow(parent) {//窗口设置this->setWindowTitle("小黑子(little black son)");this->setWindowIcon(QIcon("D:\\qq文件\\Pitrue\\pictrue\\black.jpg"));this-&g…

HiSilicon352 android9.0 系统显示方向旋转与截屏问题分析

一&#xff0c;系统显示方向 1. 概述 Android的旋转显示&#xff0c;主要运用于广告机。Android的旋转&#xff0c;包括图形UI的旋转、鼠标和遥控器的旋转及媒体旋转。 下图为竖屏UI的绘制坐标系和显示坐标系。 2. 功能说明 方案依据Android原生的旋转原理设计&#xff0c…

使用tomcat里的API - servlet

一、创建一个新的Maven空项目 首次创建maven项目的时候&#xff0c;会自动从maven网站上下载一些依赖组件&#xff08;这个过程需要保证网络稳定&#xff0c;否则后续打包一些操作会出现一些问题&#xff09; ps:校园网可能会屏蔽一些网站&#xff0c;可能会导致maven的依赖…

Chat2DB

序言 日常开发中&#xff0c;我们可能会用到MyBatis Generator自动生成Entity实体类、DAO接口以及对应的Mapper文件可以减少一部分的冗余代码开发量&#xff0c;随着AI的发展&#xff0c;可以将自然语言转换为SQL语句&#xff0c;例如ChatSQL、阿里的Chat2DB等。 Chat2DB简介…

git Failed to connect to 你的网址 port 8282: Timed out

git Failed to connect to 你的网址 port 8282: Timed out 出现这个问题的原因是&#xff1a;原来的仓库换了网址&#xff0c;原版网址不可用了。 解决方法如下&#xff1a; 方法一&#xff1a;查看git用户配置是否有如下配置 http.proxyhttp://xxx https.proxyhttp://xxx如果…

数据库体系概述:详述其基本概念、多样分类、关键作用及核心特性

数据库是一个用于存储、管理和检索数据的系统&#xff0c;它按照特定的数据结构和模式组织数据&#xff0c;确保数据的一致性、安全性和高效访问。以下是关于数据库的详细介绍&#xff1a; 介绍&#xff1a; 数据库&#xff08;Database, DB&#xff09;是一个长期存储在计算…

算法汇总啊

一些常用算法汇总 算法思想-----数据结构动态规划(DP)0.题目特点1.【重点】经典例题(简单一维dp&#xff09;1.斐波那契数列2.矩形覆盖3.跳台阶4.变态跳台阶 2.我的日常练习汇总(DP)1.蓝桥真题-----路径 算法思想-----数据结构 数据结构的存储方式 : 顺序存储(数组) , 链式存储…

RTX RTOS操作实例分析之---邮箱(mailbox)

0 Preface/Foreword 1 邮箱&#xff08;mailbox&#xff09; 1.1 mailbox ID定义 static osMailQId app_mailbox NULL; 1.2 定义mailbox结构体变量 #define osMailQDef(name, queue_sz, type) \ static void *os_mail_p_##name[2]; \ const char mail_##name[] #name; \ con…

conda创建虚拟环境太慢,Collecting package metadata (current_repodata.json): failed

(省流版&#xff1a;只看加粗红色&#xff0c;末尾也有哦) 平时不怎么用conda&#xff0c;在前公司用服务器的时候用的是公司的conda源&#xff0c;在自己电脑上直接用python创建虚拟环境完事儿&#xff0c;所以对conda的配置并不熟悉~~【狗头】。但是python虚拟环境的最大缺点…

U盘属性0字节,数据恢复全攻略

U盘&#xff0c;这个我们日常生活中常用的数据存储工具&#xff0c;有时却会突然显示出“属性0字节”的诡异状况。面对这种突如其来的故障&#xff0c;许多用户都感到束手无策&#xff0c;甚至误以为数据已经彻底丢失。那么&#xff0c;U盘属性0字节究竟是怎么回事&#xff1f;…

OpenCV 使用freetype在图像上写中文

​​​​​​ #include "opencv2/opencv.hpp" #include "opencv2/freetype.hpp"static cv::Ptr<cv::freetype::FreeType2> getFreeType() {static cv::Ptr<cv::freetype::FreeType2> ft2;if (ft2.empty()){ft2 cv::freetype::createFreeType…

小红书商业IP变现策略与实操经验分享

一、个人介绍与背景 1. 创业者背景 作为连续创业者&#xff0c;我创立了树叶有光品牌&#xff0c;并在多个领域有所涉猎&#xff0c;如人生陪跑师、财富卡点爆破师等。这些多重身份让我在创业过程中积累了丰富的经验和独特的视角。 二、小红书账号运营经验 1. 运营成果 经…

Ubuntu 22.04安装新硬盘并启动时自动挂载

方法一 要在Ubuntu 22.04系统中安装一个新硬盘、对其进行格式化并实现启动时自动挂载&#xff0c;需要按以下步骤操作&#xff1a; 1. 安装硬盘 - 确保你的硬盘正确连接到计算机上&#xff08;涉及硬件安装&#xff09;。 2. 发现新硬盘 - 在系统启动后&#xff0c;打开终端…

30天拿下Rust之实战Web Server

概述 随着互联网技术的飞速发展&#xff0c;Web服务器作为承载网站与应用的核心组件&#xff0c;其性能、稳定性和安全性都显得至关重要。Rust语言凭借其独特的内存安全保证、高效的性能以及丰富的生态系统&#xff0c;成为了构建现代Web服务器的理想选择。 新建项目 首先&…

适合户外运动的开放式耳机选哪款?五款开放式耳机推荐

开放式蓝牙耳机由于其开放式设计&#xff0c;适合在户外运动、工作场所等需要保持警觉的场合使用。在户外活动中&#xff0c;能够听到周围环境的声音对于安全和警惕性非常重要。同时&#xff0c;这种耳机在运动或工作时不容易产生不适感&#xff0c;也不会阻碍佩戴者与他人的交…

高等数学基础篇(数二)之二重积分(解析版)

二重积分&#xff1a; 一、二重积分的概念及性质 1.二重积分的概念 2.二重积分的性质 二、二重积分的计算 1.利用直角坐标计算 2.利用极坐标计算 3.利用函数的奇偶性计算 4.利用变量的轮换对称性计算 目录 一、二重积分的概念及性质 1.二重积分的概念 2.二重积分的性…

ubuntu 23 安装maven

要在 Ubuntu 23 系统上安装 Maven&#xff0c;请遵循以下步骤&#xff1a; **1. ** 确保已安装 Java Development Kit (JDK): Maven 需要 Java 环境才能运行。确认您的系统已经安装了 JDK 8 或更高版本。如果尚未安装&#xff0c;可以通过以下命令安装 OpenJDK&#xff1a; s…

活动图高阶讲解-15

1 00:00:00,000 --> 00:00:07,200 目前来说&#xff0c;这个菱形到底是分还是合 2 00:00:07,200 --> 00:00:13,600 这个是靠入边出边的数量来判断的 3 00:00:13,600 --> 00:00:22,560 有的方法学&#xff0c;它可能会这样搞一些花样 4 00:00:22,560 --> 00:00:2…

Transformer架构的核心公式类似于数学期望并不复杂,但为什么这个模型这么强呢?

Transformer是一个利用注意力机制来提高模型训练速度的模型&#xff0c;因其适用于并行化计算以及本身模型的复杂程度使其在精度和性能上都要高于之前流行的循环神经网络。 一、Transformer模型整体结构 标准的Transformer结构如下图所示&#xff0c;是一个编码器-解码器架构…

免费SSL通配符证书/SSL泛域名证书获取教程

我们先基本了解什么是SSL证书以及其作用。SSL证书是一种数字证书&#xff0c;它通过为网站提供身份验证和数据加密服务&#xff0c;从而保护网站的用户信息安全。当我们在浏览器的地址栏看到“https”和绿色锁标志时&#xff0c;就表示该网站使用了SSL证书。 那么什么又是通配…