Mellanoxnvidia ib高速网络常用命令总结

1.spci:检查本地的pci设备。示例:lspci| grep -i mell

2.ofed_info:检测ofed驱动版本。示例:ofed_info-s

3.ibstat:查看本机的ib网卡状态。

4.mst:mellnoax软件管理工具。用来生成IB设备描述符。提供给其他命令使用。示例:mststart

5.mlnx_perf :可以查看端口的收发流量。

-i:选项接ib设备名称,ib0,ib1...

-t:每隔多久采集一次,单位s

-c:采集多少次。

6.smpquery:可以根据LID号,GUID号,Direct路径获取到节点详细信息。-D选项,当ib某些节点超时的时候,还有opensm日志提示报错通常通过直接路径报出来,而需要这个参数选项去追踪是哪个节点提示该种错误,方便定位问题。

7.ibswitches:获取当前子网的所有交换机的信息。显示子网内所有识别到的交换机的GUID、端口数量、交换机名字、LID号等等。

8.ibhosts:获取当前子网的所有HCA的信息。显示子网内所有识别到的HCA的GUID、端口数量、交换机名字、LID号等等。

9.ibnodes:获取当前子网的所有交换机和HCA的信息。显示子网内所有识别到的交换机和HCA的GUID、端口数量、交换机名字、LID号等等。相当于ibhosts和ibswirchs命令的合并。

10.ibnetdiscover:扫描当前网络中的IB设备。输出内容包括GUID、端口号、LID号和节点描述以及交换机和HCA卡的连接关系。

11.iblinkinfo:检查网络拓扑是否按照最初规划的网络准确并连接正常,使用iblinkinfo,可以观察到所有节点和交换机的端口连接情况。该交换机SW200总计有41个端口,第41个端口虚拟出来用来进行sheild功能,实际不存在物理端口。第一列至最后一列是本端交换机LID端口号,with,速率,状态,物理状态,对端LID号,对端端口号,对端名字。

查看单个交换机的端口状态。示例:iblinkinfo-S 0x1c34da0300608344。

查看该计算节点上联交换机的端口连接状态。示例:iblinkinfo-D 0,1

12.ibdiagnet:该指令扫描整个网络,诊断设备和网络连接状态,并生成报告。

示例:查看误码率,ibdiagnet --pc--get_phy_info

ibdiagnet.log : 全部应用信息报告

ibdiagnet.lst : 网络所有节点、端口和链路信息列表

ibdiagnet.fdbs :网络全部交换机的单播转发表

ibdiagnet.mcfdbs :网络全部交换机的多播转发表

ibdiagnet.masks :重复GUID端口、节点掩码表

ibdiagnet.sm :网络所有子网管理器SM列表

ibdiagnet.pm : 网络链路的性能管理器计数器信息

ibdiagnet.pkey :分区信息和成员主机端口信息

ibdiagnet.mcg :多播组属性,成员主机端口信息

ibdiagnet.db : 内部子网数据库信息

13.ibtracecert:根据GID或者LID,来追踪源地址到目标地址的每条的详细的节点信息。

14.sminfo:获取当前节点的子网管理器的信息。禁止批量执行该命令,会引起opensm服务异常。

15.saquery:查看子网内的子网管理器。

16.mget_temp:获取网卡或交换机的温度。

17.mlxlink:用于检查和调式连接状态以及与之相关的问题。

注意:Speed:表示当前网卡支持的最大带宽速率。

注意:EnabledLink Speed:表示当前网卡支持的协商速率。

注意:SupportCable Speed:表示与 IB 交换模块连接的线缆支持的协商速率(红色字体表示为内部连接无cable)

注意:该命令比较常用,可以用来检查端口的误码率(-c)和光口的温度(-m)、线缆长度等等。

18.ibqueryerrors:报告链路、端口误码率、重传次数等计数器报错信息。

示例:ibqueryerrors-S 0x1c34da03006082a4

19.ibportstate:来管理交换机的端口,enable、reset、disable等等。如果交换机的端口disable了,连对端卡的状态就是polling。

示例:ibportstate 127 37enable  # 启动lid为127的交换机的37号端口。

示例:ibportstate 12737                #查看lid为127的交换机的37号端口。

20.perfquery:查看端口计数器,主要用来排错。

示例:perfquery32 2:显示lid号为32的设备的2号端口的计数器。

示例:perfquery-l 26  1-10 -r:分别显示lid号为26的设备的1-10号端口的计数器。

-r:读取指定的端口计数器之后,重新开始计数。

-l:显示每一个端口的数据

-a:将所有端口,数据汇聚后,展示。

21.ib_send_bw:测试两个节点的带宽。常用参数

-a:Runsizes from 2 till 2^23

-c:指定连接类型。RC面向连接的可靠服务。UC面向连接的不可靠服务。UD面向数据包的不可靠服务。

-F:表示屏蔽掉CPU频率相关的提示信息。有时候CPU不到最大频率,会有提示信息。

-d:表示卡的id。

-i:指定网卡的端口

服务端: ib_send_bw -a -cUD -F -d mlx5_0

客户端: ib_send_bw -a -cUD -F -d mlx5_0 11.4.3.19

22.ib_send_lat:测试两个节点的延迟,用法类似。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/29900.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络新增接入交换机引发故障应对经验

网管对某一栋楼的汇聚交换机进行配置变更,要增加一台接入交换机,因为人员变多了,终端也就变多了,所以现有的网络和接入设备不能满足需求,需要新增一台接入层的交换机。 现网中新增一台接入交换机,这个配置是…

[Day 15] 區塊鏈與人工智能的聯動應用:理論、技術與實踐

區塊鏈的數字身份認證 1. 概述 數字身份認證是當今數字世界中的關鍵問題之一。傳統的身份驗證方法面臨著安全性、隱私性和可信度等方面的挑戰。區塊鏈技術通過其去中心化、不可篡改和可追溯的特性,為解決這些問題提供了新的可能性。本文將深入探討區塊鏈在數字身份…

经典游戏案例:unity官方推荐3d跑酷

学习目标&#xff1a;实现跑酷核心算法 游戏画面 项目结构目录 部分核心代码 using System; using System.Collections; using System.Collections.Generic; using UnityEngine; /// <summary> /// 游戏管理器是一个状态机&#xff0c;根据当前的游戏状态&#xff0c;它…

cJSON解析数组

json串: {"list":[ "hello","world"]} 代码 : int func(char *sn) { int ret = 0; cJSON *root, *list; FILE *fp = fopen("a.txt", "r"); if(!fp) { printf("open sn file failed!\n"); …

图解Attention学习笔记

教程是来自https://github.com/datawhalechina/learn-nlp-with-transformers/blob/main/docs/ 图解Attention Attention出现的原因是&#xff1a;基于循环神经网络&#xff08;RNN&#xff09;一类的seq2seq模型&#xff0c;在处理长文本时遇到了挑战&#xff0c;而对长文本中…

华北水利水电大学-C程序设计作业

目录 基础题 1-1 分析 代码实现 1-2 分析 代码实现 1-3 分析 代码实现 1-4 ​编辑 分析 代码实现 1-5 分析 代码实现 1-6 分析 代码实现 基础题 1-1 从键盘输入10个学生的有关数据&#xff0c;然后把它们转存到磁盘文件上去。其中学生信息包括学号、姓名…

Redis变慢了?

Redis变慢了&#xff1f; 什么是Redis&#xff1f;测定Redis变慢&#xff1f;最大响应延迟平均响应延迟设置Redis慢日志 分析Redis变慢bigkeysbigkey的危害bigkey优化 写在最后 什么是Redis&#xff1f; 作为一个技术人员来说&#xff0c;大家用的最多的可能就是Redis了&#…

EMQX集群搭建

1. 什么是 MQTT&#xff1f; MQTT&#xff08;Message Queuing Telemetry Transport&#xff09;是一种轻量级、基于发布-订阅模式的消息传输协议&#xff0c;适用于资源受限的设备和低带宽、高延迟或不稳定的网络环境。它在物联网应用中广受欢迎&#xff0c;能够实现传感器、…

防火墙中的NAT

防火墙的NAT NAT分类 源NAT 基于源IP地址进行转换。 我们之前接触过的静态NAT&#xff0c;动态NAT&#xff0c;NAPT都属于源NAT&#xff0c;都是针对源IP地址进行转换的。源NAT主要目的是为了保证内网用户可以访问公网。 先执行安全策略&#xff0c;后执行NAT 目标NAT 基于…

【数学】什么是最大似然估计?如何求解最大似然估计

背景 最大似然估计&#xff08;Maximum Likelihood Estimation, MLE&#xff09;是一种估计统计模型参数的方法。它在众多统计学领域中被广泛使用&#xff0c;比如回归分析、时间序列分析、机器学习和经济学。其核心思想是&#xff1a;给定一个观测数据集&#xff0c;找到一组…

git的分支管理

✨前言✨ &#x1f4d8; 博客主页&#xff1a;to Keep博客主页 &#x1f646;欢迎关注&#xff0c;&#x1f44d;点赞&#xff0c;&#x1f4dd;留言评论 ⏳首发时间&#xff1a;20246月19日 &#x1f4e8; 博主码云地址&#xff1a;博主码云地址 &#x1f4d5;参考书籍&#x…

【TB作品】MSP430G2553,单片机,口袋板, 单相交流电压、电流计设计

题5 单相交流电压、电流计设计 设计基于MSP430的单相工频交流电参数检测仪。交流有效值0-220V&#xff0c;电流有效值0-40A。电压、电流值经电压、电流传感器输出有效值为0-5V的交流信号&#xff0c;传感器输出的电压、电流信号与被测电压、电流同相位。 基本要求如下 &#xf…

Linux实时查看Java接口数据

1.Linux实时查看Java接口数据的方法 在Linux系统中实时查看Java接口数据通常涉及几个步骤&#xff1a; &#xff08;1&#xff09;编写Java应用程序&#xff1a;首先&#xff0c;你需要有一个Java应用程序&#xff0c;它暴露了一个或多个HTTP接口。这些接口应该返回你想要实时…

php百度云账户余额查询API示例

1、官方文档地址&#xff1a;账户余额查询 请求结构 POST /v{version}/finance/cash/balance HTTP/1.1 Host: billing.baidubce.com ContentType: application/json; charsetutf-8 Content-Length: <Content_Length> Authorization: authorization string 请求头域 …

ubuntu安装本地版overleaf并配置Docker

安装Docker 参考https://blog.csdn.net/2201_76100073/article/details/137025119 更新软件包 sudo apt update sudo apt upgradedocker依赖 sudo apt-get install ca-certificates curl gnupg lsb-release添加docker密钥 curl -fsSL http://mirrors.aliyun.com/docker-ce…

05、部署 YUM 仓库及NFS 共享服务

目录 5.1 部署YUM软件仓库 5.1.1 准备网络安装源&#xff08;服务器端&#xff09; 1、准备软件仓库目录 2、安装并启用vsftpd服务 5.1.2 配置软件仓库位置&#xff08;客户端&#xff09; 5.2 使用yum工具管理软件包 5.2.1 查询软件包 1、yum list——查询软件包列表 …

Python 3 函数

Python 3 函数 函数是Python编程语言的核心组成部分&#xff0c;它们允许我们封装代码块&#xff0c;使其可重用&#xff0c;模块化&#xff0c;并易于维护。在Python 3中&#xff0c;函数的使用和定义都有一些特定的语法和规则。本文将详细介绍Python 3中的函数&#xff0c;包…

DGit的使用

将Remix连接到远程Git仓库 1.指定克隆的分支和深度 2.清理&#xff0c;如果您不在工作区上工作&#xff0c;请将其删除或推送至 GitHub 或 IPFS 以确保安全。 为了进行推送和拉取&#xff0c;你需要一个 PAT — 个人访问令牌 当使用 dGIT 插件在 GitHub 上推送、拉取、访问私…

网关助力边缘物联网

网关助力边缘物联网 在探讨网关如何助力边缘物联网&#xff08;IoT&#xff09;的议题时&#xff0c;我们不得不深入分析这一技术交汇点的复杂性与潜力。边缘计算与物联网的融合&#xff0c;通过将数据处理与分析能力推向网络边缘&#xff0c;即数据生成的地方&#xff0c;极大…

高企如何提高通过率?2024年成都市高新技术企业认定条件和申报提前规划

一、知识产权 1.知识产权布局“前置化” 公司申报高新技术企业在知识产权上要注意知识产权数量和质量双达标。 注&#xff1a;知识产权是高企申报的重要条件&#xff0c;同时也是认定评审的主要得分项。总分100分&#xff0c;其中60分与知识产权相关&#xff08;知识产权情况…