Mellanoxnvidia ib高速网络常用命令总结

1.spci:检查本地的pci设备。示例:lspci| grep -i mell

2.ofed_info:检测ofed驱动版本。示例:ofed_info-s

3.ibstat:查看本机的ib网卡状态。

4.mst:mellnoax软件管理工具。用来生成IB设备描述符。提供给其他命令使用。示例:mststart

5.mlnx_perf :可以查看端口的收发流量。

-i:选项接ib设备名称,ib0,ib1...

-t:每隔多久采集一次,单位s

-c:采集多少次。

6.smpquery:可以根据LID号,GUID号,Direct路径获取到节点详细信息。-D选项,当ib某些节点超时的时候,还有opensm日志提示报错通常通过直接路径报出来,而需要这个参数选项去追踪是哪个节点提示该种错误,方便定位问题。

7.ibswitches:获取当前子网的所有交换机的信息。显示子网内所有识别到的交换机的GUID、端口数量、交换机名字、LID号等等。

8.ibhosts:获取当前子网的所有HCA的信息。显示子网内所有识别到的HCA的GUID、端口数量、交换机名字、LID号等等。

9.ibnodes:获取当前子网的所有交换机和HCA的信息。显示子网内所有识别到的交换机和HCA的GUID、端口数量、交换机名字、LID号等等。相当于ibhosts和ibswirchs命令的合并。

10.ibnetdiscover:扫描当前网络中的IB设备。输出内容包括GUID、端口号、LID号和节点描述以及交换机和HCA卡的连接关系。

11.iblinkinfo:检查网络拓扑是否按照最初规划的网络准确并连接正常,使用iblinkinfo,可以观察到所有节点和交换机的端口连接情况。该交换机SW200总计有41个端口,第41个端口虚拟出来用来进行sheild功能,实际不存在物理端口。第一列至最后一列是本端交换机LID端口号,with,速率,状态,物理状态,对端LID号,对端端口号,对端名字。

查看单个交换机的端口状态。示例:iblinkinfo-S 0x1c34da0300608344。

查看该计算节点上联交换机的端口连接状态。示例:iblinkinfo-D 0,1

12.ibdiagnet:该指令扫描整个网络,诊断设备和网络连接状态,并生成报告。

示例:查看误码率,ibdiagnet --pc--get_phy_info

ibdiagnet.log : 全部应用信息报告

ibdiagnet.lst : 网络所有节点、端口和链路信息列表

ibdiagnet.fdbs :网络全部交换机的单播转发表

ibdiagnet.mcfdbs :网络全部交换机的多播转发表

ibdiagnet.masks :重复GUID端口、节点掩码表

ibdiagnet.sm :网络所有子网管理器SM列表

ibdiagnet.pm : 网络链路的性能管理器计数器信息

ibdiagnet.pkey :分区信息和成员主机端口信息

ibdiagnet.mcg :多播组属性,成员主机端口信息

ibdiagnet.db : 内部子网数据库信息

13.ibtracecert:根据GID或者LID,来追踪源地址到目标地址的每条的详细的节点信息。

14.sminfo:获取当前节点的子网管理器的信息。禁止批量执行该命令,会引起opensm服务异常。

15.saquery:查看子网内的子网管理器。

16.mget_temp:获取网卡或交换机的温度。

17.mlxlink:用于检查和调式连接状态以及与之相关的问题。

注意:Speed:表示当前网卡支持的最大带宽速率。

注意:EnabledLink Speed:表示当前网卡支持的协商速率。

注意:SupportCable Speed:表示与 IB 交换模块连接的线缆支持的协商速率(红色字体表示为内部连接无cable)

注意:该命令比较常用,可以用来检查端口的误码率(-c)和光口的温度(-m)、线缆长度等等。

18.ibqueryerrors:报告链路、端口误码率、重传次数等计数器报错信息。

示例:ibqueryerrors-S 0x1c34da03006082a4

19.ibportstate:来管理交换机的端口,enable、reset、disable等等。如果交换机的端口disable了,连对端卡的状态就是polling。

示例:ibportstate 127 37enable  # 启动lid为127的交换机的37号端口。

示例:ibportstate 12737                #查看lid为127的交换机的37号端口。

20.perfquery:查看端口计数器,主要用来排错。

示例:perfquery32 2:显示lid号为32的设备的2号端口的计数器。

示例:perfquery-l 26  1-10 -r:分别显示lid号为26的设备的1-10号端口的计数器。

-r:读取指定的端口计数器之后,重新开始计数。

-l:显示每一个端口的数据

-a:将所有端口,数据汇聚后,展示。

21.ib_send_bw:测试两个节点的带宽。常用参数

-a:Runsizes from 2 till 2^23

-c:指定连接类型。RC面向连接的可靠服务。UC面向连接的不可靠服务。UD面向数据包的不可靠服务。

-F:表示屏蔽掉CPU频率相关的提示信息。有时候CPU不到最大频率,会有提示信息。

-d:表示卡的id。

-i:指定网卡的端口

服务端: ib_send_bw -a -cUD -F -d mlx5_0

客户端: ib_send_bw -a -cUD -F -d mlx5_0 11.4.3.19

22.ib_send_lat:测试两个节点的延迟,用法类似。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/29900.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

经典游戏案例:unity官方推荐3d跑酷

学习目标&#xff1a;实现跑酷核心算法 游戏画面 项目结构目录 部分核心代码 using System; using System.Collections; using System.Collections.Generic; using UnityEngine; /// <summary> /// 游戏管理器是一个状态机&#xff0c;根据当前的游戏状态&#xff0c;它…

图解Attention学习笔记

教程是来自https://github.com/datawhalechina/learn-nlp-with-transformers/blob/main/docs/ 图解Attention Attention出现的原因是&#xff1a;基于循环神经网络&#xff08;RNN&#xff09;一类的seq2seq模型&#xff0c;在处理长文本时遇到了挑战&#xff0c;而对长文本中…

华北水利水电大学-C程序设计作业

目录 基础题 1-1 分析 代码实现 1-2 分析 代码实现 1-3 分析 代码实现 1-4 ​编辑 分析 代码实现 1-5 分析 代码实现 1-6 分析 代码实现 基础题 1-1 从键盘输入10个学生的有关数据&#xff0c;然后把它们转存到磁盘文件上去。其中学生信息包括学号、姓名…

Redis变慢了?

Redis变慢了&#xff1f; 什么是Redis&#xff1f;测定Redis变慢&#xff1f;最大响应延迟平均响应延迟设置Redis慢日志 分析Redis变慢bigkeysbigkey的危害bigkey优化 写在最后 什么是Redis&#xff1f; 作为一个技术人员来说&#xff0c;大家用的最多的可能就是Redis了&#…

EMQX集群搭建

1. 什么是 MQTT&#xff1f; MQTT&#xff08;Message Queuing Telemetry Transport&#xff09;是一种轻量级、基于发布-订阅模式的消息传输协议&#xff0c;适用于资源受限的设备和低带宽、高延迟或不稳定的网络环境。它在物联网应用中广受欢迎&#xff0c;能够实现传感器、…

防火墙中的NAT

防火墙的NAT NAT分类 源NAT 基于源IP地址进行转换。 我们之前接触过的静态NAT&#xff0c;动态NAT&#xff0c;NAPT都属于源NAT&#xff0c;都是针对源IP地址进行转换的。源NAT主要目的是为了保证内网用户可以访问公网。 先执行安全策略&#xff0c;后执行NAT 目标NAT 基于…

git的分支管理

✨前言✨ &#x1f4d8; 博客主页&#xff1a;to Keep博客主页 &#x1f646;欢迎关注&#xff0c;&#x1f44d;点赞&#xff0c;&#x1f4dd;留言评论 ⏳首发时间&#xff1a;20246月19日 &#x1f4e8; 博主码云地址&#xff1a;博主码云地址 &#x1f4d5;参考书籍&#x…

【TB作品】MSP430G2553,单片机,口袋板, 单相交流电压、电流计设计

题5 单相交流电压、电流计设计 设计基于MSP430的单相工频交流电参数检测仪。交流有效值0-220V&#xff0c;电流有效值0-40A。电压、电流值经电压、电流传感器输出有效值为0-5V的交流信号&#xff0c;传感器输出的电压、电流信号与被测电压、电流同相位。 基本要求如下 &#xf…

05、部署 YUM 仓库及NFS 共享服务

目录 5.1 部署YUM软件仓库 5.1.1 准备网络安装源&#xff08;服务器端&#xff09; 1、准备软件仓库目录 2、安装并启用vsftpd服务 5.1.2 配置软件仓库位置&#xff08;客户端&#xff09; 5.2 使用yum工具管理软件包 5.2.1 查询软件包 1、yum list——查询软件包列表 …

DGit的使用

将Remix连接到远程Git仓库 1.指定克隆的分支和深度 2.清理&#xff0c;如果您不在工作区上工作&#xff0c;请将其删除或推送至 GitHub 或 IPFS 以确保安全。 为了进行推送和拉取&#xff0c;你需要一个 PAT — 个人访问令牌 当使用 dGIT 插件在 GitHub 上推送、拉取、访问私…

网关助力边缘物联网

网关助力边缘物联网 在探讨网关如何助力边缘物联网&#xff08;IoT&#xff09;的议题时&#xff0c;我们不得不深入分析这一技术交汇点的复杂性与潜力。边缘计算与物联网的融合&#xff0c;通过将数据处理与分析能力推向网络边缘&#xff0c;即数据生成的地方&#xff0c;极大…

接口性能提升秘籍:本地缓存的总结与实践

&#x1f345;我是小宋&#xff0c; 一个只熬夜但不秃头的Java程序员。 &#x1f345;关注我&#xff0c;带你轻松过面试。提升简历亮点&#xff08;14个demo&#xff09; . . &#x1f30f;号&#xff1a;tutou123com。拉你进面试专属群。 优雅的接口调优之本地缓存优化 接口…

Spring中网络请求客户端WebClient的使用详解

Spring中网络请求客户端WebClient的使用详解_java_脚本之家 Spring5的WebClient使用详解-腾讯云开发者社区-腾讯云 在 Spring 5 之前&#xff0c;如果我们想要调用其他系统提供的 HTTP 服务&#xff0c;通常可以使用 Spring 提供的 RestTemplate 来访问&#xff0c;不过由于 …

初识es(elasticsearch)

初识elasticsearch 什么是elasticsearch&#xff1f;&#xff1a; 一个开源的分部署搜索引擎、可以用来实现搜索、日志统计、分析、系统监控等功能。 什么是文档和词条&#xff1f; 每一条数据就是一个文档对文档中的内容进行分词&#xff0c;得到的词语就是词条 什么是正向…

【elementui源码解析】如何实现自动渲染md文档-第四篇

目录 1.前言 2.md-loader - index.js 1&#xff09;md.render() 2&#xff09;定义变量 3&#xff09;while stripTemplate stripScript genInlineComponentText 4&#xff09;pageScript 5&#xff09;return 6&#xff09;demo-block 3.总结 所有章节&#x…

微纳米气泡发生器是微纳米气泡产生装置 未来市场需求将不断释放

微纳米气泡发生器是微纳米气泡产生装置 未来市场需求将不断释放 微纳米气泡发生器即微纳米气泡发生设备&#xff0c;是一种将水和气体混合并产生微纳米气泡的设备。微纳米气泡是指直径在100μm以下的气泡&#xff0c;分为纳米气泡和微米气泡。   微纳米气泡发生器主要由发生设…

录屏录音两不误!电脑录屏录音软件推荐(3款)

在数字化时代&#xff0c;电脑录屏录音软件已成为教学、演示、会议记录等领域不可或缺的工具。它们能够捕捉屏幕上的每一个动作&#xff0c;同时录制音频&#xff0c;为用户提供直观、生动的视听材料。本文将详细介绍三种常用的电脑录屏录音软件&#xff0c;帮助读者了解并掌握…

误删的文件不在回收站如何找回?6个恢复秘诀分享!

“我刚刚误删了一些文件&#xff0c;但是在回收站中没有看到这部分文件&#xff0c;这种情况下还有方法可以找回误删的文件吗&#xff1f;在线等一个答案&#xff01;” 在数字化时代&#xff0c;文件的安全和完整性对于个人和企业都至关重要。然而&#xff0c;有时候由于疏忽或…

【Android】使用SeekBar控制数据的滚动

项目需求 有一个文本数据比较长&#xff0c;需要在文本右侧加一个SeekBar&#xff0c;然后根据SeekBar的上下滚动来控制文本的滚动。 项目实现 我们使用TextView来显示文本&#xff0c;但是文本比较长的话&#xff0c;需要在TextView外面套一个ScrollView&#xff0c;但是我…

利用K8S技术栈打造个人私有云

1.三个节点&#xff1a;master&#xff0c;slave&#xff0c;client 在Kubernetes集群中&#xff0c;三个节点的职责分别如下&#xff1a; Master节点&#xff1a; docker&#xff1a;用于运行Docker容器。 etcd&#xff1a;一个分布式键值存储系统&#xff0c;用于保存Kuberne…