银河麒麟服务器系统中intel-x710网卡丢包问题

银河麒麟服务器系统中intel-x710网卡丢包问题

      • 一 系统环境
      • 二 问题描述
      • 三 问题分析过程
          • 3.1 查看网卡配置文件
          • 3.2 netstat -ni查看丢包和重传
          • 3.3 使用ethtool -S {网卡名}查看drop
          • 3.4 使用sar -n DEV查看丢包情况
          • 3.5 使用sar -n ETCP 1查看重传情况
          • 3.6 查看/proc/net/snmp中,tcp和udp的重传情况
          • 3.7 查看查看/proc/net/udp中,udp的丢包情况
          • 3.8 通过tcpdump抓包进行分析
      • 四 解决方法
          • 4.1 建议不要升级网卡驱动;
          • 4.2 调整ringbuffer,lldp,tso

一 系统环境

[root@localhost ~]# nkvers 
############## Kylin Linux Version #################
Release:
Kylin Linux Advanced Server release V10 (Sword)Kernel:
4.19.90-24.4.v2101.ky10.x86_64Build:
Kylin Linux Advanced Server
release V10 (SP2) /(Sword)-x86_64-Build09/20210524
#################################################服务器的网卡型号:INTEL X710
网卡使用的驱动版本:操作系统自带2.3.2-k

二 问题描述

问题现象一:生产环境的物理服务器开机运行一段时间后,系统下执行命令netstat -in出现bond1的 RX-DRP数值不断升高,担心对业务有影响。目前现场人员已经更换网卡和升级网卡驱动以后依然存在该情况。

问题现象二:网卡intel x710收包丢包,发包正常。博通网卡正常。

三 问题分析过程

3.1 查看网卡配置文件
# cat ifcfg-bond1
DEVICE=bond1
BOOTPROTO=none
ONBOOT=yes
IPV6INIT=no
TYPE=Ethernet
PEERDNS=yes
USERCTL=n0
IPADDR=xxx.xxx.xxx.xxx
NETMASK=255.255.255.0
GATEWAY=xxx.xxx.xxx.xxx
BONDING_OPTS="mode=1 miimon=100"# cat ifcfg-p2p1
DEVICE=p2p1
BOOTPROTO=none
MASTER=bond0
SLAVE=yes
ONBOOT=yes
IPV6INIT=no
TYPE=Ethernet
PEERDNS=yes
USERCTL=no# cat ifcfg-p3p1
DEVICE=p3p1
BOOTPROTO=none
MASTER=bond1
SLAVE=yes
ONBOOT=yes
IPV6INIT=no
TYPE=Ethernet
PEERDNS=yes
USERCTL=no
3.2 netstat -ni查看丢包和重传

netstat -ni 查看现场问题机器,RX-DRP的数值方面,有一组网卡值为非0,存在丢包的现象
正常如下:

[root@localhost ~]# netstat -ni
Kernel Interface table
Iface             MTU    RX-OK RX-ERR RX-DRP RX-OVR    TX-OK TX-ERR TX-DRP TX-OVR Flg
ens33            1500     1465      0      0 0          1110      0      0      0 BMRU
lo              65536   212363      0      0 0        212363      0      0      0 LRU
3.3 使用ethtool -S {网卡名}查看drop

使用ethtool -S {网卡名},查看rx_dropped的数量

3.4 使用sar -n DEV查看丢包情况

查看rxdrop/s值是否为0,如果为0表示无丢包,如果非0表述存在丢包。

3.5 使用sar -n ETCP 1查看重传情况

查看retrans/s数值是否为0,如果为0表示无重传,如果非0表示存在重传。

3.6 查看/proc/net/snmp中,tcp和udp的重传情况
[root@localhost ~]# cat /proc/net/snmp
Ip: Forwarding DefaultTTL InReceives InHdrErrors InAddrErrors ForwDatagrams InUnknownProtos InDiscards InDelivers OutRequests OutDiscards OutNoRoutes ReasmTimeout ReasmReqds ReasmOKs ReasmFails FragOKs FragFails FragCreates
Ip: 2 64 225567 0 3 0 0 0 225460 224834 12 0 0 0 0 0 0 0 0
Icmp: InMsgs InErrors InCsumErrors InDestUnreachs InTimeExcds InParmProbs InSrcQuenchs InRedirects InEchos InEchoReps InTimestamps InTimestampReps InAddrMasks InAddrMaskReps OutMsgs OutErrors OutDestUnreachs OutTimeExcds OutParmProbs OutSrcQuenchs OutRedirects OutEchos OutEchoReps OutTimestamps OutTimestampReps OutAddrMasks OutAddrMaskReps
Icmp: 19 0 0 18 0 0 0 0 1 0 0 0 0 0 61 0 60 0 0 0 0 0 1 0 0 0 0
IcmpMsg: InType3 InType8 OutType0 OutType3
IcmpMsg: 18 1 1 60
Tcp: RtoAlgorithm RtoMin RtoMax MaxConn ActiveOpens PassiveOpens AttemptFails EstabResets CurrEstab InSegs OutSegs RetransSegs InErrs OutRsts InCsumErrors
Tcp: 1 200 120000 -1 6152 4149 1995 2952 33 229308 228559 0 0 3893 0
Udp: InDatagrams NoPorts InErrors OutDatagrams RcvbufErrors SndbufErrors InCsumErrors IgnoredMulti
Udp: 100 19 0 196 0 4 0 0
UdpLite: InDatagrams NoPorts InErrors OutDatagrams RcvbufErrors SndbufErrors InCsumErrors IgnoredMulti
UdpLite: 0 0 0 0 0 0 0 0
3.7 查看查看/proc/net/udp中,udp的丢包情况
[root@localhost ~]# cat /proc/net/udpsl  local_address rem_address   st tx_queue rx_queue tr tm->when retrnsmt   uid  timeout inode ref pointer drops             76: 00000000:0044 00000000:0000 07 00000000:00000000 00:00000000 00000000     0        0 126177 2 000000006a4fbf90 0        119: 00000000:006F 00000000:0000 07 00000000:00000000 00:00000000 00000000     0        0 24464 2 0000000026c71e42 0         331: 0100007F:0143 00000000:0000 07 00000000:00000000 00:00000000 00000000     0        0 27170 2 00000000bbb90c01 0         
3.8 通过tcpdump抓包进行分析
tcpdump -i 网卡名 -e|grep -v -E 'ARP|IP|802.1Q|802.1AD'

四 解决方法

4.1 建议不要升级网卡驱动;
4.2 调整ringbuffer,lldp,tso
(1)将网卡的ringbuffer调大
ethtool -G {网卡名} tx 4096 rx 4096(2)关闭 lldp
ethtool --set-priv-flags {网卡名} disable-fw-lldp on(3)关闭tso
ethtool -K {网卡名} tso off#一般都是一块网卡两个网口,所以两个网口的设备都要改,例如p2p1,p3p1

LLDP (Link Layer Discovery Protocol,链路层发现协议)提供了一种标准的链路层发现方式,可以将本端设备的的主要能力、管理地址、设备标识、接口标识等信息组织成不同的TLV(Type/Length/alue),并封装在LLDPDU(Link Layer Discovery Protocol
Data Unit,链路层发现协议数据单元)中发布给与自己直连的邻居,邻居收到这些信息后将其以标准MIB(ManagementInformation Base,管理信息库)的形式保存起来,以供网络管理系统查询及判断链路的通信状况。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/758391.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python内置函数 N

python内置函数 N Python 解释器内置了很多函数和类型,任何时候都能使用。 N 名称描述next返回迭代器中的下一个元素。 next(iterator) next(iterator) next(iterator, default) next()是一个内置函数,用于从迭代器中获取下一个项目。它通常与迭代…

MySQL数据库基本操作和管理

目录 一.MySQL数据库基本操作 1.SQL分类 (1)数据库:database (2)表:table,行:row 列:column (3)索引:index (4&…

Resilience4j原理及应用:构建高可用性系统的熔断、限流与容错机制(一)

本系列文章简介: 在本系列文章中,我们将深入探讨Resilience4j的原理及应用,包括熔断器、限流器和容错策略的工作原理、配置方法以及最佳实践。通过学习和掌握Resilience4j的使用技巧,我们将能够更好地构建高可用性系统&#xff0c…

Linux网络编程: TCP协议首部与可选项简述

一、TCP/IP五层模型 物理层(Physical Layer):物理层是最底层,负责传输比特流(bitstream)以及物理介质的传输方式。它定义了如何在物理媒介上传输原始的比特流,例如通过电缆、光纤或无线传输等。…

python中字典相关知识点总结

1.字典的定义 字典:在Python中,字典是一系列键-值对。每个键都与一个值相关联,程序员可以通过键来访问与之相关联的值。 实际举例: student{name:xincun,age:18} 通过实例我们可以发现,键-值对是两个相关联的值。指…

如何实现数据库的主从复制?

如何实现数据库的主从复制? 数据库的主从复制是实现数据备份、负载均衡和故障恢复的重要策略。它涉及一个主数据库(Master)和一个或多个从数据库(Slave),主数据库负责处理写入操作,而从数据库则…

代码随想录算法训练营第二十九天|491.递增子序列、46.全排列、47.全排列 II

文档讲解&#xff1a;491.递增子序列、46.全排列、47.全排列 II 题目链接&#xff1a;491.递增子序列、46.全排列、47.全排列 II 491.递增子序列 class Solution {List<List<Integer>> res new ArrayList<>();List<Integer> path new ArrayList<…

CodeWhisperer插件

一、前言 产品官网地址&#xff1a;What is CodeWhisperer? - CodeWhisperer Amazon CodeWhisperer 是一个通用的、由机器学习驱动的代码生成器&#xff0c;可实时为您提供代码建议。在您编写代码时&#xff0c;CodeWhisperer 会根据您现有的代码和注释自动生成建议。您的个…

JAVA 100道题(6)

6.创建一个表示矩形的类&#xff0c;包括宽度和高度属性&#xff0c;以及计算面积和周长的方法。 下面是一个简单的Python类&#xff0c;表示矩形&#xff0c;包含宽度和高度属性&#xff0c;以及计算面积和周长的方法&#xff1a; python复制代码 class Rectangle: def __ini…

机器人路径规划:基于斑翠鸟优化算法(Pied Kingfisher Optimizer ,PKO)的机器人路径规划(提供MATLAB代码)

一、机器人路径规划介绍 移动机器人&#xff08;Mobile robot&#xff0c;MR&#xff09;的路径规划是 移动机器人研究的重要分支之&#xff0c;是对其进行控制的基础。根据环境信息的已知程度不同&#xff0c;路径规划分为基于环境信息已知的全局路径规划和基于环境信息未知或…

【随笔馆001-安住当下是最高的人生智慧】

&#x1f332;今天我去另外一个地方参加会议&#xff0c;结束后叫了一个滴滴&#xff0c;结果司机走错了路害我等了好久。我开始有点不悦&#xff0c;突然听到马路对面有一个人在弹萨克斯。我想与其在这里焦躁地等司机&#xff0c;还不如静下心来好好欣赏音乐。就这样&#xff…

【ROS】解决编译含有Python的ROS包遇到的 “Could NOT find PY_em (missing: PY_EM)“ 问题

使用ROS编译含有Python的ROS包时会遇到 “Could NOT find PY_em (missing: PY_EM)” 的错误。这个问题通常是由于ROS找不到正确的Python解释器而导致的。解决方法&#xff1a;通过指定正确的Python解释器路径来解决这个问题。Ubuntu系统的Python解释器通常位于 /usr/bin/python…

日期问题总结

做日期问题,首先把模版写下来,再根据具体情况具体分析,基本上考试考到日期问题都是模拟和枚举,数据量也不会太大,所以我们根据题目要求直接打暴力就可以过. 模板&#xff1a; const int months[]{//平年天数 0,31,28,31,30,31,30,31,31,30,31,30,31 }; int is_leap(int y){//…

小项目知识点

0.vue运行自启动 "dev": "vite --open" //package.json 1.Element-plus 安装element-plus pnpm i element-plus 如何使用&#xff1f; <el-button :icon"Plus">按钮</el-button> <script setup langts> import { Plus …

mysql 数据库 增删改查 基本操作

目录 一 SQL 详细介绍 &#xff08;一&#xff09;SQL 分类 &#xff08;二&#xff09; SQL 语言规范 &#xff08;三&#xff09;数据库对象和命名 1&#xff0c;数据库的组件(对象)&#xff1a; 2&#xff0c;命名规则&#xff1a; &#xff08;四&#xff09; SQL…

【Rust】——panic!和不可恢复的错误

&#x1f383;个人专栏&#xff1a; &#x1f42c; 算法设计与分析&#xff1a;算法设计与分析_IT闫的博客-CSDN博客 &#x1f433;Java基础&#xff1a;Java基础_IT闫的博客-CSDN博客 &#x1f40b;c语言&#xff1a;c语言_IT闫的博客-CSDN博客 &#x1f41f;MySQL&#xff1a…

使用Python查找字符串中包含的多个元素

目录 一、引言 二、基本字符串操作 使用in关键字查找子字符串 使用循环和条件判断查找多个子字符串 三、使用正则表达式进行高级搜索 导入re模块 使用re.search()查找单个模式 使用re.findall()查找多个模式 四、案例与代码 五、优化与扩展 六、总结 一、引言 在Py…

【5G NB-IoT NTN】3GPP R17 NB-IoT NTN介绍

博主未授权任何人或组织机构转载博主任何原创文章&#xff0c;感谢各位对原创的支持&#xff01; 博主链接 本人就职于国际知名终端厂商&#xff0c;负责modem芯片研发。 在5G早期负责终端数据业务层、核心网相关的开发工作&#xff0c;目前牵头6G算力网络技术标准研究。 博客…

20万买新能源,除了烂大街的车,还可以选“精而美”

美”文 | AUTO芯球 作者 | 雷歌 “旧车撞了&#xff0c;准备买新车”。 前几天老家一个同学发来消息&#xff0c;春节他追尾了别人的车&#xff0c;不光赔了钱&#xff0c;还把自己的车车头撞废了&#xff0c;修好得一大笔钱&#xff0c;他干脆当废铁1万块钱卖给二手车商了。…

我的自建博客之旅06之Mrdoc

这个是我折腾笔记项目的最后一篇文章了,这个项目是类似于语雀的文档笔记项目,因为我当初想找一个既可以当做笔记,又可以作为团队文档分享的笔记,除了语雀,就发现了这个项目。 这个开源项目的界面或者文档组织方式其实是我最喜欢的,但是我后来放弃它的原因是它的后台编辑逻…