华为S系列交换机CPU占用率高问题排查与解决方案

在这里插入图片描述

问题概述

在华为S系列交换机(V100&V200版本)运行过程中,CPU占用率过高是一个常见问题,可能导致设备性能下降甚至业务中断。根据华为官方维护宝典,导致CPU占用率高的主要原因可分为四大类:网络攻击、网络震荡、网络环路和硬件故障。

网络攻击导致的CPU高问题

网络攻击的特征与类型

网络攻击是导致CPU占用率高的常见原因,主要表现为攻击源产生大量非正常网络交互请求,使交换机忙于处理这些请求而无法正常运行业务。常见的网络攻击类型包括:

ARP协议报文攻击

  • ARP和ARP-Miss泛洪攻击
  • ARP欺骗攻击

DHCP协议报文攻击

其他类型攻击

  • ICMP攻击

    DDoS攻击

    广播报文攻击

    TTL-expired报文攻击

    目的IP为设备IP的报文攻击

    SSH/FTP/Telnet等应用层协议报文攻击

网络攻击的定位方法

1.查看设备基本信息

display version
display device

2.检查上送CPU报文统计

display cpu-defend statistics 
reset cpu-defend statistics # 清除统计信息 
display cpu-defend statistics all # 隔几秒后再次查看

示例输出分析:

Statistics on slot 2:
在这里插入图片描述

如果观察到某种协议报文异常增多,且现网不可能出现这么多报文,则可判断为协议报文攻击。

网络攻击的解决方案

1. 配置攻击溯源功能

system-view
acl number 2000rule 5 permit source 10.1.1.1 0  # 10.1.1.1为网关IP地址quit
cpu-defend policy policy1auto-defend enable  # 使能攻击溯源功能undo auto-defend trace-type source-portvlan  # 配置溯源模式undo auto-defend protocol 8021x dhcp icmp igmp tcp telnet ttl-expired udp  # 删除不需要的溯源协议auto-defend whitelist 1 acl 2000  # 将网关IP加入白名单quit

对于V200R009之后版本:

cpu-defend policy policy1auto-defend protocol arp  # 只溯源ARP报文auto-defend whitelist 1 acl 2000quit

2. 应用防攻击策略

框式交换机配置:

# 主控板应用策略
system-view
cpu-defend-policy policy1
quit# 所有接口板应用策略
system-view
cpu-defend-policy policy2 global# 指定接口板应用策略
system-view
slot 1
cpu-defend-policy policy2

盒式交换机配置:

# 非堆叠情况
system-view
cpu-defend-policy policy1 global# 堆叠情况
# 主设备应用策略
system-view
cpu-defend-policy policy1# 所有堆叠设备应用策略
system-view
cpu-defend-policy policy1 global

3. 查看攻击源信息

display auto-defend attack-source
display auto-defend attack-source slot slot-id

4. 网络攻击处理建议

配置ARP安全功能:参考产品文档"配置指南-安全配置-ARP安全配置"

启用攻击溯源惩罚功能:

cpu-defend policy policy1 
auto-defend enable 
auto-defend action deny timer 300 # 300秒内丢弃攻击报文

配置黑名单:

acl number 2001 
rule permit source 1.1.1.0 0.0.0.255 
quit 
cpu-defend policy policy1 
blacklist 1 acl 2001

关闭攻击源接口(谨慎使用):

cpu-defend policy policy1 
auto-defend enable 
auto-defend action error-down

网络震荡导致的CPU高问题

STP震荡问题

定位方法

查看STP拓扑变化信息

display stp topology-change
观察"Number of topology changes"是否有增长。

查看TC-BPDU统计

display stp tc-bpdu statistics

示例输出:

MSTID Port             TC(Send/Receive) TCN(Send/Receive) 0 
GigabitEthernet2/0/6 21/4       0/1

处理建议

开启TC保护告警

snmp-agent trap enable feature-name mstp 
stp tc-protection

根据拓扑变化情况处理

接入侧端口Up/Down:配置为边缘端口并开启BPDU保护

stp edged-port enable 
stp bpdu-protection 

根桥非预期变化:开启根保护功能

stp root-protection

OSPF路由协议震荡

定位方法

查看OSPF邻居状态

display ospf peer last-nbr-down 
display logbuffer

检查OSPF报文统计

display cpu-defend statistics packet-type ospf

处理建议

调整OSPF邻居失效时间

ospf timer dead interval # 建议设置为20s以上

使能sham-hello功能

sham-hello enable

检查OSPF认证配置

display ospf error如果"Bad authentication type""Bad authentication key"计数增长,需配置相同认证信息:ospf authentication-mode

网络环路导致的CPU高问题

定位方法

网络环路通常表现为:

  • 设备CPU占用率超过80%
  • VLAN接口指示灯频繁闪烁
  • 频繁MAC漂移
  • 管理操作延迟
  • Ping测试严重丢包
  • 接口收到大量广播报文

处理建议

  • 通过接口指示灯和流量情况确认存在广播风暴的接口
  • 根据链路拓扑逐跳排查环路设备
  • 判断并断开产生环路的接口

硬件故障导致的CPU高问题

如果排除了网络攻击、震荡和环路等因素,仍存在CPU占用率高的问题,可能是硬件故障导致。此时建议:

收集设备日志信息

display logbuffer

联系华为技术支持或交换机经销商进行进一步诊断和处理

总结

华为S系列交换机CPU占用率高问题的解决需要系统性地排查可能的原因,并采取针对性的解决方案。网络管理员应熟练掌握相关诊断命令和处理方法,定期检查设备运行状态,及时防范和处理可能导致CPU高负载的各种情况,确保网络稳定运行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/80085.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

招募队员问题

#include <bits/stdc.h> using namespace std;int main() {int n;cin >> n; // 输入队伍人数&#xff08;行数&#xff09;vector<int> maxx(5, 0); // 用于记录每个数字&#xff08;1~5&#xff09;出现的最大连续段长度// 定义二维数组 team&#xff0c;n …

2025.04.19react面试题

以下是整理的 20 道 React 面试题&#xff0c;涵盖基础、进阶和实战应用&#xff0c;适用于社招或内推准备&#xff1a; 一、React 基础&#xff08;适合初中级&#xff09; React 中的组件有哪几种&#xff1f;它们有什么区别&#xff1f; 什么是 JSX&#xff1f;它与 HTML 有…

Python爬虫从入门到实战详细版教程Char01:爬虫基础与核心技术

1.1 什么是网络爬虫? 1.1.1 定义与分类 网络爬虫:互联网世界的“信息捕手” 网络爬虫(Web Crawler),又称网络蜘蛛或网络机器人,是一种通过预设规则自动访问网页、提取数据的程序系统。从技术视角看,其核心任务是通过模拟浏览器行为向目标服务器发起请求,解析网页内容…

Python爬虫实战:获取xie程网近两周长沙飞敦煌机票数据,为51出行做参考

一、引言 1.1 研究背景 伴随互联网技术的迅猛发展与人们生活水平的显著提升,在线旅游平台成为人们出行预订的重要途径。其中,飞机作为高效快捷的长途出行方式备受青睐。xie程网作为国内领先的在线旅游平台,汇聚了丰富的机票信息。对于计划在 51 出行期间从长沙飞往敦煌的旅…

Mujoco robosuite 机器人模型

import ctypes import os# 获取当前脚本所在的目录 script_dir os.path.dirname(os.path.abspath(__file__))# 构建库文件的相对路径 lib_relative_path os.path.join(dynamic_models, UR5e, Jb.so)# 拼接成完整的路径 lib_path os.path.join(script_dir, lib_relative_path…

【重学Android】02.Java环境配置的一些分享

背景说明 其实只是学习Android的话&#xff0c;只要下载好Android Studio开发工具&#xff0c;是自带JDK环境的&#xff0c;所以不需要再额外去进行配置&#xff0c;我之所以还要进行单独配置&#xff0c;是因为我其他的工具需要Java的环境&#xff0c;而且我目前用的是JDK 12…

Linux 网络编程:select、poll 与 epoll 深度解析 —— 从基础到高并发实战

一、IO 多路复用&#xff1a;解决并发 IO 的核心技术 在网络编程中&#xff0c;当需要同时处理大量客户端连接时&#xff0c;传统阻塞式 IO 会导致程序卡在单个操作上&#xff0c;造成资源浪费。IO 多路复用技术允许单线程监听多个文件描述符&#xff08;FD&#xff09;&#…

制作你的时间管理“局”#自制软件,5款AI编程对比测试

玩 AI 编程最有意思的地方&#xff0c;就是当你有想法的时候&#xff0c;可以随时测试、把想法具体化&#xff0c;甚至产品化。今天我们制作一个事件管理器&#xff0c;用来量化我们每天的时间安排&#xff0c;提高时间的利用率&#xff0c;提升生产力。 同样的一组 prompt &am…

大数据系列 | 详解基于Zookeeper或ClickHouse Keeper的ClickHouse集群部署--完结

大数据系列 | 详解基于Zookeeper或ClickHouse Keeper的ClickHouse集群部署 1. ClickHouse与MySQL的区别2. 在群集的所有机器上安装ClickHouse服务端2.1. 在线安装clickhouse2.2. 离线安装clickhouse 3. ClickHouse Keeper/Zookeeper集群安装4. 在配置文件中设置集群配置5. 在每…

宏碁笔记本电脑怎样开启/关闭触摸板

使用快捷键&#xff1a;大多数宏碁笔记本可以使用 “FnF7” 或 “FnF8” 组合键来开启或关闭触摸板&#xff0c;部分型号可能是 “FnF2”“FnF9” 等。如果不确定&#xff0c;可以查看键盘上的功能键图标&#xff0c;一般有触摸板图案的按键就是触摸板的快捷键。通过设备管理器…

使用Mybaitis-plus提供的各种的免写SQL的Wrapper的使用方式

文章目录 内连接JoinWrappers.lambda和 new MPJLambdaWrapper 生成的MPJLambdaWrapper对象有啥区别&#xff1f;LambdaQueryWrapper 和 QueryWrapper的区别&#xff1f;LambdaQueryWrapper和MPJLambdaQueryWrapper的区别&#xff1f;在作单表更新时建议使用&#xff1a;LambdaU…

基于微信小程序的走失儿童帮助系统-项目分享

基于微信小程序的走失儿童帮助系统-项目分享 项目介绍项目摘要管理员功能图用户功能图系统功能图项目预览首页走失儿童个人中心走失儿童管理 最后 项目介绍 使用者&#xff1a;管理员、用户 开发技术&#xff1a;MySQLJavaSpringBootVue 项目摘要 本系统采用微信小程序进行开…

P3916 图的遍历

P3916 图的遍历 题目来源-洛谷 题意 有向图中&#xff0c;找出每个节点能访问到的最大的节点 思路 每个节点的最大节点&#xff0c;不是最长距离&#xff0c;如果是每个节点都用dfs去找最大值&#xff0c;显然1e6*1e6 超时了&#xff0c;只能60分从第一个节点开始遍历&…

掌握常见 HTTP 方法:GET、POST、PUT 到 CONNECT 全面梳理

今天面试还问了除了 get 和 post 方法还有其他请求方法吗&#xff0c;一个都不知道&#xff0c;这里记录下。 &#x1f310; 常见 HTTP 请求方法一览 方法作用描述是否幂等是否常用GET获取资源&#xff0c;参数一般拼接在 URL 中✅ 是✅ 常用POST创建资源 / 提交数据&#xff…

裸金属服务器的应用场景有哪些?

随着云计算技术不断发展&#xff0c;裸金属服务器作为一台既具有传统物理服务器特点的硬件设备&#xff0c;还具备云计算技术的服务器化服务功能&#xff0c;是硬件和软件相结合的网络设备&#xff0c;逐渐被越来越多的企业所关注&#xff0c;那么&#xff0c;裸金属服务器的应…

【得物】20250419笔试算法题

文章目录 前言第一题1. 题目描述2. 思路解析3. AC代码 第二题1. 题目描述2. 思路解析3. AC代码 第三题1. 题目描述2. 思路解析3. AC代码 前言 三道题目都比较简单&#xff0c;大家都可以试着做一下。 第一题 1. 题目描述 题目链接&#xff1a;矩阵变换 2. 思路解析 按题…

明远智睿2351开发板四核1.4G Linux处理器:驱动创新的引擎

在科技日新月异的今天&#xff0c;创新成为了推动社会进步的核心动力。而在这场创新的浪潮中&#xff0c;一款性能卓越、功能全面的处理器无疑是不可或缺的引擎。今天&#xff0c;我们介绍的这款四核1.4G处理器搭配Linux系统的组合&#xff0c;正是这样一款能够驱动未来创新的强…

Oracle Database Resident Connection Pooling (DRCP) 白皮书阅读笔记

本文为“Extreme Oracle Database Connection Scalability with Database Resident Connection Pooling (DRCP)”的中文翻译加阅读笔记。觉得是重点的就用粗体表示了。 白皮书版本为March 2025, Version 3.3&#xff0c;副标题为&#xff1a;Optimizing Oracle Database resou…

VS Code + GitHub:高效开发工作流指南

目录 一、安装 & 基本配置 1.下载 VS Code 2.安装推荐插件(打开侧边栏 Extensions) 3.设置中文界面(可选) 二、使用 VS Code 操作 Git/GitHub 1.基本 Git 操作(不输命令行!) 2.连接 GitHub(第一次使用) 三、克隆远程仓库到 VS Code 方法一(推荐): 方…

【LLM】llama.cpp:合并 GGUF 模型分片

GGUF&#xff08;GPT-Generated Unified Format&#xff09;是一种专为大规模语言模型设计的二进制文件格式&#xff0c;支持将模型分割成多个分片&#xff08;*-of-*.gguf&#xff09;。当从开源社区&#xff08;如 HuggingFace 或 ModelScope&#xff09;下载量化模型时&…