网卡故障但bond0不切换原因及处理、脚本监控bond0网卡状态并做相应操作

文章目录

  • 故障说明
  • 监控脚本
    • 脚本编写
    • 脚本测试
      • 正常场景
      • 异常场景1
      • 异常场景2
    • 脚本准备和修改网卡名
      • 脚本拷贝到所有需要监控主机
      • 修改网卡名
    • 批量执行脚本

故障说明

  • 在一次交换机升级的割接中,主备交换机重启的时候,我们发现了一个问题,有几台宿主机会中断【ping不通】,交换机重启完毕以后,又恢复正常。起初不知道啥原因,但后果是宿主机上面的虚拟机能ping通,但使用不了,需要重启恢复正常。因为虚拟机一直能ping通,所以给openstaxk的心跳机制造成误判,以为虚拟机一直没死,但网络中断过,导致虚拟机现象就是卷找不到,所以虚拟机就必须重启以后才能恢复正常。
  • 后面总结发现原因就是宿主机上的bond0【内部通信bond,和存储通信】没有正常切换网卡,所以造成交换机重启后宿主机ping不通。
  • 解决方法:分别重启bond0的网卡后,bond0就能正常切换了。
  • 所以这里就写一个脚本,查看bond0绑定的网卡状态是否正常,什么才是bond0的网卡不正常,如下,状态为down,怎么能切换! 就是重启下面down的网卡,让其状态为up
    在这里插入图片描述

监控脚本

在这里插入图片描述

  • 说明,经测试,有2种情况
    • 一是网卡自己down了且bond0配置文件中的网卡存在且状态为down
    • 二是手动down掉bond0中的网卡,然后配置文件中的网卡就不显示了,并且ip a看到down掉的网卡状态依然为up
    • 所以上面2种情况都给监控上

脚本编写

  • 因为每台主机的网卡名称可能并不一致,所以采用脚本放本地的思路去完成,因为就需要修改网卡而已。
    所以现在先在一台上成功执行。
    脚本内容很基础,不做太多说明
[root@controller01 ~]# cat bond.sh 
#!/bin/bashecho "eno3:"
if grep -q "eno3" /proc/net/bonding/bond0 ; thenecho "/proc/net/bonding/bond0 :" `ip a | grep eno3`cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface: eno3"else
echo "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
ip a | grep eno3
echo "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"fiecho __________________________________________________________________
echo -e "\n"echo "ens6f0"if grep -q "ens6f0" /proc/net/bonding/bond0 ; thenecho "/proc/net/bonding/bond0 :" `ip a | grep ens6f0`cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface: ens6f0"else
echo "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"echo "/proc/net/bonding/bond0 :" `ip a | grep eno3`cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface: eno3"
echo "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"fiecho -e "\n"up=`cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface"  |egrep -A1 eno3 | grep MII | awk '{print $3}'`
if [ $up = "down" ] ; thenecho "eno3:"echo "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!"cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface: eno3"ip a | grep ens5f0echo "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!"else
#为up不输出内容,下面放个echo是为了不让脚本报错
echo fiecho -e "\n"up=`cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface"  |egrep -A1 ens6f0 | grep MII | awk '{print $3}'`
if [ $up = "down" ] ; thenecho "ens6f0:"echo "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!"cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface: ens6f0"ip a | grep ens6f0echo "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!"else
echo fi

脚本测试

正常场景

  • 2个网卡都正常的情况下,输出内容为下面
[root@compute31 ~]# sh bond.sh 
ens5f0:
/proc/net/bonding/bond0 : 8: ens5f0: <BROADCAST,MULTICAST,SLAVE,UP,LOWER_UP> mtu 1500 qdisc mq master bond0 state UP group default qlen 1000
Slave Interface: ens5f0
MII Status: up
__________________________________________________________________ens6f0
/proc/net/bonding/bond0 :

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/32577.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Typora最新安装教程2024

Typora是一款广受好评的跨平台Markdown编辑软件&#xff0c;支持Windows、MacOS和Linux操作系统。它的设计旨在提供一个无干扰、高效且直观的写作环境。户快速管理和查找文档&#xff0c;支持直接在软件内浏览和操作文件结构。 Typora以其简洁而强大的功能集合&#xff0c;成为…

Java模拟马尔可夫链类问题的验证

马尔可夫链&#xff08;Markov Chain, MC&#xff09;是概率论和数理统计中具有马尔可夫性质&#xff08;Markov property&#xff09;且存在于离散的指数集&#xff08;index set&#xff09;和状态空间&#xff08;state space&#xff09;内的随机过程&#xff08;stochasti…

学习笔记——路由网络基础——路由的高级特性

七、路由的高级特性 1、路由迭代(路由递归) 路由必须有直连的下一跳才能够指导转发&#xff0c;静态路由或BGP路由的下一跳可能不是直连的邻居&#xff0c;因此需要计算出一个直连的下一跳和对应的出接口&#xff0c;这个过程就叫做路由迭代(路由递归)。 添加一条去往20.1.1.…

JAVA期末复习2

目录 一、Java基础知识 1. 下面几个标识符中&#xff0c;哪些是命名正确的 (A) 2. 分析以下代码&#xff0c;哪些是合法的 (C) 3. 以下代码的执行结果是&#xff08; B &#xff09; 4. 下面哪个不是java中的关键字&#xff1f;&#xff08; B &#xff09; 5. 下面对数组…

毕业设计——可视化实验仿真平台

该程序用于毕业设计&#xff0c;架构为前后端分离技术&#xff0c;涉及技术包括vue3&#xff0c;SpringBoot&#xff0c;spring-secrity&#xff0c;Redis&#xff0c;需要者进群769119544进行相关咨询。 程序分为三个角色&#xff1a;学生、老师、管理员。使用了spring-secrit…

如何在 Android 应用中设置 `android:authorities`

在 Android 应用中设置 android:authorities 属性主要是为 ContentProvider 或 FileProvider 定义的&#xff0c;以确保这些提供者可以在应用之间或应用内部被唯一地识别。以下是如何为 FileProvider 设置 android:authorities 的步骤&#xff1a; 定义 FileProvider&#xff1…

字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

ChatGPT狂飙160天&#xff0c;世界已经不是之前的样子。 更多资源欢迎关注 在生成式模型的迅速发展中&#xff0c;Image Tokenization 扮演着一个很重要的角色&#xff0c;例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐…

Redis 学习笔记(2)

目录 1 Redis的持久化1.1 RDB持久化方案1.2 AOF持久化方案 2 Redis架构2.1 主从复制架构2.2 哨兵集群设计2.3 哨兵集群设计 3 Redis事务机制4 Redis过期策略与内存淘汰机制4.1 过期策略4.2 内存淘汰机制 5 Redis高频面试题4.1 缓存穿透4.2 缓存击穿4.3 缓存雪崩 1 Redis的持久化…

C++中的文件操作

1、文件操作 文章目录 1、文件操作1.读写TXT文件1.写文件2.读文件3.读文件的方式4.注意事项 2.读写二进制文件1.写入二进制文件2.读取二进制文件3.注意事项 1.读写TXT文件 在C中&#xff0c;读取和写入文件通常涉及到使用<fstream>库中的类&#xff0c;主要是ifstream&a…

C++STL 初阶(5)vector的简易实现(上)

不同于string只实现一个最简单的版本&#xff0c;vector在此处我们要实现的是模版类&#xff0c;类模版的声明和定义分离非常不方便&#xff08;会在链接时报错&#xff09;&#xff0c;所以我们都只在一个vector.h下去实现声明和定义。后续我们提及到的库里面实现的vector也是…

Spring框架中Bean的生命周期

Bean的生命周期通常指的是从创建到初始化&#xff0c;经过一系列的流程&#xff0c;最终销毁的过程。只不过&#xff0c;在Spring框架中&#xff0c;Bean的生命周期是由Spring IOC容器来管理的。在Spring中&#xff0c;我们定义Bean时&#xff0c;也可以自己指定初始化和销毁的…

HCIP--OSPF(笔记3)

OSPF扩展配置 手工认证 【1】接口认证 -- 直连的邻居间&#xff0c;设定认证口令&#xff0c;进行身份核实&#xff0c;同时对双方交互的数据进行加密保护 [r9-GigabitEthernet0/0/1]ospf authentication-mode md5 1 cipher 123456 邻居间认证模式、编号、密码必须完全一致 【…

python实训day2

1、 from ming import * # 有点像C语言中的头文件 """在Python开发环境中&#xff0c;封装一个函数&#xff0c;功能目标为&#xff1a;通过两个整数参数一次性获取和、差、积、商四个值 """ def calc(a, b):return a b, a - b, a * b, a / b…

apollo规划架构

算法的基本架构 我们在最开始直接给出规划决策算法架构框图&#xff0c;然后一一介绍每个框图结构的细节&#xff1a; 模块的入口是 PlanningComponent&#xff0c;在 Cyber 中注册模块&#xff0c;订阅和发布消息&#xff0c;并且注册对应的 Planning 类。Planning 的过程之前…

【SQL】DATETIME 和 TIMESTAMP 的区别

在 SQL 中&#xff0c;DATETIME 和 TIMESTAMP 是用于存储日期和时间数据的两种数据类型&#xff0c;但它们在存储范围、时区处理和使用场景上有显著区别。以下是详细的解释&#xff1a; 1. DATETIME 定义: DATETIME 类型用于存储日期和时间&#xff0c;精度为秒。格式: YYYY-…

三生随记——时间的诅咒

深夜&#xff0c;月光透过薄雾洒落在小镇的古老街道上。风轻轻吹过&#xff0c;带起一阵阵阴凉的气息。小镇的居民早已沉睡&#xff0c;只有偶尔传来的狗吠声打破了夜的寂静。 在这个小镇上&#xff0c;有一个叫做李明的年轻人。他有一块非常特别的手表&#xff0c;这块手表是他…

Python协程探秘:async/await的魔法

Python协程探秘&#xff1a;async/await的魔法 在Python的并发编程世界中&#xff0c;协程&#xff08;Coroutines&#xff09;和async/await关键字正逐渐崭露头角&#xff0c;它们提供了一种高效、轻量级的并发解决方案。本文将深入解释协程的概念&#xff0c;探讨async/awai…

网络技术原理需要解决的5个问题

解决世界上任意两台设备时如何通讯的&#xff1f;&#xff1f; 第一个问题&#xff0c;pc1和pc3是怎么通讯的&#xff1f; 这俩属于同一个网段&#xff0c;那么同网段的是怎么通讯的&#xff1f; pc1和pc2属于不同的网段&#xff0c;第二个问题&#xff0c;不同网段的设备是…

敏捷开发笔记(第7章节)--什么是敏捷设计

目录 1&#xff1a;PDF上传链接 7.1: 软件出了什么错 7.2: 设计的臭味--腐化软件的气味 7.2.1: 什么激化了软件的腐化 7.2.2: 敏捷团体不允许软件腐化 7.3: “copy”程序 1: 初始设计 2: 需求在变化 3: 得寸进尺 4: 期望变化 7.3.1: “copy”程序的敏捷设计 7.3.2:…

leetcode 二分查找·系统掌握 有效的完全平方数

题目&#xff1a; 题解&#xff1a; 就是一个非常普通的二分查找&#xff0c;但是需要注意的是查找的上下界&#xff0c;因为是完全平方&#xff0c;所以可以把上界设为这个数的一半&#xff0c;但是要特殊处理num等于1的时候。 bool isPerfectSquare(int num) {if(num1)retur…