Linux ❀ 磁盘IO较大故障告警排查确认方法

文章目录

  • 1、iotop
  • 2、iostat
  • 3、磁盘压力测试

问题描述:在日常运维工作中,经常会遇到Linux服务器出现Disk磁盘I/O( I/O 英文全称是 Input/Output,中文译为 输入与输出,通常指存储器与其他设备之间的数据交换操作)过大告警问题需要紧急处理,本文将详细介绍此问题的排查方法与技巧。

1、iotop

iotop是一个用来监视磁盘I/O使用状况的top类工具。iotop具有与top相似的UI回显,其中包括PID、用户、I/O、进程等相关信息。

# 只显示IO操作进程,查看哪些进程正在使用磁盘进度读写操作,以进程维度分析最高IO原因
$ iotop -ob

在这里插入图片描述

2、iostat

iostat功能是用于监视系统I/O设备使用情况。

$ iostat -xm 1

在这里插入图片描述

  • CPU属性 avg-cpu
    • %user:CPU处在用户模式下的时间百分比
    • %nice:CPU处在带NICE值的用户模式下的时间百分比
    • %system:CPU处在系统模式下的时间百分比
    • %iowait:CPU等待输入输出完成时间的百分比
    • %steal:管理程序维护另一个虚拟处理器时,虚拟CPU的无意识等待时间百分比
    • %idle表示磁盘在1秒内空闲的时间占总时间的百分比。也就是说,数值越高,表示磁盘的空闲时间越多,负载越轻,性能越好;数值越低,表示磁盘的空闲时间越少,负载越重,性能越差;%idle是评估磁盘负载和性能的重要指标之一
  • 磁盘属性:
    • Device:磁盘设备名称
    • rrqm/s:每秒合并的读请求次数
    • wrqm/s:每秒合并的写请求次数
    • r/s:每秒完成的读次数
    • w/s:每秒完成的写次数
    • rkB/s:每秒读取的数据量(单位为KB)
    • wkB/s:每秒写入的数据量(单位为KB)
    • avgrq-sz:平均每个请求的扇区数。
    • avgqu-sz:平均请求队列长度
    • await平均每个请求的等待时间(毫秒)
    • r_await:平均每个读请求的等待时间(毫秒)
    • w_await:平均每个写请求的等待时间(毫秒)
    • svctm:平均每个请求的服务时间(毫秒)
    • %util磁盘利用率,磁盘在1秒钟内的忙碌时间占总时间的百分比,该值只代表持续写入的时间在1s内的占比,并不能体现出磁盘写入的大小,数值越高,表示磁盘的写入时间越高;数值越低,表示磁盘的空闲时间越多

注意点:目前市面上较多的告警规则都使用iostat命令的%util利用率取值,该值的磁盘IO信息反馈并不准确,不能体现出磁盘的写入速率大小,只反应出写入时间占比。例如:某个磁盘/dev/sda1在1s内持续写入1b/s,此时%util数值为100%,必然触发告警,但现网中并没有高额的数据写入,因此只能判断为误报。若需要继续判断磁盘是否存在异常需要进行压力测试,使用下面方法即可。

3、磁盘压力测试

# 测试写入1G文件速度
$ dd if=/dev/zero of=${dst_file_path}/test bs=1M count=1000 oflag=direct
# 在目标文件目录下创建一个名为test的文件(可根据现场环境自行修改目标路径),总计大小为1000MB,即1GB(块大小设置为1M,数量为1000)

最终确认磁盘写入速率正常,此告警忽略即可。
在这里插入图片描述
耗时:7.70452 s, 写入速度:136 MB/s

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/101437.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Rn使用FlatList导航栏自动回到中间

import { useState, useRef } from react import { FlatList, View, Text, StyleSheet, TouchableOpacity } from react-nativeconst Center () > {const tabs ["语文", "数学", "英语", "政治", "历史", "地理&q…

工学云打卡签到自动实现关于异地时定位的问题解决|蘑菇钉

工学云打卡助手,能解决你在异地时每天不间断签到的问题,仔细看图哦 1.自动签到 2.自定义打卡地区 3.生成日周月报与总结自动发表 4.支持随机通用内容 5.支持打卡结果推送 你是否曾经因为缺乏自律而无法坚持学习目标?是否曾经因为无法衡量…

C++: 继承

学习目标 1.继承的概念及定义 2.基类和派生类对象赋值转换(切片) 3.继承中的作用域(隐藏/重定义) 4.派生类的默认成员函数 5.继承与友元 6.继承与静态成员 7.菱形继承与菱形虚拟继承 8.总结 1.继承的概念及定义 1.1概念 继承: 它允许你创建一个新的类(称为子类或派…

数据结构之堆的实现

首先我们要想堆应该用什么实现,我们这里可以使用数组,因为每一层的数是有限个的,所以我们可以很容易将数的每一个位置对应到数组中去。 那我们就可以仿照顺序表写出我们的结构。 然后我们要考虑我们要实现哪些函数。 最基本的功能初始化和销…

rabbitmq查看节点信息命令失败

不影响访问rabbitmq,但是无法使用 命令查看节点信息 等 查看节点信息命令:rabbitmq-diagnostics status --node rabbitJHComputer Error: unable to perform an operation on node ‘rabbitJHComputer‘. Please see diagnostics informatio rabbitmq-…

ssm+vue的台球厅管理系统(有报告)。Javaee项目,ssm vue前后端分离项目。

演示视频: ssmvue的台球厅管理系统(有报告)。Javaee项目,ssm vue前后端分离项目。 项目介绍: 采用M(model)V(view)C(controller)三层体系结构,通过Spring S…

服务器数据恢复-V7000存储2块磁盘故障脱机的数据恢复案例

服务器数据恢复环境: P740AIXSybaseV7000存储,存储阵列柜上共12块SAS机械硬盘(其中一块为热备盘)。 服务器故障: 存储阵列柜中有磁盘出现故障,工作人员发现后更换磁盘,新更换的磁盘数据同步到40…

遥感云大数据在灾害、水体与湿地领域典型案 例实践及 GPT 模型应用

近年来遥感技术得到了突飞猛进的发展,航天、航空、临近空间等多遥感平台不断增加,数据的空间、时间、光谱分辨率不断提高,数据量猛增,遥感数据已经越来越具有大数据特征。遥感大数据的出现为相关研究提供了前所未有的机遇&#xf…

Vue3 + Ts实现NPM插件 - 定制loading

目录 你的 Loading🤖 安装🛹 简介苍白请 您移步文档:✈️ 使用方法🛠️ 配置 loading 类型🎲 定制 loading 色彩 💡 注意事项 前期回顾 你的 Loading 开箱即可用的 loading, 说明:vu…

基于多线程的Reactor模式的 回声服务器 EchoServer

记录下 一个线程专门用来接受accept获取客户端的fd 获取fd之后 从剩余的执行线程中 找到一个连接客户端数量最少的线程 然后将客户端的fd加入到这个线程中并通过EPOLL监听这个fd 线程之间通过eventfd来通信 将客户端的fd传到 对应的线程中 参考了MediaServer 引入…

【Vue面试题十七】、你知道vue中key的原理吗?说说你对它的理解

文章底部有个人公众号:热爱技术的小郑。主要分享开发知识、学习资料、毕业设计指导等。有兴趣的可以关注一下。为何分享? 踩过的坑没必要让别人在再踩,自己复盘也能加深记忆。利己利人、所谓双赢。 面试官:你知道vue中key的原理吗…

关于网络协议的若干问题(二)

1、网络号、IP 地址、子网掩码和广播地址的先后关系是什么? 答:当在一个数据中心或者一个办公室规划一个网络的时候,首先是网络管理员规划网段,一般是根据将来要容纳的机器数量来规划,一旦定了,以后就不好…

Soul CEO张璐团队以用户安全为核心,探索社交平台安全治理新路径

“认同感”,是现代年轻人当下的核心社交需求之一,作为年轻人喜爱的新型开放式社交平台,Soul APP为年轻人们提供了一个自在表达、轻松互动的平台,为用户带来了志趣相投、精神共鸣的高质量网络连接。在Soul日活近千万的用户中,超过七成为Z世代年轻群体,如何能够为Z世代提供更安全…

ArcGIS/GeoScene脚本:基于粒子群优化的支持向量机回归模型

参数输入 1.样本数据必须包含需要回归的字段 2.回归字段是数值类型 3.影响因子是栅格数据,可添加多个 4.随机种子可以确保每次运行的训练集和测试集一致 5.训练集占比为0-1之间的小数 6.迭代次数:迭代次数越高精度越高,但是运行时间越长…

NodeJs内置模块child_process

内置模块child_process子进程 写在前面 子进程是Nodejs的核心Api,如果你会shell命令,它会有非常大的帮助,或者你喜欢编写前端工程化工具之类,它也有很大的用处,以及处理CPU密集型应用。 创建子进程 Nodejs创建子进…

ACL访问控制列表的解析和配置

ACL的解析 个人简介 ACL - Access Control List 访问控制列表 策略 ------行为 允许/拒绝 ACL --包含两种 标准ACL 扩展ACL 标准ACL:只能针对源IP地址做限制 针对路由条目的限制 -路由策略 思科编号:1-99之间或1300-1999 扩展ACL:针对…

python每日一练(5)

🌈write in front🌈 🧸大家好,我是Aileen🧸.希望你看完之后,能对你有所帮助,不足请指正!共同学习交流. 🆔本文由Aileen_0v0🧸 原创 CSDN首发🐒 如…

黑马点评-06缓存雪崩问题(大量key失效)及其解决方案

缓存雪崩问题(大量key失效) 解决方案 缓存雪崩是指在同一时段大量的缓存key同时失效或者Redis服务宕机,导致大量请求到达数据库给服务器带来巨大压力 当我们批量导入缓存数据的时候可以给不同的Key的TTL添加随机值,让其在不同时间段分批失效利用Redis集群提高服务的可用性 使…

点云模板匹配

点云模板匹配是一种在点云数据中寻找特定形状或模式的方法。它通常用于计算机视觉和三维图像处理中,可以应用于物体识别、姿态估计、场景分析等任务。点云模板匹配的基本思想是将一个称为模板的小点云形状与输入的大点云进行匹配,以找到最佳的对应关系。…

Python笔记;库,包,模块

在Python中库没有官方说法。 是其他地方沿用过来的。 姑且认为他是一个包或多个包的集合。 包里有子包和模块。 模块以.py格式存储。 下图是一个例子,对于Robot包: import math a math.sqrt(9) 等价于 from math import * a sqrt(9) from math im…