CentOS 系统监控项

在维护和优化 CentOS 系统时,实时监控硬件和资源的使用情况非常重要。为了满足工作需要,可以定时采集 CentOS 系统相关的监控数据,并将其推送到 Prometheus 进行集中监控和管理。以下是日常采集项及对应的 shell 命令,并附上每项命令的输出解释。

1. CPU 使用情况

监控 CPU 使用情况可以帮助我们了解系统的负载和性能瓶颈。

  • 采集命令:
    top -b -n1 | grep "Cpu(s)"
    
    输出:
    %Cpu(s):  1.6 us,  1.6 sy,  0.0 ni, 96.8 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
    
    解释:
    • us: 用户空间占用 CPU 百分比(1.6%)
    • sy: 内核空间占用 CPU 百分比(1.6%)
    • ni: 改变过优先级的进程占用 CPU 百分比(0.0%)
    • id: 空闲时间占用 CPU 百分比(96.8%)
    • wa: 等待 I/O 操作占用 CPU 百分比(0.0%)
    • hi: 硬中断占用 CPU 百分比(0.0%)
    • si: 软中断占用 CPU 百分比(0.0%)
    • st: 被虚拟化系统“偷走”的时间占用 CPU 百分比(0.0%)
2. 内存使用情况

监控内存使用情况可以避免系统因为内存不足而崩溃。

  • 采集命令:
    free -m
    
    输出:
                 total        used        free      shared  buff/cache   available
    Mem:          15866        2833        4773         844        8259       11857
    Swap:          2047           0        2047
    
    解释:
    • total: 总内存(15866 MB)
    • used: 已使用内存(2833 MB)
    • free: 可用内存(4773 MB)
    • shared: 共享内存(844 MB)
    • buff/cache: 缓存内存(8259 MB)
    • available: 可用内存(11857 MB)
    • Swap: 交换分区信息(总量 2047 MB,已使用 0 MB,可用 2047 MB)
3. 磁盘使用情况

监控磁盘使用情况可以预防磁盘空间耗尽的问题。

  • 采集命令:
    df -h
    
    输出:
    文件系统                 容量  已用  可用 已用% 挂载点
    devtmpfs                 7.8G     0  7.8G    0% /dev
    tmpfs                    7.8G   28K  7.8G    1% /dev/shm
    tmpfs                    7.8G  747M  7.1G   10% /run
    tmpfs                    7.8G     0  7.8G    0% /sys/fs/cgroup
    /dev/mapper/centos-root  197G   32G  166G   17% /
    /dev/sda1               1014M  239M  776M   24% /boot
    tmpfs                    1.6G     0  1.6G    0% /run/user/0
    
    解释:
    • 容量: 总磁盘空间
    • 已用: 已使用磁盘空间
    • 可用: 可用磁盘空间
    • 已用%: 已使用百分比
    • 挂载点: 磁盘分区挂载点
4. 磁盘 I/O

监控磁盘 I/O 性能,可以了解系统的读写速度和 I/O 瓶颈。

  • 采集命令:
    yum -y install sysstat
    sudo systemctl enable sysstat
    sudo systemctl start sysstat
    iostat
    
    输出:
    Linux 3.10.0-1160.118.1.el7.x86_64 (ops-gy-x86)         2024年07月10日  _x86_64_        (4 CPU)avg-cpu:  %user   %nice %system %iowait  %steal   %idle0.55    0.00    0.51    0.00    0.00   98.94Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
    scd0              0.00         0.00         0.00       1028          0
    sda               1.64         2.03        84.57    3713310  154970876
    dm-0              1.74         2.01        84.55    3690529  154923178
    dm-1              0.00         0.00         0.00       3236          0
    
    解释:
    • tps: 每秒传输次数(包括读写)
    • kB_read/s: 每秒读取的千字节数
    • kB_wrtn/s: 每秒写入的千字节数
    • kB_read: 总读取的千字节数
    • kB_wrtn: 总写入的千字节数
5. 网络使用情况

监控网络使用情况,可以确保网络连接的稳定性和流量的健康状况。

  • 采集命令:
    netstat -i
    
    输出:
    Kernel Interface table
    Iface             MTU    RX-OK RX-ERR RX-DRP RX-OVR    TX-OK TX-ERR TX-DRP TX-OVR Flg
    br-5ed7a40877ed  1500        0      0      0 0             0      0      0      0 BMU
    br-7c60a2b8b408  1500        0      0      0 0             0      0      0      0 BMU
    docker0          1500        0      0      0 0             0      0      0      0 BMU
    ens33            1500 76085290      0      0 0      73441235      0      0      0 BMRU
    lo              65536 240163662      0      0 0      240163662      0      0      0 LRU
    
    解释:
    • Iface: 网络接口
    • MTU: 最大传输单元
    • RX-OK: 接收的正确数据包数
    • RX-ERR: 接收错误的数据包数
    • RX-DRP: 接收丢弃的数据包数
    • RX-OVR: 接收溢出数据包数
    • TX-OK: 发送的正确数据包数
    • TX-ERR: 发送错误的数据包数
    • TX-DRP: 发送丢弃的数据包数
    • TX-OVR: 发送溢出数据包数
    • Flg: 接口标志
6. 系统负载

监控系统的整体负载情况,了解系统的压力和性能瓶颈。

  • 采集命令:
    uptime
    
    top -b -n1 | grep "load average"
    
7. 系统日志

监控系统日志,可以帮助我们发现潜在的问题和错误。

  • 采集命令:
    tail -f /var/log/messages
    
    tail -f /var/log/syslog
    
8. 进程监控

监控系统中的进程,了解哪些进程占用了大量资源。

  • 采集命令:
    按照内存占用排序:
    ps aux --sort=-%mem | head
    
    按照 CPU 占用

排序:

ps aux --sort=-%cpu | head
9. 系统版本

了解系统版本可以帮助我们确定系统的具体配置和兼容性。

  • 采集命令:
    cat /etc/centos-release
    
    uname -a
    
10. CPU 信息

采集 CPU 信息有助于了解系统的计算能力和性能指标。

  • 采集命令:
    cat /proc/cpuinfo
    
11. 内存信息

采集内存信息可以帮助我们了解系统的内存配置和可用情况。

  • 采集命令:
    cat /proc/meminfo
    
12. 磁盘信息

了解磁盘信息有助于我们掌握系统的存储容量和分区情况。

  • 采集命令:
    df -h
    
13. 文件系统信息

采集文件系统信息可以帮助我们了解系统的文件系统类型和挂载点。

  • 采集命令:
    mount | column -t
    
14. 网络接口信息

采集网络接口信息有助于了解系统的网络配置和状态。

  • 采集命令:
    ifconfig -a
    
15. 系统启动时间

了解系统的启动时间可以帮助我们评估系统的运行时间和稳定性。

  • 采集命令:
    uptime
    
    who -b
    
16. 已安装软件包列表

采集已安装的软件包列表有助于了解系统的应用环境和依赖关系。

  • 采集命令:
    rpm -qa
    

结论

通过上述命令,您可以全面地监控 CentOS 系统的硬件和资源使用情况。这些命令不仅有助于系统的维护和优化,还可以为系统的扩展和升级提供重要参考。结合 Prometheus+Grafana,可以实现集中化界面监控和管理,及时发现并解决潜在的问题,提高系统的稳定性和性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/46282.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在 PostgreSQL 里如何实现数据的分布式事务的回滚和补偿机制?

🍅关注博主🎗️ 带你畅游技术世界,不错过每一次成长机会!📚领书:PostgreSQL 入门到精通.pdf 文章目录 在 PostgreSQL 里如何实现数据的分布式事务的回滚和补偿机制一、分布式事务的概念与挑战(一…

STM32智能农田监测系统教程

目录 引言环境准备智能农田监测系统基础代码实现:实现智能农田监测系统 4.1 数据采集模块 4.2 数据处理与分析模块 4.3 通信与网络系统实现 4.4 用户界面与数据可视化应用场景:农田监测与管理问题解决方案与优化收尾与总结 1. 引言 智能农田监测系统通…

【LeetCode 链表合集】

文章目录 1. LeetCode 206 反转链表2. NC40 链表相加 1. LeetCode 206 反转链表 题目链接🔗 解题思路: 🔍 🐧创建一个新的节点,使用链表头插的方法; 2. NC40 链表相加 题目链接🔗 解题思路…

WPF MVVM框架 Caliburn.Micro的Action绑定

WPF MVVM框架 Caliburn.Micro的Action绑定 通过命名约定来绑定Action View <Window x:Class"WpfApp1.Views.AboutView"xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x"http://schemas.microsoft.com/winfx/2006/xaml…

spring boot 基础特性

Spring Boot 特性&#xff1a; SpringBoot Starter&#xff08;场景启动器&#xff09;&#xff1a;将常用的依赖分组进行了整合&#xff0c;将其合并到一个依赖中&#xff0c;这样就可以一次性添加到项目的Maven或Gradle构建中。使编码变得简单&#xff0c;SpringBoot采用 Ja…

Meta的元宇宙愿景:技术战略与AI的融合未来

Meta作为科技界的领军企业&#xff0c;其在元宇宙领域的战略布局和未来展望一直是行业关注的焦点。Meta的CTO Andrew Bosworth&#xff08;博斯沃思&#xff09;最近详细阐述了公司的元宇宙战略、XR眼镜的市场突破以及AI时代的发展蓝图。 一、元宇宙战略&#xff1a;定义三个时…

Django 删除所有数据

1&#xff0c;添加模型 Test/app11/models.py from django.db import modelsclass Post(models.Model):title models.CharField(max_length200)content models.TextField()pub_date models.DateTimeField(date published)class Book(models.Model):title models.CharFiel…

【java深入学习第5章】Spring Boot 统一功能的实现及处理方式

Spring Boot 统一功能处理 在开发 Web 应用程序时&#xff0c;为了提高代码的可维护性和可扩展性&#xff0c;我们通常会采用一些统一的功能处理方式。本文将介绍如何在 Spring Boot 中实现统一的数据返回格式、异常处理和功能处理&#xff0c;并通过一个图书管理系统的案例来…

论文翻译:Rethinking Interpretability in the Era of Large Language Models

https://arxiv.org/abs/2402.01761 在大型语言模型时代的可解释性再思考 摘要 在过去十年中&#xff0c;随着越来越大的数据集和深度神经网络的兴起&#xff0c;可解释机器学习领域的兴趣迅速增长。同时&#xff0c;大型语言模型&#xff08;LLMs&#xff09;在广泛的任务中…

k8s之client-go:golang与k8s交互的桥梁

文章目录 前言示例总结 前言 k8s是一个非常成熟且强大的容器自动化编排引擎&#xff0c;对于这样一个利器&#xff0c;k8s官方提供了clientgo用来给我们使用golang去接入k8s&#xff0c;通过k8s的api来对k8s中的资源进行操作 通过client-go实现对k8s集群中资源对象(包括deploy…

TypeScript 基础类型(一)

简介 它是 JavaScript 的超集&#xff0c;具有静态类型检查和面向对象编程的特性。TypeScript 的出现&#xff0c;为开发者提供了一种更加严谨和高效的开发方式。 主要特点&#xff1a; 、静态类型检查。 通过静态类型检查&#xff0c;开发者可以在编译时发现错误&#xff0…

QQ频道导航退出

若该文为原创文章&#xff0c;转载请注明原文出处 本文章博客地址&#xff1a;https://hpzwl.blog.csdn.net/article/details/140413538 长沙红胖子Qt&#xff08;长沙创微智科&#xff09;博文大全&#xff1a;开发技术集合&#xff08;包含Qt实用技术、树莓派、三维、OpenCV…

Jquery常用操作汇总,dom操作,ajax请求

这段时间在写一些小Demo&#xff0c;用的都是很远古的Jquery,哈哈哈&#xff0c;但是呢也挺好玩儿的。想着记录一下。 题外话&#xff1a;补充一些自己欠缺的前端知识&#xff0c;&#xff08;我的前端学的比较乱&#xff0c;哈哈哈&#xff0c;原生的js不是很熟&#xff0c;&a…

链表的回文结构(链表的中间节点+反转链表)

链表的回文结构 一.链表的中间节点思路1&#xff1a;暴力求解思路2&#xff1a;快慢指针 二.返回倒数第k个节点思路1&#xff1a;暴力求解思路2&#xff1a;快慢指针 三.反转链表思路1&#xff1a;头插法思路2&#xff1a;反转指针的指向 四.链表的回文结构思路1&#xff1a;利…

「C++系列」一篇文章讲透【运算符】

文章目录 一、运算符1. 算术运算符2. 关系运算符3. 逻辑运算符4. 位运算符5. 赋值运算符6. 条件运算符&#xff08;三元运算符&#xff09;7. 成员访问运算符8. 指针和地址运算符9. 类型转换运算符10. 其他运算符 二、其他特殊运算符1. 成员访问运算符2. 指针和地址运算符3. 类…

Laravel入门:快速启动你的第一个应用

当然&#xff01;下面是关于如何使用Laravel快速启动你的第一个应用的教程。 Laravel入门&#xff1a;快速启动你的第一个应用 1. 简介 Laravel是一个现代化的PHP框架&#xff0c;以其优雅的语法和丰富的功能广受欢迎。本教程将引导你从零开始创建一个简单的Laravel应用。 2…

python的自省机制(改bug有用)

在 Python 中&#xff0c;自省&#xff08;Introspection&#xff09;机制是指程序在运行时能够获取自身的信息&#xff0c;例如对象的类型、属性、方法等。 Python 提供了一些内置函数和特殊属性来支持自省。以下是一些常见的例子&#xff1a; type() 函数&#xff1a;返回对象…

Prometheus 云原生 - 监控 Linux、MySQL、Redis、RabbitMQ、Docker、SpringBoot 3.x

目录 开始 Exporter 采集数据&#xff0c;Prometheus 拉取并监控 Linux MySQL Redis RabbitMQ Docker SpringBoot 3.x 开始 Exporter 采集数据&#xff0c;Prometheus 拉取并监控 Note&#xff1a;Prometheus 和 Grafana 的部署已经在前面的章节中讲过了&#xff0c;不…

Solana Blink和SEND的崛起:技术与市场效应的结合

随着Solana生态系统的不断发展&#xff0c;新的项目和技术不断涌现&#xff0c;吸引了大量的关注和投资。最近&#xff0c;Solana的Blink项目及其相关的SEND代币成为了市场的焦点&#xff0c;引发了广泛的讨论和投资热潮。本文将探讨Blink和SEND的技术创新、市场表现以及未来的…

C++中的自定义数据类型:类和结构体

目录 自定义数据类型(1)类A.面向对象的四大特征B.What&#xff08;什么是类&#xff09;C.Why&#xff08;类的作用&#xff09;D.How&#xff08;如何定义和使用类&#xff09; (2)结构体 自定义数据类型 (1)类 A.面向对象的四大特征 谈到类&#xff0c;就必须讲一下面向对…