在Centos中安装、配置与使用atop监控工具

目录

  • 前言
  • 1. atop工具的安装
    • 1.1 atop简介
    • 1.2 atop的安装步骤
  • 2. 安装并配置netatop模块
    • 2.1 安装内核开发包
    • 2.2 安装所需依赖
    • 2.3 下载netatop
    • 2.4 解压并安装netatop
    • 2.5 启动netatop
  • 3. atop的配置与使用
    • 3.1 配置监控周期与日志保留时间
    • 3.2 设置定时任务生成日志
    • 3.3 启动与查看atop服务状态
  • 4. 分析atop日志
    • 4.1 atop日志分析命令
    • 4.2 atop常用快捷键说明
  • 5. atop输出的关键指标
  • 结语

前言

在日常运维中,系统性能监控是保持服务器稳定运行的关键。特别是在企业环境中,保障服务稳定、高效地运行对业务至关重要。atop作为一款功能强大的Linux系统监控工具,能够详细报告系统资源和各进程的使用情况,从而帮助管理员快速定位并解决问题。本文将介绍如何在Centos中安装、配置并使用atop监控工具,包括网络监控模块netatop的安装及使用,帮助您在Centos中实现系统性能的全面监控。

1. atop工具的安装

1.1 atop简介

atop是一款用于监控Linux系统资源的工具,能够详细报告所有进程的活动,并以日志文件的形式保存这些信息。其监控内容涵盖了CPU、内存、磁盘、网络的使用情况,甚至可以查看进程的详细资源使用情况,如CPU使用率、内存占用、磁盘读写等。atop的优势在于其能够长期记录系统的性能情况,即使系统或进程发生了崩溃,也可以通过atop日志进行问题分析。

1.2 atop的安装步骤

在Linux环境下,atop的安装非常简单,您可以通过如下命令进行安装:

sudo yum install atop

安装完成后,atop便可以立即用于监控系统的实时性能。对于监控网络使用情况,atop提供了额外的netatop模块,支持实时查看每个进程的网络流量信息。接下来,我们将详细介绍如何安装和配置netatop模块。

2. 安装并配置netatop模块

2.1 安装内核开发包

在安装netatop之前,首先需要安装内核开发包,这是为了确保系统具备编译所需的环境。执行以下命令安装内核开发包:

sudo yum install kernel-devel-$(uname -r)

该命令根据当前正在使用的内核版本,自动匹配对应的开发包进行安装。

2.2 安装所需依赖

netatop还依赖于elfutils-libelf-devel包,您可以通过以下命令安装该依赖:

sudo yum install elfutils-libelf-devel

2.3 下载netatop

接下来,下载netatop的安装包,具体操作如下:

sudo wget https://www.atoptool.nl/download/netatop-3.1.tar.gz --no-check-certificate

此命令将从官方源下载最新的netatop安装包。

2.4 解压并安装netatop

下载完成后,解压安装包:

tar -zxvf netatop-3.1.tar.gz

解压后,切换到解压的目录:

cd netatop-3.1

然后,编译并安装netatop:

sudo make && sudo make install

2.5 启动netatop

最后,启动netatop服务,确保其开始工作:

sudo systemctl start netatop

至此,您已成功安装并启动netatop模块,接下来可以配合atop工具实时监控网络使用情况。

3. atop的配置与使用

3.1 配置监控周期与日志保留时间

默认情况下,atop每600秒采集一次系统信息,日志保留时间为28天。这些配置可能并不适合您的实际需求,因此需要手动修改配置文件。

  • 执行以下命令打开atop配置文件:

    sudo vim /etc/sysconfig/atop
    
  • 进入文件后,按下i进入编辑模式,并进行如下配置修改:

  • 将监控周期LOGINTERVAL修改为30秒。

  • 将日志保留时间LOGGENERATIONS设置为7天。

  • 确保日志文件的路径为/var/log/atop

最终配置如下:

LOGOPTS=""
LOGINTERVAL=30
LOGGENERATIONS=7
LOGPATH=/var/log/atop

Esc键,输入:wq保存并退出编辑。

3.2 设置定时任务生成日志

为保证日志每天生成一次,您可以通过cron任务设置自动重启atop服务。执行以下命令进入crontab配置:

crontab -e

在文件末尾添加以下任务:

0 0 * * * sudo systemctl restart atop

该配置将每天0点自动重启atop服务,确保日志生成。

3.3 启动与查看atop服务状态

配置完成后,您需要重启atop服务以应用配置:

sudo systemctl restart atop

随后,您可以通过以下命令检查服务状态是否正常运行:

sudo systemctl status atop

如果服务正常,输出中将显示active (running)状态。

4. 分析atop日志

4.1 atop日志分析命令

atop启动后,会在/var/log/atop目录中生成日志文件。要查看特定时间点的日志,您可以使用如下命令:

atop -r /var/log/atop/atop_2024XXXX

其中,2024XXXX代表日志文件的日期。打开日志后,可以通过不同的快捷键筛选和查看感兴趣的系统信息。
在这里插入图片描述

4.2 atop常用快捷键说明

  • g:切换回默认的综合输出视图。
  • c:显示进程的完整命令行信息。
  • m:按内存使用率对进程进行排序。
  • d:按磁盘使用率对进程进行排序。
  • n:按网络使用率对进程进行排序。
    在这里插入图片描述

这些快捷键能帮助您快速过滤出关键信息,例如内存占用过多的进程或网络流量异常的服务,从而进行深入分析。

5. atop输出的关键指标

在atop日志中,有几行关键信息值得关注:

  • PRC行:显示进程运行情况,包括进程数、运行中进程数、睡眠进程数和僵尸进程数。
  • CPU行:展示CPU的整体使用情况,包括用户态、内核态以及空闲时间等。
  • MEM行:显示系统的内存占用情况,如空闲内存、缓存内存和已使用的内存。
  • DSK行:展示磁盘的使用情况,如读写操作的频率和磁盘的忙碌程度。
  • NET行:用于监控网络流量,包含每个网络接口的发送和接收数据量。

这些指标能帮助管理员快速了解系统资源的使用情况,从而定位瓶颈或异常点。

结语

通过本文,您学会了如何在Linux实例中安装、配置并使用atop工具进行系统监控。atop的强大功能使其成为处理系统性能问题的利器,特别是在面对ECS实例异常时,atop生成的日志可以为故障排查提供关键依据。通过合理的配置与使用,您可以充分利用atop和netatop的监控能力,确保系统资源的合理分配和使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/56581.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ROS理论与实践学习笔记——5 ROS机器人系统仿真之URDF(Unified Robot Description Format)语法详解

URDF 文件是一个标准的 XML 文件格式,用于在 ROS 中描述机器人模型的结构。URDF 通过预定义的一系列标签,简洁地表达机器人的组成和运动关系。虽然机器人模型可能非常复杂,但在 URDF 中可以主要简化为两个核心部分: 连杆&#xff…

Linux——echo-tail-重定向符

echo命令 类似printf 输出,最好加“ ” echo "hello Linux" 反引号 ‘ ’ 引用命令 echo ‘ pwd ’ 重定向符 > 和 >> > 覆盖 >> 追加 tail命令 查看文件尾部内容,追踪文件最新更改 tail -num 从尾部往上读num行&#…

九大排序之选择排序和归并排序

1.前言 每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完 。 本章重点: 堆排序和选择排序和归并排序 2.选择排序 基本思路 left和right记录区间的左端和右…

Centos7 搭建单机elasticsearch

以下是在 CentOS 7 上安装 Elasticsearch 7.17.7 的完整步骤:(数据默认保存在/var/lib/elasticsearch下,自行更改) 一、装 Java 环境 Elasticsearch 是用 Java 编写的,所以需要先安装 Java 运行环境。 检查系统中是…

pdf怎么删除多余不想要的页面?删除pdf多余页面的多个方法

pdf怎么删除多余不想要的页面?在日常办公或学习中,我们经常会遇到需要处理PDF文件的情况。PDF文件因其格式稳定、不易被篡改的特点而广受青睐,但在编辑方面却相对不如Word等文档灵活。有时,在接收或创建的PDF文件中,可…

OceanBase 的写盘与传统数据库有什么不同?

背景 在数据库开发过程中,“写盘”是一项核心操作,即将内存中暂存的数据安全地转储到磁盘上。在诸如MySQL这样的传统数据库管理系统中,写盘主要有以下几步:首先将数据写入缓存池;其次,为了确保数据的完整性…

利用Spring Boot构建大创项目资源规划平台

6系统测试 6.1概念和意义 测试的定义:程序测试是为了发现错误而执行程序的过程。测试(Testing)的任务与目的可以描述为: 目的:发现程序的错误; 任务:通过在计算机上执行程序,暴露程序中潜在的错误。 另一个…

Linux的zookeeper安装部署

1.zookeeper是一个分布式的,开放源码的分布式应用程序协调服务,是hadoop和HBASE的重要组件 2.下载zookeeper安装包zookeeper安装包https://archive.apache.org/dist/zookeeper/zookeeper-3.5.9/ 移动到Linux解压 解压到/export/server文件夹 命令: tar -xvf apache-zooke…

【前端】如何制作一个自己的网页(6)

接上文 网络中的图片 我们也可以在百度等网站搜索自己喜欢的图片。 此时对图片点击右键,选择【复制图片地址】,即可获得该图片的网络地址。 其实在HTML中,除了图片以外,我们还可以利用地址找到另一个网页。 如右图所示&#…

spring/springboot获取resource目录下的文件

1.正常情况springbot项目的resource目录下会反正项目使用到的很多文件所以这里编写一个读取demo目录如下图所示 2.复制代码直接运行 import org.springframework.core.io.ClassPathResource; import java.nio.file.Files; import java.util.stream.Stream;/*** spring/spring…

第十四章 RabbitMQ延迟消息之延迟队列

目录 一、引言 二、死信队列 三、核心代码实现 四、运行效果 五、总结 一、引言 什么是延迟消息? 发送者发送消息时指定一个时间,消费者不会立刻收到消息,而是在指定时间后收到消息。 什么是延迟任务? 设置在一定时间之后才…

深入探讨C++多线程性能优化

深入探讨C多线程性能优化 在现代软件开发中,多线程编程已成为提升应用程序性能和响应速度的关键技术之一。尤其在C领域,多线程编程不仅能充分利用多核处理器的优势,还能显著提高计算密集型任务的效率。然而,多线程编程也带来了诸…

大模型微调实战指南:从零开始手把手教你微调大模型

文末有福利! 今天分享一篇技术文章,你可能听说过很多大模型的知识,但却从未亲自使用或微调过大模型。 今天这篇文章,就手把手带你从零微调一个大模型。 大模型微调本身是一件非常复杂且技术难度很高的任务,因此本篇…

为什么在Anaconda中会报错‘chcp‘ 不是内部或外部命令,也不是可运行的程序 或批处理文件?

首先,我们需要知道,这意味着chcp 命令在系统路径中找不到。chcp(Change Code Page)是一个Windows命令行工具,用于查看或设置活动控制台窗口的代码页。 经过统计整合了一些原因如下: 1.系统环境变量被错误地修改 可能导致系统命…

【closerAI ComfyUI】真人秒变卡通,相似度爆表!炫酷工作流,让你的卡通写真秒变朋友圈焦点!快来试试吧!

【closerAI ComfyUI】真人卡通化,超像!这个工作流真棒!用个人写真照片转卡通风格去轰炸你的朋友圈吧! 这期我们主要讨论如何使用stable diffusion comfyUI 制作定制写真卡通照片工作流。也就是真人照片转卡通形象。 closerAI工作…

什么是乐观锁、悲观锁?

什么是乐观锁、悲观锁? 乐观锁:乐观锁和悲观锁是并发控制的两种方式,用来确保在多线程或多用户访问共享资源时,数据的一致性和完整性。 悲观锁(Pessimistic Lock) 悲观锁假设并发操作会经常发生&#xf…

【漏洞复现】SpringBlade menu/list SQL注入漏洞

》》》产品描述《《《 致远互联智能协同是一个信息窗口与工作界面,进行所有信息的分类组合和聚合推送呈现。通过面向角色化、业务化、多终端的多维信息空间设计,为不同组织提供协同门户,打破组织内信息壁垒,构建统一协同沟通的平台。 》》》漏洞描述《《《 致远互联 FE协作办公…

【PyTorch】DataLoader 设置 num_workers > 0 时,出现 CUDA with multiprocessing 相关报错

【PyTorch】DataLoader 设置 num_workers > 0 时,出现 CUDA with multiprocessing 相关报错 1 报错信息2 报错分析2.1 原因2.2 结论 3 解决方法 1 报错信息 RuntimeError: Caught RuntimeError in DataLoader worker process 0.RuntimeError: Cannot re-initial…

mac安装homebrew和git

简介 由于把自己的新mac拿来撸代码,开始环境搭建,安装各种工具和依赖,安装 git 需要先安装 homebrew,然后就遇到了 homebrew 安装失败的问题。 curl: (7) Failed to connect to raw.githubusercontent.com port 443: Connection…