目录
前言
一、监控系统
1、主流的监控系统
2、监控系统功能
二、Zabbix 监控系统概述
1、Zabbix 概念
2、Zabbix 主要特点
3、Zabbix 主要功能
4、Zabbix 监控对象
5、Zabbix 主要程序
6、Zabbix 监控模式
7、Zabbix 运行机制
8、Zabbix 监控原理
9、Zabbix 主要的三个监控架构
9.1 server-client(基本架构)
9.2 server-proxy-client(中型架构)
9.3 master-node-client(大型架构)
三、安装部署 Zabbix
1、环境部署
2、部署 zabbix 服务端
2.1 获取并更换 zabbix 的下载源
2.2 安装 SCL
2.3 安装 zabbix 前端环境到 scl 环境下
2.4 安装 zabbix 所需的数据库
2.5 在 zabbix_server 配置文件指定密码
2.6 修改 zabbix 的 php 配置文件
2.7 启动 zabbix 服务
2.8 浏览器访问
2.9 解决 zabbix-server Web页面中文乱码问题
3、部署 zabbix 客户端
3.1 时间同步
3.2 设置 zabbix 的下载源,安装 zabbix-agent2
3.3 修改 agent2 配置文件
3.4 启动 zabbix-agent2 并验证连通性
4、网页端创建新主机监控
前言
监控系统对于确保系统稳定性、性能优化以及故障排除至关重要
需要会使用监控系统查看服务器状态以及网站流量指标,利用监控系统的数据去了解上线发布的结果,和网站的健康状态
本文主要介绍Zabbix 监控系统
一、监控系统
监控系统是一种用于监视、检测和记录特定活动、过程或设备状态的系统
监控系统的主要目的是帮助确保事物正常运行,及时发现问题并采取适当的行动
1、主流的监控系统
传统运维:
-
Zabbix:一个功能强大的开源网络监控工具,具有对服务器、虚拟机、网络和云基础设施进行监视的能力
-
Nagios:一个广泛使用的开源网络监控工具,可用于监视服务器、网络设备等
-
Icinga:是 Nagios 的一个分支,提供了更多功能和改进,例如对配置的动态性支持
-
Cacti:一个基于 RRDTool 的网络图形解决方案,用于监视网络带宽使用情况等
云原生环境:
-
Prometheus:一种开源的系统监控和警报工具,专注于支持多维数据收集和存储(go语言开发的)
这些系统都有各自的特点和适用场景,可以根据具体需求选择合适的监控系统进行部署和使用。
2、监控系统功能
利用一个优秀的监控软件,我们可以:
- 通过一个友好的界面进行浏览整个网站所有的服务器状态
- 可以在 Web 前端方便的查看监控数据
- 可以回溯寻找事故发生时系统的问题和报警情况
总的来说,使用监控系统可以帮助组织和管理员更好地管理和监控其网络设备和服务器,提高系统的稳定性、可靠性和性能,减少故障发生和处理时间,从而提升整体运营效率和用户体验。
二、Zabbix 监控系统概述
官方网站:https://www.zabbix.com/
1、Zabbix 概念
zabbix 是一个基于 Web 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案
- zabbix 能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题
- zabbix 由 2 部分构成,zabbix server 与可选组件 zabbix agent。通过 C/S 模式采集数据,通过 B/S 模式在 Web 端展示和配置
- zabbix server 可以通过 SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能, 它可以运行在 Linux 等平台上
- zabbix agent 需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU 等信息的收集。agent 端口:10050,server 端口:10051
2、Zabbix 主要特点
- 安装简单(yum),学习成本低
- 支持多种语言(包括中文)
- 免费开源
- 自动发现服务器与网络设备
- 分布式监控以及 web 集群中的管理功能
- 可以通过邮件、短信、语言、微信、钉钉等通知
3、Zabbix 主要功能
- CPU负载:监控 CPU 负载对于了解系统的处理能力至关重要,高 CPU 负载可能表明潜在的性能问题或资源限制
- 内存使用:跟踪内存使用有助于识别消耗大量内存的进程,并确保系统具有足够的可用内存以实现平稳运行
- 磁盘使用率:监控磁盘使用是预测存储容量需求、防止因磁盘已满而导致数据丢失以及识别与磁盘 I/O 相关的潜在性能瓶颈的关键
- 网络状态:监控网络状态涉及跟踪带宽使用、数据包丢失、延迟和整体网络健康状况,这对于确保顺畅通信并识别潜在的网络问题至关重要
- 端口监视:端口监视涉及跟踪网络端口的状态和活动,这对于安全性、网络故障排除和识别潜在漏洞至关重要
- 日志监视:日志监视涉及分析系统和应用程序日志以识别错误、安全威胁和操作问题,从而实现积极维护和问题解决
- 插件开发自定义:自定义插件开发允许扩展监控能力以跟踪特定指标或与特定系统集成,根据特定要求提供量身定制的见解
- 业务监控:业务监控涉及跟踪与业务流程、应用程序或服务相关的关键绩效指标(KPI),确保它们达到运营和性能目标
4、Zabbix 监控对象
- 硬件监控:如 CPU 使用率、内存利用率、磁盘空间、温度传感器等
- 系统监控:可以监控操作系统的各项参数,包括进程状态、负载情况、文件系统状态等
- 网络监控:监控网络设备的状态、流量、带宽利用率等,并对网络连通性进行检测
- java 监控:对于基于 Java 的应用程序,Zabbix 可以监控 JVM 的运行状态、内存使用情况、垃圾回收等
- 应用服务器监控:监控各种应用服务器,如 Tomcat、Nginx、Apache等
- 数据库监控:监控数据库服务器的各种指标,如查询响应时间、连接数、缓冲池利用率等
- url 监控:监控 Web 页面的可用性和响应时间
- vmware 监控:监控 VMware 虚拟化环境中的虚拟机和宿主机的各种性能指标,包括 CPU 利用率、内存使用情况、虚拟磁盘性能等
5、Zabbix 主要程序
zabbix 监控部署在系统中,包含常见的五个程序: zabbix_server、zabbix_agent、zabbix_proxy、zabbix_get、zabbix_sender;在 2.0 版本后新增了 zabbix_java_geteway。
- zabbix_server:zabbix 服务端的守护进程,这是Zabbix的核心组件,负责处理数据收集、存储、触发器处理、报警等功能
- zabbix_agent:zabbix 客户端的守护进程,安装在被监控设备上的一个小型程序,用于主动采集该设备的性能数据,并将其发送给zabbix_server
- zabbix_proxy:分布式代理守护进程,通常 agent 大于500台使用(不过生产环境中300台左右就会出现卡顿现象);可选的中间层,用于分担 zabbix_server 的压力
- zabbix_get:数据接收命令行工具,通常在 server 和 proxy 执行,用于从被监控设备上主动获取指定的监控项数值
- zabbix_sender:也是一个命令行工具,用于向 zabbix_server 发送自定义的监控数据,由用户发给 server 或 proxy
- zabbix_java_geteway:zabbix 2.0 版本后新增的组件,用于监控 Java 应用程序的性能数据
6、Zabbix 监控模式
- 被动监控:server 端向 agent 端发起连接,根据情况可选,不适用被监控主机过多的情况
- 主动监控:agent 端向 server 端发起连接,可以减轻服务器压力,适用被监控主机过多的情况
7、Zabbix 运行机制
① zabbix agent 部署在监控目标主机上,负责收集系统和服务的各种指标数据,如 CPU 使用率、内存使用情况、网络流量等,并将这些数据发送到 zabbix server
② zabbix server 接收来自 zabbix agent 的数据,并进行数据分析、存储和处理;对接收到的数据进行分析,并在必要时触发告警通知相关用户或用户组
③ zabbix server 将处理后的数据存储在数据库中,以便长期存档和后续分析
④ zabbix web 是用户界面,通过该界面用户可以查看已存储的监控数据、配置监控项、创建报表以及管理告警等
数据流向:zabbix-agent(数据采集)——> zabbix-server(数据分析/告警)——> 数据库(存储)——> zabbix-web(数据展示)
8、Zabbix 监控原理
① zabbix agent 安装在被监控的主机上,zabbix agent 负责定期收集客户端本地各项数据,并发送至 zabbix server 端
② abbix server 收到数据后,将数据存储到数据库中,用户基于 Zabbix WEB 可以看到数据在前端展现图像;zabbix server 可以使用代理程序主动轮询监控目标(被动监控,即 server 向 agent 发起连接),也可以直接从被监控设备上获取数据(主动监控 agent 向 server发起连接)
③ 当 zabbix 监控某个具体的项目, 该项目会设置一个触发器阈值,当被监控的指标超过该触发器设定的阈值,会进行一些必要的动作,动作包括:发送信息(邮件、微信、短信)、发送命令(shell 命令、reboot、restart、install 等)
9、Zabbix 主要的三个监控架构
9.1 server-client(基本架构)
Zabbix最简单的架构,监控机器和被监控机器之间不经过任何处理,直接由 server-client 之间数据交换
适用于比较简单的网络,尽量在局域网内、设备较少的监控环境
9.2 server-proxy-client(中型架构)
proxy 是server和client之间沟通的桥梁(代理);本身有前端,并不存放数据,将 agent 发来的数据暂时存放,而后再提交给 server
适用于跨机房、跨网络的中型架构,一般大于500台以上才使用
9.3 master-node-client(大型架构)
master-node-client 该架构是 zabbix 最复杂的监控架构,适用于跨网络跨机房设备多的大型环境
每个 node 同时接一个 sever 端,node下可以接 proxy 端,也可以直接连接 client,node 有自己的配置文件和数据库,其要做的是将配置信息和监控数据向 master 进行数据同步,master 故障损坏对 node 其下架构的完整性无任何影响
三、安装部署 Zabbix
1、环境部署
节点 | IP地址 | 安装软件 | 操作系统 |
---|---|---|---|
zabbix 服务端 | 172.16.12.10 | zabbix-server-mysql zabbix-agent | centos 7.4 |
zabbix 客户端 | 172.16.12.11 | zabbix-agent2 | centos 7.4 |
(1)关闭所有设备的防火墙和核心防护
[root@localhost ~]#systemctl stop firewalld
[root@localhost ~]#setenforce 0
(2)修改两台设备的主机名
[root@localhost ~]#hostnamectl set-hostname zbx_server
[root@localhost ~]#bash[root@localhost ~]#hostnamectl set-hostname zbx_agent01
[root@localhost ~]#bash
(3)es_node节点1和es_node节点2都要配置本地的/etc/hosts文件
echo "172.16.12.10 zbx_server" >> /etc/hosts
echo "172.16.12.11 zbx_agent01" >> /etc/hosts
2、部署 zabbix 服务端
官方网站安装包下载地址:https://www.zabbix.com/download
2.1 获取并更换 zabbix 的下载源
#获取 zabbix 的下载源
[root@zbx_server ~]# rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm #更换 zabbix.repo 为阿里源
[root@zbx_server ~]# cd /etc/yum.repos.d
[root@zbx_server yum.repos.d]# sed -i 's#http://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' zabbix.repo
[root@zbx_server yum.repos.d]# yum clean all && yum makecache#安装
[root@zbx_server yum.repos.d]# yum install -y zabbix-server-mysql zabbix-agent
# zabbix-server-mysql: 这是Zabbix服务器的MySQL版本的软件包,安装了Zabbix服务器组件,以便Zabbix监控系统能够运行并通过MySQL保存数据
# zabbix-agent: 这是Zabbix代理软件包,安装了Zabbix代理组件,用于在被监控设备上主动提供监控数据给Zabbix服务器
2.2 安装 SCL
安装 SCL(Software Collections),便于后续安装高版本的 php,默认 yum 安装的 php 版本为 5.4,版本过低,zabbix 5.0 版本对 php 版本最低要 7.2.0 版本。SCL 可以使得在同一台机器上使用多个版本的软件,而又不会影响整个系统的依赖环境。软件包会安装在 /opt/rh 目录下
[root@zbx_server ~]# yum install -y centos-release-scl
2.3 安装 zabbix 前端环境到 scl 环境下
[root@zbx_server ~]# vim /etc/yum.repos.d/zabbix.repo
……
[zabbix-frontend]
……
enabled=1
……
# 修改 zabbix-front 前端源[root@zbx_server ~]# yum install -y zabbix-web-mysql-scl zabbix-apache-conf-scl
# 在CentOS上安装 Zabbix Web 界面和 Apache 配置的软件包
# zabbix-web-mysql-scl:这个软件包提供了 Zabbix 的 Web 界面部分,并且使用了 MySQL 数据库作为后端存储
# zabbix-apache-conf-scl:这个软件包提供了与 Apache 服务器相关的 Zabbix 配置文件,用于与 Apache 服务器协同工作
2.4 安装 zabbix 所需的数据库
(1)安装并启动 Zabbix 数据库
[root@zbx_server ~]# yum install -y mariadb-server mariadb
# 安装 MariaDB 数据库服务器及其相关组件
[root@zbx_server ~]# systemctl enable --now mariadb
# 启用并立即启动MariaDB数据库服务器
(2)初始化数据库,并设置密码,如123
[root@zbx_server ~]# mysql_secure_installation
# 回车、y,输入密码、确认密码,一直y
(3)添加数据库用户,以及 zabbix 所需的数据库信息
[root@zbx_server ~]# mysql -uroot -p123 # 登录数据库
MariaDB [(none)]> create database zabbix character set utf8 collate utf8_bin;
# 在 MySQL 中创建了一个名为 zabbix 的数据库,并且使用了 UTF-8 的字符集以及校对规则
MariaDB [(none)]> grant all on zabbix.* TO 'zabbix'@'%' IDENTIFIED BY 'zabbix';
# 为 zabbix 数据库创建了一个用户名为 zabbix 的用户,并且授予了该用户对 zabbix 数据库的全部权限,密码为 zabbix
MariaDB [(none)]> flush privileges;
# 刷新权限,使修改后的权限立即生效
(4)导入数据库信息
[root@zbx_server ~]# rpm -ql zabbix-server-mysql # 查询 sql 文件的位置
[root@zbx_server ~]# zcat /usr/share/doc/zabbix-server-mysql-5.0.42/create.sql.gz | mysql -uroot -p123 zabbix
# 将 Zabbix 监控系统所需的数据库结构导入到名为 zabbix 的数据库中
2.5 在 zabbix_server 配置文件指定密码
[root@zbx_server ~]# vim /etc/zabbix/zabbix_server.conf
DBPassword=zabbix #124行,指定 zabbix 数据库的密码
2.6 修改 zabbix 的 php 配置文件
[root@zbx_server ~]# vim /etc/opt/rh/rh-php72/php-fpm.d/zabbix.conf
php_value[date.timezone] = Asia/Shanghai #第25行,取消注释,修改时区东八区
2.7 启动 zabbix 服务
[root@zbx_server ~]# systemctl restart zabbix-server zabbix-agent httpd rh-php72-php-fpm
[root@zbx_server ~]# systemctl enable zabbix-server zabbix-agent httpd rh-php72-php-fpm
# rh-php72-php-fpm:这是PHP-FPM(FastCGI Process Manager)的服务名称。在这个特定的情景中,rh-php72-php-fpm表示Red Hat 软件集合(Software Collections Library)中包含的 PHP 版本 7.2 的 PHP-FPM 服务
2.8 浏览器访问
http://172.16.12.10/zabbix
# 点击下一步,设置数据库的密码 zabbix
# 安装完成后,默认的登录账号和密码为:Admin/zabbix
# 设置文件界面:点击左边菜单栏的【User settings】,【Language】选择 Chinese(zh_CN),再点击 Update 更新
修改成中文语言:
2.9 解决 zabbix-server Web页面中文乱码问题
[root@zbx_server ~]# yum install -y wqy-microhei-fonts
[root@zbx_server ~]# \cp -f /usr/share/fonts/wqy-microhei/wqy-microhei.ttc /usr/share/fonts/dejavu/DejaVuSans.ttf
# 将一种字体文件复制或替换为另一种字体文件
3、部署 zabbix 客户端
zabbix 5.0 版本采用 golang 语言开发的新版本客户端 agent2;zabbix 服务端 zabbix_server 默认使用 10051 端口,客户端 zabbix_agent2 默认使用 10050 端口
3.1 时间同步
#服务端和客户端都配置 ntp 时间同步
yum install -y ntpdate
ntpdate -u ntp.aliyun.com
#zabbix客户端改变系统的时区为上海时间
[root@zbx_agent01 ~]# mv /etc/localtime{,.bak}
[root@zbx_agent01 ~]# ln -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
3.2 设置 zabbix 的下载源,安装 zabbix-agent2
[root@zbx_agent01 ~]# rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm
[root@zbx_agent01 ~]# cd /etc/yum.repos.d
[root@zbx_agent01 yum.repos.d]# sed -i 's#http://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' /etc/yum.repos.d/zabbix.repo
[root@zbx_agent01 yum.repos.d]# yum install -y zabbix-agent2
3.3 修改 agent2 配置文件
[root@zbx_agent01 ~]# vim /etc/zabbix/zabbix_agent2.conf
Server=172.16.12.10 #第80行,指定 zabbix 服务端的 IP 地址
ServerActive=172.16.12.10 #第125行,指定 zabbix 服务端的 IP 地址
Hostname=zbx_agent01 #第136行,指定当前 zabbix 客户端的主机名
3.4 启动 zabbix-agent2 并验证连通性
[root@zbx_agent01 ~]# systemctl enable --now zabbix-agent2
[root@zbx_agent01 ~]# ss -natp | grep zabbix
#在服务端验证 zabbix-agent2 的连通性
[root@zbx_server ~]# yum install -y zabbix-get #安装 zabbix 主动获取数据的命令
[root@zbx_server ~]# zabbix_get -s '172.16.12.11' -p 10050 -k 'agent.ping'
[root@zbx_server ~]# zabbix_get -s '172.16.12.11' -p 10050 -k 'system.hostname'
4、网页端创建新主机监控
网页端访问:http://172.16.12.10/zabbix
对主机可用性进行监控时,通常使用ZBX、SNMP、JMX和IPMI这四种不同的代理方式。它们分别代表以下含义:
ZBX(Zabbix Agent):Zabbix Agent 是 Zabbix 官方提供的一种被动监控代理程序,安装在被监控的主机上。它用于主动收集主机上的性能数据,并将数据传送给 Zabbix 服务器。使用 Zabbix Agent 可以获取更多详细的系统信息,如 CPU 使用率、内存利用率、磁盘空间等
SNMP(Simple Network Management Protocol):SNMP 是一种网络管理协议,可以用于监控和管理网络上的各种设备。在 Zabbix 中,可以通过 SNMP 协议监控网络设备和其他支持 SNMP 协议的主机,获取这些设备的指标数据,比如路由器、交换机、打印机等网络设备的状态信息
JMX(Java Management Extensions):JMX 是 Java 平台上用于监控和管理应用程序的技术,它可以提供对 Java 应用程序内部状态的监控和管理。在 Zabbix 中,可以利用 JMX 协议监控部署在 Java 虚拟机上的应用程序,获取应用程序的指标数据,比如内存使用、线程状态、类加载等信息
IPMI(Intelligent Platform Management Interface):IPMI 是一种用于远程监控服务器硬件状态和进行管理的标准接口。在 Zabbix 中,通过 IPMI 协议可以监控支持 IPMI 协议的服务器硬件设备,例如服务器的功耗、风扇转速、温度等硬件状态信息