一、prometheus简介
普罗米修斯Prometheus是一个开源系统监控和警报工具包,最初构建于SoundCloud。自2012年成立以来,许多公司和组织都采用了普罗米修斯,该项目拥有非常活跃的开发人员和用户社区。它现在是一个独立的开源项目,独立于任何公司进行维护。为了强调这一点,并澄清该项目的治理结构,普罗米修斯于2016年加入云原生计算基金会,成为继Kubernetes之后的第二个托管项目。以下是普罗米修斯的主要特点和优势:
- 强大的指标收集:Prometheus能够从各种目标系统中收集丰富的监控指标。
- 多维数据模型:它支持通过标签对数据进行灵活的分类和查询。
- 灵活的配置:可以方便地定义监控目标和采集规则。
- 实时查询:提供快速的实时数据查询功能。
- 社区活跃:拥有庞大且活跃的社区,不断推动其发展和完善。
- 与多种工具集成:能与许多其他系统和工具进行良好的集成。
- 可视化支持:常与Grafana等可视化工具搭配,实现直观的监控展示。
- 与Zabbix的区别:Prometheus采用多维数据模型,主要基于主动拉取数据,社区非常活跃,扩展性好,告警管理相对简洁,在云原生环境中广泛应用。相比之下,Zabbix使用传统的监控项和值的方式,支持主动和被动两种监控方式,也有活跃社区但Prometheus在云原生领域更流行,扩展性也不错但可能相对复杂一些,有较为完善的告警配置和管理体系,也在不断适应云原生场景但最初并非为云原生设计。
Prometheus的主要组件包括Prometheus Server、Exporters、Alertmanager和Pushgateway。这些组件共同构成了Prometheus的监控生态系统,使得用户可以方便地收集、存储、查询和处理各种监控数据。下面详细解释每个主要组件的作用和重要性:
- Prometheus Server:Prometheus Server是整个监控系统的核心,负责从各种监控目标(如Kubernetes集群、Docker容器、主机等)中定期拉取(pull)监控指标数据,并将其存储在本地的时间序列数据库中。它还提供了灵活的查询语言(PromQL),用于对存储的数据进行查询和分析。此外,Prometheus Server支持多种服务发现机制,如文件、DNS、Consul、Kubernetes等,能够动态管理监控目标。
- Exporters:Exporters是一组工具,用于将那些本身不支持直接暴露监控指标的应用程序或服务的指标数据转换为Prometheus可以抓取的格式。例如,Node Exporter用于收集服务器节点的物理指标状态数据(如CPU、内存、磁盘使用情况等),而MySQL Exporter则用于收集MySQL数据库的指标数据。其他常见的Exporter还包括Blackbox Exporter(用于网络探测)、Process Exporter(用于监控进程状态)等。
- Alertmanager:Alertmanager是Prometheus体系中处理报警的组件,它根据Prometheus Server中定义的警报规则接收警报通知,然后根据配置的处理流程将警报通知发送给指定的接收者(如邮件、Slack、企业微信、钉钉等)。Alertmanager支持告警的去重、分组和路由配置,以及告警的沉默和抑制功能,以减少不必要的告警噪音。
- Pushgateway:Pushgateway是一个可选的组件,主要用于接收由短期作业或批处理作业生成的指标数据,并允许Prometheus Server从Pushgateway中拉取这些数据。当某些作业或服务由于网络限制或其他原因无法直接被Prometheus Server访问时,可以使用Pushgateway作为中间缓存层来收集和转发这些指标数据。
- 除了上述核心组件外,Prometheus生态系统中还有一些其他的工具和集成选项,如Grafana(用于数据可视化和监控平台的开源工具,可与Prometheus无缝集成),以及各种客户端库(Client Libraries),它们为开发者提供了在应用程序中实现自定义指标的方式。
总的来说,Prometheus通过这些组件的协同工作,为用户提供了一个强大且灵活的监控和告警解决方案,特别适合于云原生环境,如Kubernetes集群的监控。了解这些组件的功能和工作原理对于有效使用Prometheus至关重要。
二、安装步骤
博文实验环境如下:
- 操作系统:centos7.6
- Prometheus版本:2.52.0
- node-exporter版本:1.8.1
1、创建部署目录
[root@s76 opt]# mkdir prometheus
2、官网下载prometheus最新安装包
博主安装部署时最新版本是2.52.0,发布日期是2024年5月7日,我们可以访问普罗米修斯官网下载最新版本。
[root@s76 prometheus]# wget https://github.com/prometheus/prometheus/releases/download/v2.52.0/prometheus-2.52.0.linux-amd64.tar.gz
3、解压安装包
[root@s76 prometheus]# tar -zxvf prometheus-2.52.0.linux-amd64.tar.gz
[root@s76 prometheus]# ln -s prometheus-2.52.0.linux-amd64/ prometheus
4、启动程序
[root@s76 prometheus]# ./prometheus --version
prometheus, version 2.52.0 (branch: HEAD, revision: 879d80922a227c37df502e7315fad8ceb10a986d)
build user: root@1b4f4c206e41
build date: 20240508-21:56:43
go version: go1.22.3
platform: linux/amd64
tags: netgo,builtinassets,stringlabels
[root@s76 prometheus]# ./prometheus
5、开通防火墙策略
[root@s76 prometheus]# firewall-cmd --zone=public --add-port=9090/tcp --permanent
[root@s76 prometheus]# firewall-cmd --reload
[root@s76 prometheus]# setenforce 0
6、访问Prometheus WEB页面
三、使用简介(添加node节点监控目标)
1、修改配置文件prometheus.yml
[root@s76 prometheus]# vim prometheus.yml
2、重新启动程序
[root@s76 prometheus]# ./prometheus
3、查看targets
4、被监控节点下载node-exporter
如下第4、5、6步是在被监控主机上执行。
[root@mytool opt ]# wget https://github.com/prometheus/node_exporter/releases/download/v1.8.1/node_exporter-1.8.1.linux-amd64.tar.gz
5、解压软件包并启动
[root@mytool opt]# tar -zxvf node_exporter-1.8.1.linux-amd64.tar.gz
[root@mytool opt]# ln -s node_exporter-1.8.1.linux-amd64 node_exporter
[root@mytool opt]# cd node_exporter
[root@mytool node_exporter]# ./node_exporter
6、查看监听端口服务
7、再次查看targets
再次登录Prometheus服务器WEB控制台查看监控目标状态,发现mytool监控节点status变为绿色up状态。
四、开机自启动配置
1、创建软链接
[root@s76 prometheus]# ln -s /opt/prometheus/prometheus-2.52.0.linux-amd64 /usr/local/prometheus
2、添加Prometheus用户并授权
[root@s76 prometheus]# groupadd prometheus
[root@s76 prometheus]# useradd -g prometheus -s /sbin/nologin prometheus
[root@s76 prometheus]# chown -R prometheus:prometheus /usr/local/prometheus/
3、设置开机启动参数
参照如下配置文件,创建开机自启动服务配置文件。
[root@s76 prometheus]# touch /usr/lib/systemd/system/prometheus.service
[root@s76 prometheus]# chown prometheus:prometheus /usr/lib/systemd/system/prometheus.service
[root@s76 prometheus]# vim /usr/lib/systemd/system/prometheus.service
[Unit]
Description=Prometheus
Documentation=https://prometheus.io/
After=network.target[Service]
# Type设置为notify时,服务会不断重启
Type=simple
User=prometheus
# --storage.tsdb.path是可选项,默认数据目录在运行目录的./dada目录中
ExecStart=/usr/local/prometheus/prometheus --config.file=/usr/local/prometheus/prometheus.yml --storage.tsdb.path=/usr/local/prometheus/data
Restart=on-failure[Install]
WantedBy=multi-user.target
4、启动Prometheus服务
[root@s76 prometheus]# systemctl start prometheus
5、查看Prometheus服务状态
[root@s76 prometheus]# netstat -tnpl |grep 9090
tcp6 0 0 :::9090 ::😗 LISTEN 47654/prometheus
6、Prometheus管理
配置了开机启动服务配置文件后,我们就可以通过systemctl命令进行管理Prometheus服务的启动、停止和状态查看啦。