08-prometheus监控的告警通知-alertmanager组件工具

一、概述

        prometheus通过规则文件对比抓取到的数据,来判断是否触发告警,我们通过配置告警的工具altermanager进行告警通知;

        规则文件,写的就是,当我们获取到的PromeQL的值到达一个设置的规则后,触发告警;

        也就是说,规则文件,是出发告警的关键,而altermanager是告警的手段、工具。

二、安装部署alertmanager工具

1,软件包获取方式

下载地址:

wget https://github.com/prometheus/alertmanager/releases/download/v0.26.0/alertmanager-0.26.0.linux-amd64.tar.gz

为了方便学习,我给大家也准备了百度云盘的安装包:

链接:https://pan.baidu.com/s/1BgN8Lc5zrqakX8XNEwxh4Q?pwd=o5g7 
提取码:o5g7

2,上传解压软件包

[root@prometheus-server32 ~]# rz -E
[root@prometheus-server32 ~]# mkdir -pv /prometheus/softwares/

[root@prometheus-server32 ~]# tar xf alertmanager-0.26.0.linux-amd64.tar.gz -C /prometheus/softwares/

[root@prometheus-server32 ~]# ln -svf /prometheus/softwares/alertmanager-0.26.0.linux-amd64/ /prometheus/softwares/alertmanager

[root@prometheus-server32 ~]# cd /prometheus/softwares/alertmanager/

三、配置alertmanager邮件告警

1,编辑alertmanager配置文件

[root@prometheus-server32 ~]# cat /prometheus/softwares/alertmanager/alertmanager.yml 
#一、发件人信息配置
global:
  #解析失败超时时间;
  resolve_timeout: 5m
  #【发件人】邮箱
  smtp_from: '626080079@qq.com'
  #【邮箱官方主机】地址及端口
  smtp_smarthost: 'smtp.qq.com:465'
  #【发件人】邮箱
  smtp_auth_username: '626080079@qq.com'
  #【发件人】邮箱授权码
  smtp_auth_password: 'ubgotgvzrdgkbfcj'
  #发送信息是否tls加密
  smtp_require_tls: false
  smtp_hello: 'qq.com'
#二、报警的间隔信息配置;
route:
  group_by: ['alertname']
  group_wait: 5s
  group_interval: 5s
  #重复报警的间隔时间,如果报警问题没有解决,则会间隔指定的时间继续触发报警,比如5分钟;
  repeat_interval: 5m
  #采用什么报警方式?本次学习,我们使用邮箱;
  receiver: 'email'
#三、接收告警的目标信息编辑;谁来接收告警?
receivers:
#定义接收者名称
- name: 'email'
  email_configs:
  #【收件人】
  - to: '626080079@qq.com'
    send_resolved: true
inhibit_rules:
  - source_match:
      #匹配的告警级别
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['alertname', 'dev', 'instance']

2,启动alertmanager

[root@prometheus-server32 ~]# ./prometheus/softwares/alertmanager/alertmanager

3,浏览器访问9093端口

至此,告警的中间件就配置完成了;

四、配置prometheus报警规则

1,编辑配置文件

[root@prometheus-server31 ~]# vim /prometheus/softwares/prometheus-2.37.8.linux-amd64/prometheus.yml 

global:
  scrape_interval: 3s
  evaluation_interval: 15s

#####################################
#告警的中间件地址(alertmanager的访问地址);
alerting:
  alertmanagers:
    - static_configs:
        - targets:
            - 10.0.0.32:9093
#规则文件在哪里?路径;
rule_files:
  - "/prometheus/softwares/rules.yml"
#####################################

scrape_configs:
  - job_name: "prometheus-alert-rule"
    static_configs:
    - targets: ["10.0.0.41:9100"]

2,编辑规则文件

        规则文件内容主要目的是:

        1,当监控数据,达到什么数值后。触发alertmanager的报警;

        2,报警的内容信息是什么?

[root@prometheus-server31 ~]# vim /prometheus/softwares/rules.yml

groups:
- name: xinjizhiwa-alert
  rules:
  - alert: 41节点挂掉啦          
    #当promeQL这个语句=0时(节点挂掉),开始报警
    expr: up{instance="10.0.0.41:9100"} == 0
    #连续3s=0才触发报警;
    for: 3s
    labels:
      prometheus: xinjizhiwa
      #被监控节点ip
      node: 10.0.0.41
    annotations:
      summary: "{{ $lables.instance }} 已停止运行超过 3s!"

3,prometheus的配置文件语法检查

[root@prometheus-server31 prometheus-2.37.8.linux-amd64]# ./promtool check config prometheus.yml 

4,重新加载prometheus服务

curl -X POST http://10.0.0.31:9090/-/reload

五、模拟被监控项挂掉

[root@prometheus-node41 ~]# systemctl stop node-exporter.service

等待几秒钟,收到告警邮件

至此,alertmanager邮件告警就学习完毕了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/722987.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

刷题笔记day27-回溯算法3

39. 组合总和 var path []int var tmp []int var result [][]int// 还是需要去重复,题目中要求的是至少一个数字备选的数量不同。 // 所以需要剪枝操作,右边的要比左边的> func combinationSum(candidates []int, target int) [][]int {// 组合问题pa…

白皮书发布|超融合运行 K8s 的场景、功能与优势

目前,不少企业都使用虚拟化/超融合运行 Kubernetes 和容器化应用。一些用户可能会有疑惑:既然 Kubernetes 可以部署在裸金属上,使用虚拟化不是“多此一举”吗? 在电子书《IT 基础架构团队的 Kubernetes 管理:从入门到…

详细分析Vue中的$refs用法

目录 1. 基本知识2. Demo 1. 基本知识 在Vue.js中,$refs是一个特殊的属性,用于在组件内部直接访问子组件或者DOM元素 作用: 访问DOM元素: 直接访问模板中的DOM元素,以便执行DOM操作,如聚焦、改变样式等 访…

生活里的英语应该【怎么说】

文章目录 一、生病的各种症状用英语怎么说?二、关于天气的英语怎么说? 一、生病的各种症状用英语怎么说? Im coughting! I have a sore throat. Ive lost my voice. I have a runny nose and a stuffy nose. I have shivers and a body a…

20240304金融读报:票据贴现数据挖掘与新质生产力信贷创新

1、【他山之石】票据贴现数据挖掘:邮储三步走(为存量科技企业提供贴现、拉国家科技名单拓客、通过贴现激活睡眠对公户、提供不止贴现业务) 2、【宏观经济】函数推算的潜在增长率2025之前为4%,2025-2035间为3%。破局在于通过改革、…

[极客大挑战 2020]Roamphp1-Welcome ---不会编程的崽

buuctf上的题难度适中。越到后边会越难&#xff0c;但也有例外 页面报错了。报错的原因可能有很多种猜想。所以有没有一种可能是故意这么设计的。先抓包吧 发现是GET请求。修改请求方法再试试呢&#xff1f; <?php error_reporting(0); if ($_SERVER[REQUEST_METHOD] ! P…

突破编程_C++_STL教程( deque 的实战应用)

1 std::deque 的主要应用场景 std::deque&#xff08;双端队列&#xff09;在C编程中有许多应用场景&#xff0c;尤其是当需要在序列的两端进行高效的插入和删除操作时。以下是std::deque的一些典型应用场景&#xff1a; &#xff08;1&#xff09;排队系统&#xff1a; std:…

Android Studio开发(一) 构建项目

1、项目创建测试 1.1 前言 Android Studio 是由 Google 推出的官方集成开发环境&#xff08;IDE&#xff09;&#xff0c;专门用于开发 Android 应用程序。 基于 IntelliJ IDEA: Android Studio 是基于 JetBrains 的 IntelliJ IDEA 开发的&#xff0c;提供了丰富的功能和插件…

Qt 通过pdfium将网络上的pdf显示为图片

前言 遇到个需求&#xff0c;就是在qt客户端显示服务器上的pdf文档&#xff0c;文档以base64格式返回给客户端。以下是实现方法&#xff1a; 1、在pro文件增加以下代码&#xff1a; INCLUDEPATH $$PWD/PDFiumSDK/include/publicDEPENDPATH $$PWD/PDFiumSDK/include/public…

Python 全栈系列232 再次搭建RabbitMQ

说明 最近想重新上RabbitMQ&#xff0c;主要目的还是为了分布式任务调度。在Kafka和RabbitMQ两者犹豫了一下&#xff0c;还是觉得RabbitMQ好一些。 在20年的时候有搞过一阵子的RabbitMQ,看了下当时的几篇文章&#xff0c;觉得其实想法一直没变过。 Python - 装机系列24 消息…

常用“树”数据结构

哈夫曼树 在许多应用中&#xff0c;树中结点常常被赋予一个表示某种意义的数值&#xff0c;称为该结点的权。从树的根到任意结点的路径长度(经过的边数)与该结点上权值的乘积&#xff0c;称为该结点的带权路径长度。树中所有叶结点的带权路径长度之和称为该树的带权路径长度&am…

出现身份验证错误,无法连接到本地安全机构 顺利解决这个问题希望能帮助大家

出现身份验证错误&#xff0c;无法连接到本地安全机构&#xff0c;远程计算机&#xff1a;XX&#xff0c;这可能是由于密码过期&#xff0c;如果密码已过期请更新密码。 我们可以在系统属性中对远程进行设置&#xff0c;以解决远程桌面无法连接到本地安全机构这一问题。 步骤…

倒计时34天

L2-1 堆宝塔 - B107 2023级选拔春季开学测重现 (pintia.cn) #include<bits/stdc.h> using namespace std; //#define int long long const int N2e56; const int inf0x3f3f3f3f; const double piacos(-1.0); vector<int>ve1,ve2; vector<vector<int> >…

企业出海WAS安全自动化解决方案

随着企业出海的日益激烈&#xff0c;安全风险正在成为企业日益关注的问题之一&#xff0c;九河云携手AWS带来了使用Amazon WAF 与 Amazon Shield 的 CloudFront安全自动化。Aws WAF是一种web应用防火墙&#xff0c;可帮助保护客户的web应用程序或api免遭常规web漏洞的攻击。Aws…

【R语言教程】

R语言简介&#xff1a; R 是一种自由、开源的编程语言&#xff0c;专门用于统计分析、数据挖掘、数据可视化以及整理和清洗数据。 R 的强大功能和丰富的扩展包使得它在全球统计学家、数据科学家甚至其它领域的研究员和技术人员中都非常受欢迎。 R语言环境&#xff1a; 要开始…

【Hadoop大数据技术】——Hadoop概述与搭建环境(学习笔记)

&#x1f4d6; 前言&#xff1a;随着大数据时代的到来&#xff0c;大数据已经在金融、交通、物流等各个行业领域得到广泛应用。而Hadoop就是一个用于处理海量数据的框架&#xff0c;它既可以为海量数据提供可靠的存储&#xff1b;也可以为海量数据提供高效的处理。 目录 &#…

【数据结构】用栈实现队列

前言&#xff1a;本节博客分享了用栈实现队列效果的思路以及代码&#xff0c;有需要借鉴即可。 1.题目及链接 LINK 2.思路分析 如果要用栈实现队列&#xff0c;我们直到栈是先入后出的一个效果&#xff0c;所以我们可以用两个栈&#xff0c;这样逆转两次数不就是入栈之前数组…

Scanner类的九大输入方法,三种输出方法

目录 输入方法 Scanner类的9大输入方法 输出方法 print println printf 例题实战 题目进阶 输入方法 最常见的输入输出方法 输入Scanner类 Scanner是Java5的新特征&#xff0c;在java.util包里&#xff0c;可以完成用户输入&#xff1a; 导入java.util包 构造Scanner对象&…

Linux环境下终端( 串口)接口应用

目录 概述 1 了解串口应用编程 1.1 认识 struct termios 结构体 1.1.1 认识c_iflag 1.1.2 认识c_oflag 1.1.3 认识 c_cflag 的配置参数 1.1.4 认识c_lflag 1.2 终端相关的函数库 2 编写串口应用接口 2.1 设置baud函数 2.2 设置停止位函数 2.3 设置奇偶校验函数 2.4…

SpringBoot约定大于配置

什么是约定大于配置 "约定大于配置"&#xff08;Convention Over Configuration&#xff09;是一种理念&#xff0c;旨在通过默认约定和规则来减少开发人员需要做的配置工作。在Spring Boot框架中&#xff0c;这一原则得到了充分应用&#xff0c;帮助开发者更快地构…