Docker-compose部署Alertmanager+Dingtalk+Prometheus+Grafana实现钉钉报警

部署监控

version: '3.7'services:
#dingtalkdingtalk:image: timonwong/prometheus-webhook-dingtalk:latestcontainer_name: dingtalkrestart: alwayscommand:- '--config.file=/etc/prometheus-webhook-dingtalk/config.yml'volumes:- /data/monitor/dingtalk/config.yml:/etc/prometheus-webhook-dingtalk/config.yml- /etc/localtime:/etc/localtime:roports:- "8060:8060"
#alertmanageralertmanager:image: prom/alertmanager:latestcontainer_name: alertmanagerrestart: alwaysvolumes:- /data/monitor/alertmanager/config/alertmanager.yml:/etc/alertmanager/alertmanager.ymlports:- "9093:9093"
#prometheusprometheus:image: prom/prometheuscontainer_name: prometheusrestart: alwaysports:- "9090:9090"volumes:- /data/monitor/promethues/prometheus.yml:/etc/prometheus/prometheus.yml- /data/monitor/promethues/alert.yml:/etc/prometheus/rule.yml- /etc/localtime:/etc/localtime:ro
#grafanagrafana:image: grafana/grafanacontainer_name: grafanarestart: alwaysports:- "3000:3000"volumes:- /data/monitor/grafana:/var/lib/grafana
#node-exporternode-exporter:image: prom/node-exportercontainer_name: node-exporterrestart: alwaysports:- "9100:9100"volumes:- /proc:/host/proc:ro- /sys:/host/sys:ro- /:/rootfs:ro    

Dingtalk配置文件

/data/monitor/dingtalk/config.yml

templates:- /etc/prometheus-webhook-dingtalk/templates/templates.tmpltargets: #配置多个接收方webhook2:url: https://oapi.dingtalk.com/robot/send?access_token=钉钉tokensecret: 钉钉加签

Alertmanager配置文件

/data/monitor/alertmanager/config/alertmanager.yml

global:resolve_timeout: 5msmtp_smarthost: 'smtp.qiye.163.com:465'             #邮箱smtp服务器代理,启用SSL发信, 端口一般是465smtp_from: 'user@163.com'              #发送邮箱名称smtp_auth_username: 'user@163.com'              #邮箱名称smtp_auth_password: 'password'                #邮箱密码或授权码smtp_require_tls: falseroute:receiver: 'default'group_wait: 10sgroup_interval: 1mrepeat_interval: 1hgroup_by: ['alertname']inhibit_rules:
- source_match:severity: 'critical'target_match:severity: 'warning'equal: ['alertname', 'instance']receivers:
- name: 'default'webhook_configs:- url: 'http://dingtalk-IP:8060/dingtalk/webhook2/send'   #webhoo2匹配dingtalk targetssend_resolved: true

Prometheus配置prometheus文件

/data/monitor/promethues/prometheus.yml

global:scrape_interval: 60sevaluation_interval: 60s
alerting:alertmanagers:- static_configs:- targets: ['IP:9093']
rule_files:- "/etc/prometheus/rule.yml"- "rules/*.yml"scrape_configs:- job_name: prometheusstatic_configs:- targets: ['localhost:9090']labels:instance: prometheus- job_name: litestatic_configs:- targets: ['IP:9100']labels:env: dev- job_name: redis_exporterstatic_configs:- targets: ['IP:9121']labels:env: devident: redis- job_name: mysql_exporterstatic_configs:- targets: ['IP:9104']labels:env: devident: mysql- job_name: emqx_exportermetrics_path: /api/v5/prometheus/statsscrape_interval: 5shonor_labels: truestatic_configs:- targets: ['IP:18083']- job_name: 'alertmanager'scrape_interval: 15sstatic_configs:- targets: ['IP:9100']

Prometheus配置alert文件

/data/monitor/promethues/alert.yml

groups:
- name: 服务器主机信息监控告警rules:- alert: 公司内部服务器监控expr: up {job="公司内部服务器"} == 0for: 0mlabels:severity: 非常严重annotations:description: "监控的目标已丢失,请检查服务器自身或node_exporter服务"- alert: "内存报警"expr: 100 - ((node_memory_MemAvailable_bytes * 100) / node_memory_MemTotal_bytes) > 10for: 1m  # 告警持续时间,超过这个时间才会发送给alertmanagerlabels:severity: 严重annotations:summary: "{{ $labels.instance }} 内存使用率过高,请尽快处理!"description: "{{ $labels.instance }}内存使用率超过95%,当前使用率{{ $value }}%."- alert: "磁盘空间报警"expr: (1 - node_filesystem_avail_bytes{fstype=~"ext4|xfs"} / node_filesystem_size_bytes{fstype=~"ext4|xfs"}) * 100 > 20for: 60slabels:severity: 严重annotations:summary: "{{ $labels.instance }}磁盘空间使用超过95%了"description: "{{ $labels.instance }}磁盘使用率超过95%,当前使用率{{ $value }}%."- alert: "CPU报警"expr: 100-(avg(irate(node_cpu_seconds_total{mode="idle"}[5m])) by(instance)* 100) > 5for: 120slabels:severity: 严重instance: "{{ $labels.instance }}"annotations:summary: "{{$labels.instance}}CPU使用率超过95%了"description: "{{ $labels.instance }}CPU使用率超过95%,当前使用率{{ $value }}%."- alert: "磁盘IO性能报警"expr: ((irate(node_disk_io_time_seconds_total[30m]))* 100) > 95for: 3mlabels:severity: 严重annotations:summary: "{{$labels.instance}} 流入磁盘IO使用率过高,请尽快处理!"description: "{{$labels.instance}} 流入磁盘IO大于95%,当前使用率{{ $value }}%."

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/804174.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

部署GlusterFS群集

目录 一、部署GlusterFS群集 1. 服务器节点分配 2. 服务器环境(所有node节点上操作) 2.1 关闭防火墙 2.2 磁盘分区,并挂载 2.3 修改主机名,配置/etc/hosts文件 3. 安装、启动GlusterFS(所有node节点上操作&…

51单片机入门_江协科技_25~26_OB记录的笔记_蜂鸣器教程

25. 蜂鸣器 25.1. 蜂鸣器介绍 •蜂鸣器是一种将电信号转换为声音信号的器件,常用来产生设备的按键音、报警音等提示信号 •蜂鸣器按驱动方式可分为有源蜂鸣器和无源蜂鸣器(开发板上用的无源蜂鸣器) •有源蜂鸣器:内部自带振荡源&a…

二:什么是RocketMQ

RocketMQ是阿里开源的消息中间件产品,纯Java开发,具有高吞吐量、高可用性、适合大规模分布式系统应用的特点,性能强劲(零拷贝技术),支持海量堆积,在阿里内部进行大规模使用,适合在互联网与高并发系统中应用。 官方文档&#xff1a…

【Linux】虚拟化技术docker搭建SuitoCRM系统及汉化

CRM系统 CRM(Customer Relationship Management,客户关系管理)系统是一种用于管理和优化企业与客户关系的软件工具。在商业竞争激烈的现代社会中,CRM系统已成为许多企业提高销售、增强客户满意度和实现持续增长的重要工具。本文将…

Hive-生产常用操作-表操作和数据处理技巧-202404

hive语句操作 我这个只涉及到hive的对表的操作,包括建表,建分区表,加载数据,导出数据,查询数据,删除数据,插入数据,以及对hive分区表的操作,包括查看分区,添加…

【宝德PI300T G2智能小站开发教程(二)】命令行linux如何挂载移动硬盘

目录 一.前言 二.步骤 1.查找移动硬盘: 2.建立挂载点 3.挂载 4.进入硬盘 5.解除挂载 一.前言 Linux中的挂载是将存储设备(如硬盘、分区、USB驱动器等)与文件系统关联起来,以便能够访问和使用其存储空间。 二.步骤 1.查找移动硬盘:

数据检索的优化之道:B树与B+树的深度解析与应用探索

1、引言 在信息时代,数据检索的速度和效率对于任何依赖数据处理的系统来说都至关重要。无论是在线搜索引擎、数据库管理系统还是文件存储系统,快速准确地检索所需数据都是核心需求。传统的线性数据结构在处理大规模数据集时往往力不从心,因此…

计算器(C语言)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 介绍关键代码运行代码(3种) 介绍 标准计数器:执行加减乘除等等科学计算器:执行分数、统计学、指数函数、对数、三角…

封装Element-Plus表单组件

业务组件 <template><m-form ref="form":options="options" label-width="100px"@on-preview="handlePreview"@on-remove="handleRemove"@before-remove="beforeRemove"@on-exceed="handleExceed&…

如何学习JVM的知识

文章目录 1. 明确学习JVM知识的目的2. 高屋建瓴地审视知识点 1. 明确学习JVM知识的目的 为什么需要学习jvm的知识&#xff1f; jvm的知识重点是内存分配和垃圾回收&#xff0c;这些都是能更深入理解java代码运行原理的关键&#xff0c;也是求职面试中绕不过去的一个坎。 并且它…

BoostCompass(数据准备预处理模块)

阅读导航 一、网页数据下载二、编写数据去标签与数据清洗的模块 Parser✅boost 开发库的安装1. 基本思路2. 详细讲解&#xff08;1&#xff09;程序递归遍历目录&#xff0c;收集所有HTML文件的路径&#xff08;2&#xff09;对每个HTML文件进行解析&#xff0c;提取出文档标题…

【资源分享】书籍:现代统计学:使用Python的计算方法

::: block-1 “时问桫椤”是一个致力于为本科生到研究生教育阶段提供帮助的不太正式的公众号。我们旨在在大家感到困惑、痛苦或面临困难时伸出援手。通过总结广大研究生的经验&#xff0c;帮助大家尽早适应研究生生活&#xff0c;尽快了解科研的本质。祝一切顺利&#xff01;—…

【微服务】------微服务架构技术栈

目前微服务早已火遍大江南北&#xff0c;对于开发来说&#xff0c;我们时刻关注着技术的迭代更新&#xff0c;而项目采用什么技术栈选型落地是开发、产品都需要关注的事情&#xff0c;该篇博客主要分享一些目前普遍公司都在用的技术栈&#xff0c;快来分享一下你当前所在用的技…

深入理解与实践:npm常用命令全面解析

引言 npm的重要性&#xff1a;简要介绍npm&#xff08;Node Package Manager&#xff09;作为Node.js生态系统的基石&#xff0c;其在JavaScript开发中的角色和作用。npm的功能概述&#xff1a;包管理和发布、依赖管理、版本控制、脚本执行等核心功能说明。 一、npm基础操作 …

Docker设置ustc的镜像源(镜像加速器:修改/etc/docker/daemon.json文件)

1、ustc简介 ustc是老牌的linux镜像服务提供者了&#xff0c;还在遥远的ubuntu 5.04版本的时候就在用。ustc的docker镜像加速器速度很快。ustc docker mirror的优势之一就是不需要注册&#xff0c;是真正的公共服务。 https://lug.ustc.edu.cn/wiki/mirrors/help/docker&#x…

ES6 => 箭头函数

目录 语法基本形式 参数 函数体 特点 箭头函数&#xff08;Arrow Function&#xff09;是ES6&#xff08;ECMAScript 2015&#xff09;中引入的一种新的函数语法&#xff0c;它提供了一种更简洁的方式来编写函数。箭头函数有几个显著的特点和优势&#xff0c;下面我们来详细…

Java每日一题(三道同一类型的题)

前言 本文一共有三道题:1.两数之和 2.三数之和 3. 四数之和 为什么把这三道题放一起呢&#xff0c;因为三数之和是可以根据两数之和进行推导&#xff0c;四数之和可以根据三数之和进行推导。 两数之和 思路分析: 我的思路: 1.排序 2.使用左右指针 3.处理细节问题 先让数组…

react17中使用setState导致了死循环

在使用setState时发生死循环的错误&#xff0c;可能的原因是在这三个地方使用了setState&#xff1a; componentDidUpdate&#xff1b;componentWillUpdate&#xff1b;render。 为什么会这样? 每次渲染页面的时候就会调用render&#xff0c;render里面是setState&#xff0…

生活中的数学 --- 等额本息贷款和等额本金贷款的月供应该怎么算?

等额本息贷款和等额本金贷款的月供应该怎么算&#xff1f; 从一个例子开始&#xff0c;假设我要从银行贷款36万(即&#xff0c;本金)&#xff0c;银行给出的贷款年利率是12%(月利率为年利率除以12)&#xff0c;贷款半年(6个月)&#xff0c;按月还款&#xff0c;分6期还完。 问分…

电池二次利用走向可持续大循环周期的潜力和挑战(第二篇)

一、二次利用风险 电动汽车的当前电池信息&#xff0c;如年份、容量和制造商&#xff0c;通常是相互关联和不完整的。再加上电池内部的电化学变化&#xff0c;SLB在包括安全和环境在内的一些领域存在很大的风险&#xff0c;这表明短期内梯次利用仍然是一个不成熟的方案。 1.1 安…