监控与警报设计哲学

监控指标

监控系统的4个黄金指标分别是

  1. 延迟
    处理请求所需要的时间。需要区分成功请求和失败请求的延迟,计算总体延迟时,如果将失败请求的延迟也计算在内,可能会产生误导性的结果。但是,“慢”错误要比“快”错误更糟!因此,监控错误回复的延迟是很重要的。

  2. 流量
    对系统负载进行衡量,比如:请求数、并发数、I/O速率

  3. 错误
    显式错误:如http表示的系统内部异常状态500、网络超时问题
    隐式错误:如http状态200时回复内容中包含的错误信息

  4. 饱和度
    即系统资源利用率,比如内存、CPU、IO带宽、磁盘利用率

监控方式

黑盒监控 是面向现象的,代表了目前正在发生的—而非预测会发生的—问题,即“系统现在有故障”。如以用户的角度检测DNS故障、系统存活状态。
白盒监控 则大量依赖对系统内部信息的检测,如系统日志、抓取提供指标信息的HTTP节点等。

两种方式的区别:白盒是对系统内部状态进行检测,黑盒是在系统外部对系统可提供的服务进行检测。

减少监控误报

当为监控系统和警报系统增加新规则时,回答下列问题可以帮助减少误报:

  1. 该规则是否能够检测到一个目前检测不到的、紧急的、有操作性的,并且即将发生或者已经发生的用户可见故障?
  2. 是否可以忽略这条警报?什么情况可能会导致用户忽略这条警报,如何避免?
  3. 这条警报是否确实显示了用户正在受到影响?是否存在用户没有受到影响也可以触发这条规则的情况?例如测试环境和系统维护状态下发出的警报是否应该被过滤掉。
  4. 收到警报后,是否要进行某个操作?是否需要立即执行该操作,还是可以等到第二天早上再进行?该操作是否可以被安全地自动化?该操作的效果是长期的,还是短期的?
  5. 是否也会有其他人收到相关的紧急警报,这些紧急警报是否是不必要的?

以上这些问题其实反映了在应对紧急警报上的一些深层次的理念:

  1. 每当收到紧急警报时,应该立即需要我进行某种操作。每天只能进入紧急状态几次,太多就会导致“狼来了”效应。
  2. 每个紧急警报都应该是可以具体操作的。
  3. 每个紧急警报的回复都应该需要某种智力分析过程。如果某个紧急警报只是需要一个固定的机械动作,那么它就不应该成为紧急警报。
  4. 每个紧急警报都应该是关于某个新问题的,不应该彼此重叠。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/37586.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

七人团购新风尚:数字化时代的购物革命

在数字化时代的浪潮中,购物方式正经历着前所未有的变革。其中,七人团购模式以其独特的互动性和价值共享理念,为消费者带来了全新的购物体验。下面,我们将深入探讨这一模式的运作机制,以及它如何为标价599元的热销商品创…

获取文件绝对路径的几种方法比较

获取文件绝对路径的几种方法比较 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们来探讨在Java中获取文件的绝对路径的几种方法及其比较。在软件开发中&…

WordPress Quiz Maker插件 SQL注入漏洞复现(CVE-2024-6028)

0x01 产品简介 WordPress Quiz Maker插件是一款功能强大的测验生成工具,旨在帮助用户轻松、快速地构建复杂的测验和考试。插件支持多种问题类型,包括单选框(MCQ)、复选框(MCQ)、下拉列表(MCQ)、文本、短文本、数字、日期等。还支持横幅(HTML)显示信息性消息、填空题…

ChatGPT-5:开创对话式AI的新纪元

随着科技的飞速发展,人工智能(AI)正在迅速改变我们的生活方式。作为AI技术的前沿代表之一,ChatGPT自其初次发布以来,就以其强大的语言理解和生成能力受到了广泛关注和应用。如今,OpenAI推出最新版本——Cha…

自养号测评助力:亚马逊、沃尔玛电商高效测评补单技巧,轻松实现销量与补单双赢

要在竞争激烈的市场中通过测评补单的方式提升产品权重和销售,构建一个稳定且高效的测评补单系统至关重要。通过精心培养一批高质量的买家账号,并深入了解真实买家的行为数据,结合对风控数据的精准把控,我们能够自主推动推广进程&a…

循环神经网络——RNN

循环神经网络 在之前NLP基础章节-语言模型中我们介绍了 n n n 元语法,其中单词 x t x_t xt​ 在时间步 t t t 的条件概率仅取决于前面 n n n 个单词,若是想要将之前单词的影响也加入那么模型参数数量会指数级增长。但是可能之前的单词存在重要的信息…

58岁TVB前视后近况曝光

众所周知,不少早年的TVB视帝视后如今在内地都很吃香,就比如说今年58岁的邓萃雯(雯女)。 近日由她与演员赵文瑄、张凯丽等合演的话剧《鳄鱼》在内地巡回演出,吸引了大批粉丝到场支持,不过就在雯女准备进入演…

vue3 动态配置element 的table

需求 合并行、合并标题、列宽可调整、列顺序可调整、可以控制列是否显示、列布局可保存、导出excel… 参考效果 代码 引入 npm i xlsx npm install element-plus --savetable组件 <template><div><div class"table-btn"><el-tooltip conte…

手写一个基于SpringBoot的MVC架构,默认实现CRUD和导入导出功能

文章目录 前言正文一、项目结构二、技术点三、部分核心代码3.1 core-tool 中的核心代码3.1.1 所有实体的通用父类 SuperEntity3.1.2 所有枚举的父接口 BaseEnum3.1.3 所有业务异常的父接口 BaseException 3.2 mvc-tool 中的核心代码3.2.1 CrudController 接口定义3.2.2 默认的C…

编译原理必考大题:子集法将NFA转换为DFA【详细讲解,真题实战】

写在最前&#xff0c;本文为实战向&#xff0c;解决问题的求法&#xff0c;理论基础见我的上一篇博客,当然了&#xff0c;只做题的话&#xff0c;看这个就够用了 文章目录 NFA转换为DFA如何求ε-闭包&#xff1f;如何求状态转换弧集?NFA转换为DFA的方法论真题实战例题一例题二…

MySQL学习(3):SQL语句之数据定义语言:DDL

1.SQL通用语法与分类 &#xff08;1&#xff09;通用语法 &#xff08;2&#xff09;分类 2.DDL 2.1数据库操作 show DATABASES; #查询所有数据库select DATABASE(); #查询当前数据库create DATABASE 数据库名称 [default charest 字符集] [collate 排列规则]; #default cha…

昇思25天学习打卡营第05天|sea_fish

打卡第5天&#xff0c;学习数据变换Transform&#xff0c;记录学习的内容。 数据变换 Transforms 通常情况下&#xff0c;直接加载的原始数据并不能直接送入神经网络进行训练&#xff0c;此时我们需要对其进行数据预处理。MindSpore提供不同种类的数据变换&#xff08;Transf…

Perl 语言精髓:三元运算符的深度解析与应用

标题&#xff1a;Perl 语言精髓&#xff1a;三元运算符的深度解析与应用 摘要 Perl 是一种功能强大的脚本语言&#xff0c;以其灵活的语法和强大的文本处理能力而闻名。Perl 中的三元运算符是实现条件赋值和简洁表达式的强大工具。本文将深入探讨 Perl 中三元运算符的使用方法…

[NeurIPS2021] Deep Residual Learning in Spiking Neural Networks【文献精读、翻译】

深度残差学习在脉冲神经网络中的应用 Fang W, Yu Z, Chen Y, et al. Deep residual learning in spiking neural networks[J]. Advances in Neural Information Processing Systems, 2021, 34: 21056-21069. 摘要 深度脉冲神经网络 (SNNs) 因为使用离散的二进制激活和复杂的时…

讨论stl链表

讨论链表 list迭代器失效list的模拟实现创建结点类链表迭代器完成实现代码 list与vector 链表是一个序列容器&#xff0c;在任意位置都可以用常数时间插入或者删除&#xff0c;并且可以在两个方向进行迭代。 list迭代器失效 迭代器失效指迭代器所指向的结点无效&#xff0c;即该…

淘宝扭蛋机小程序开发:为消费者带来新的潮玩乐趣

在当下的消费市场&#xff0c;潮玩消费已经成为了年轻人的新宠&#xff0c;预计在近几年间潮玩市场的销售额将达到千亿元&#xff01;其中扭蛋机市场更是吸引了各个阶段的消费群体&#xff0c;在市场巨大的发展前景下&#xff0c;同时也吸引了众多投资者入局&#xff0c;市场竞…

SuperMap iDesktop

SuperMap iDesktop 介绍 SuperMap iDesktop是一款由超图公司推出的企业级插件式桌面GIS软件&#xff0c;它通过SuperMap iObjects .NET、桌面核心库和.NET Framework 4.0构建&#xff0c;集成了地图制作、空间分析、数据编辑、三维分析等多种功能于一体&#xff0c;为用户提供…

el-date-picker限制开始时间不能大于结束时间,且结束不能小于开始时间

<div class"des-status-df">开始</div><div class"block"><el-date-picker:picker-options"startDatePicker"v-model"startTime"type"datetime"placeholder"选择日期时间"></el-date-…

标准版回收站的商品怎么删除?

管理后台/维护/数据维护/清除数据 里面就可以清空回收站的商品