服务降级的快速发现与三方告警

一、熔断与降级

1、降级

  • 基本概念
    • 服务降级是从整个系统的负荷情况出发和考虑的,对某些负荷会比较高的情况,为了预防某些功能(业务场景)出现负荷过载或者响应慢的情况,在其内部暂时舍弃对一些非核心的接口和数据的请求,而直接返回一个提前准备好的fallback(退路) 错误处理信息。
    • 虽然提供的是一个有损的服务,但却保证了整个系统的稳定性和可用性。
  • 出现原因
    • 服务器的资源是有限的,而请求是无限的。在用户使用即并发高峰期,会影响整体服务的性能,严重的话会导致宕机,以至于某些重要服务不可用。故高峰期为了保证核心功能服务的可用性,就需要对某些服务降级处理,可以理解为舍小保大
  • 需要考虑的问题
    • 区分哪些为核心业务、哪些为非核心业务;
    • 降级的具体策略是什么(用户侧感知);
    • 自动降级还是手动降级;

2、熔断

  • 基本概念
    • 应对雪崩效应的链路自我保护机制。可看作降级的特殊情况,有时也称熔断为过载保护。
    • 服务熔断的作用类似于我们家用的保险丝,当某服务出现不可用或响应超时的情况时,为了防止整个系统出现雪崩,暂时停止对该服务的调用。
  • 出现原因
    • 微服务之间的数据交互一般通过远程调用来完成的。此时对于调用链:A -> B -> C。如果服务C的调用响应时间过长或者服务C不可用,随着时间的增长,对服务C的调用也越来越多,然后服务C崩溃了,但是链路调用还在,对服务B的调用也在持续增多,然后服务B整体崩溃,随之A也崩溃,从而造成导致雪崩效应。
    • 服务熔断是应对雪崩效应的一种微服务链路保护机制:
      • 当调用链路的某个微服务不可用或者响应时间太长时,会进行服务熔断,不再有该节点微服务的调用,快速返回错误的响应信息。
      • 当检测到该节点微服务调用响应正常后,恢复调用链路。
  • 需要考虑的问题
    • 如何在即将熔断时触发告警、避免实际熔断;
    • 熔断后依赖对象如何快速回复;
    • 熔断后如何快速感知熔断依赖对象已恢复;

3、异同点

  • 相同点:
    • 目标一致:都是从可用性与可靠性出发,避免系统崩溃;
    • 用户体验:最终用户感知到的都是某些功能暂时不可用;
  • 不同点:
    • 触发原因:降级是从整体负载考虑,熔断是由链路上的某个服务引起的;
    • 管理目标层次:降级是业务层级处理,熔断时框架层次处理;

简而言之:

  • 限流:限制并发的请求访问量,超过阈值则拒绝;
  • 降级:服务分优先级,牺牲非核心服务(不可用),保证核心服务稳定;从整体负荷考虑;
  • 熔断:依赖的下游服务故障触发熔断,避免引发本系统崩溃;系统自动执行和恢复;

二、降级详细说明

开发高并发系统时有三把利器用来保护系统:缓存、降级和限流

对于降级而言,当访问量剧增、服务出现问题(如响应时间慢或不响应)或非核心服务影响到核心流程的性能时,则需要执行手动或自动降级,其核心目的就是保证核心服务可用,即使是有损的

在进行降级之前要对系统进行梳理,看看系统是不是可以丢卒保帅;从而梳理出哪些必须誓死保护,哪些可降级,并给出对应的降级预案:

  • 自动开关降级:
    • 根据当前系统整体负载、资源使用、SLA等指标达成情况等,实行自动降级;
  • 人工开关降级:
    • 人为发现了现网存在相关问题(数据库连接池打满、慢查询增长过快、网络异常波动等),手动处理(手动杀掉进程、改同步为异步等)实现降级;
  • 超时降级:
    • 当访问的数据库/http服务/远程调用响应慢或者长时间响应慢,且该服务不是核心服务的话可以在超时后自动降级;
    • 果是调用别人的远程服务,和对方定义一个服务响应最大时间,如果超时了则自动降级;
  • 统计失败次数降级:
    • 有时候依赖一些不稳定的API,比如调用外部机票服务,当失败调用次数达到一定阀值自动降级;
    • 而后,通过异步线程去探测服务是否恢复了,则取消降级;
  • 故障降级:
    • 比如要调用的远程服务挂掉了(网络故障、DNS故障、http服务返回错误的状态码、rpc服务抛出异常),则可以直接降级;
    • 降级后的处理方案有:默认值(比如库存服务挂了,返回默认现货)、兜底数据(比如广告挂了,返回提前准备好的一些静态页面)、缓存(比如认证接口挂了、使用已缓存的token);
  • 限流降级:
    • 当访问量太大时,如果不做限流服务很容易被打挂。一般而言我们会对OpenAPI做访问量限制,达到限流阀值,后续请求会被降级;
    • 降级后的处理方案可以是:排队页面(将用户导流到排队页面等一会重试)、无货(直接告知用户没货了)、错误页(如活动太火爆了,稍后重试);

三、降级的发现与告警

由上面的说明我们了解,降级是服务可靠性保护的一种方式,通过降低业务功能或规格,避免流量过载或局部故障场景下造成服务整体不可用、从而影响核心特性。

但是我们也明白,本身降级是有损的,会对被降级服务的使用方造成影响。因此,当服务自身执行相关降级动作后,我们需要快速发现、并告警通知到被影响服务,避免降级给第三方服务造成影响。

这里,我们主要针对接口访问层面的降级操作,通过标准化日志打印、写入日志流的方法(利用日志组件自动实现),实现基于日志侧感知能力的降级发现与快速告警。

日志格式设计参考:

{"traceId": # 接口访问请求自动生成的追踪id"nenvId": # 调用方服务CMDB服务环境信息,是受到降级影响的服务"userId": # 调用方服务用户id信息"fallBackService": # 降级服务信息"fallBackFunction": # 降级函数信息"path": # 访问接口uri(不含参数)"currentTime": # 时间戳"msg": # 降级服务自定义降级信息
}

具体发现告警流程:

  • 日志流服务对设定的关键字(fallBackServicefallBackFunction)实时监控;
    • 该关键字可以确保唯一标识降级日志;
  • 发现对应关键字后,告警平台自动获取对应日志内容,并提取字段pathcurrentTimenenvId等字段;
  • 利用nenvId获取服务OnCall内容,并直接发起降级发生告警;

参考资料:

服务降级方案
服务降级与服务熔断区别
什么是熔断?什么是服务降级?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/661690.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI Prompt工程师 学习整理

前言 如果说Al大语言模型(LLM,Large Language Model)是宝藏我,那么Prompt提示词就是打开宝藏的钥匙。 最新一代的Al大语言模型具备出色的创作能力,能够生成富有人类感情、严谨逻辑、多场景应用的内容,而如何获得高质量的回答,正确学习使用Prompt提示词是关键。 &#x1f4a5…

【2024美国大学生数学建模竞赛】2024美赛C题网球运动中的势头,网球教练4.0没人比我更懂这个题了!!!

【2023美国大学生数学建模竞赛】2024美赛C题 问题分析、数学模型、实现代码、完整论文 引言 题目将于2024年2月2日6:00发布。我们团队将会在8点前准时更新问题分析,逐步更新数学模型和实现代码,最后发布完整的论文。 更新进展: &#xff08…

Java算法 leetcode简单刷题记录11

Java算法 leetcode简单刷题记录11 删除排序链表中的重复元素: https://leetcode.cn/problems/remove-duplicates-from-sorted-list/ 合并俩个有序数组: https://leetcode.cn/problems/merge-sorted-array/ int[]数组转 List: Arrays.stream(arr).colle…

轻型民用无人机驾驶航空器安全操控——理论考试多旋翼部分笔记

今天已经可以在线考取轻型民用无人机驾驶航空器执照了,所以我也在在线观看完视频之后整理了如下的知识点,所有知识点全部来自UOM平台。 目录 航空器知识 (1)多旋翼民用无人驾驶航空器螺旋桨的作用 (2&#x…

Servlet简述

Servlet是动态web资源开发技术,其实就是一个接口,将来定义Servlet实现类时,都必须实现该接口,并让web服务器运行Servlet 1.快速入门 使用注释配置访问路径在Servlet3.0之后应用,在此之前都是使用xml配置文件来配置的。…

WPS WORD 宏导出高亮文本

WPS手机版可以直接导出高亮文本,但只能导出手机编辑的部分,如果同时在电脑上编辑过,电脑上高亮的无法导出,因为作者不一样。 但WPS电脑版没有这个功能,只能通过宏编程实现。 这里利用了审阅模式,在文字高亮…

Java 8流(Stream API)实战:使用list.stream()判断里面的元素user.name是否全部都为空字符串

Java 8流 Stream API实战:使用list.stream判断里面的元素user.name是否全部都为空字符串 一、引言:二、主体部分:三、结尾段落: 一、引言: 在处理用户数据时,我们常常需要验证或操作集合中的每个元素。特别…

springBoot+Vue汽车销售源码

源码描述: 汽车销售管理系统源码基于spring boot以及Vue开发。 针对汽车销售提供客户信息、车辆信息、订单信息、销售人员管理、 财务报表等功能,提供经理和销售两种角色进行管理。 技术架构: idea(推荐)、jdk1.8、mysql5.X(不能为8驱动不匹配)、ma…

重温《深入理解Java虚拟机:JVM高级特性与最佳实践(第二版)》 –– 学习笔记(二)

第二部分:自动内存管理机制 第2章:Java内存区域与内存溢出异常 2.1 概述 Java 与 C 之间有一堵由内存动态分配和垃圾收集技术围成的高墙。 Java 程序员在 虚拟机自动内存管理机制 的帮助下,无需为每一个 new 操作去写配对的 delete/free …

Java知识点总结

数据类型强转:byte short int long float double ; 数组定义 [ ]数组名 clone-复制数组equals-比较存储地址 toString sort-排序 length-长度 arraycopy([]a,s,[]b,ss,n)-数组复制 运算符及语句 instanceof双目运算符 –左对象右类 判断是否是该类创建…

2024年美国大学生数学建模C题思路分析 - 网球的动量

# 1 赛题 问题C:网球的动量 在2023年温布尔登绅士队的决赛中,20岁的西班牙新星卡洛斯阿尔卡拉兹击败了36岁的诺瓦克德约科维奇。这是德约科维奇自2013年以来首次在温布尔登公开赛失利,并结束了他在大满贯赛事中历史上最伟大的球员之一的非凡…

JeecgBoot jmreport/loadTableData RCE漏洞复现(CVE-2023-41544)

免责声明:文章来源互联网收集整理,请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失,均由使用者本人负责,所产生的一切不良后果与文章作者无关。该…

three.js CSS2DRenderer、CSS2DObject渲染HTML标签

有空的老铁关注一下我的抖音&#xff1a; 效果&#xff1a; <template><div><el-container><el-main><div class"box-card-left"><div id"threejs" style"border: 1px solid red;position: relative;"><…

git传输大文件时候安装git lfs install报错git: ‘lfs‘ is not a git command. See ‘git --help‘.

git传输大文件时候安装git lfs install报错git: ‘lfs’ is not a git command. See ‘git --help’. 报错类似如下&#xff1a; git lfs install git: lfs is not a git command. See git --help.The most similar command isloggit lfs install git: ‘lfs’ is not a git …

OSPF 协议

OSPF 开放式最短路径优先协议 形容&#xff1a; 无类别链路状态协议&#xff1a; 无类别 ---- 存在掩码 IGP 内部网关协议 动态路由协议 一、链路状态协议(LS) OSPF 协议 隶属于 链路状态协议。 区别&#xff1a; 距离矢量协议(DV)&#xff1a;运行距离矢量协议的路由器…

MongoDB常用操作命令大全

文章目录 MongoDB常用操作命令大全基本概念一. 数据库常用命令1、Help查看命令提示2、切换/创建数据库3、查询所有数据库4、删除当前使用数据库5.从指定主机上克隆数据库6.从指定的机器上复制指定数据库数据到某个数据库7、修复当前数据库8、查看当前使用的数据库9、显示当前db…

HttpClient Jar包使用详解

HttpClient Jar包使用详解 大家好&#xff0c;我是免费搭建查券返利机器人赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01;今天&#xff0c;让我们深入研究Java中的HttpClient库&#xff0c;解析它的功能、用法以及…

《zdppy_aocrud官方教程》 10 自动生成根据ID列表查询接口

10 自动生成根据ID列表查询接口 《zdppy_aocrud官方教程》 10 自动生成根据ID列表查询接口 自动生成根据ID列表查询的方法 服务端 import aocrud import env import orm from api import Api, respenv.load("../.env")db, BaseModel orm.get_mysql_pool_base_mo…

Docker 镜像的创建

创建镜像有三种方法&#xff0c;分别为基于已有镜像创建、基于本地模板创建以及基于Dockerfile创建。 一、基于现有镜像创建 创建nginx镜像&#xff1a; 1、首先启动一个容器&#xff0c;在容器里做修改 2、然后将修改后的容器提交为新的镜像&#xff0c;需要使用该容器的 I…

Vue3中实现歌词滚动显示效果

目录 &#x1f389;前言 &#x1f389;整体布局 &#x1f389;处理歌词数据 &#x1f389;处理事件 &#x1f389;完整代码 &#x1f389;总结 &#x1f389;前言 在这篇博客中&#xff0c;我将分享如何在 Vue 3 中实现一个简单的歌词滚动效果。我将从歌词数据的处理开始&…