19 做好微服务间依赖的治理和分布式事务

在前两讲里,分别从微服务的对外接口、消息消费以及微服务自身的相关编码规范上阐述了“防备上游、做好自己”这两个准则如何落地。

在本讲里,将会讲解为什么要“怀疑下游”,以及有哪些手段可以落地此条准则。此外,还会介绍在进行微服务拆分后,调用外部依赖会产生的分布式事务、消息发送等问题的应对方案。

为什么要怀疑下游

首先我们先来回顾一下“第 17 讲”里介绍过的抽象的微服务架构,如下图 1 所示:

图 1:抽象的架构示意图

从图一中可以看到,微服务会依赖很多其他微服务提供的接口、数据库、缓存,以及消息中间件等,这些接口及存储可能会因为代码 Bug、网络、磁盘故障、上线操作失误等因素引发线上问题。此时,由于依赖不可用,就会导致微服务对外提供的服务受到影响,出现接口可用率下降或者直接宕机的情况。

为了防止上述情况的发生,在构建微服务时,就需要预先考虑微服务所依赖的各项“下游”出现故障时的应对方案。假设下游出现故障及预设计对应的方案的过程,便是在实践“怀疑下游”。

如何落地

下面将基于下图 2 所展示的三大类依赖:其他微服务、数据库、消息中间件,逐一介绍可能引发的故障的应对方案和最佳使用准则。

图 2:包含三大类依赖的微服务图

对其他微服务的依赖

在采用了微服务的架构后,各个模块间均通过 RPC 的方式进行依赖,有些模块在完成一项业务流程时可能会依赖多达几十、上百个外部微服务。比如在完成下单的流程里,就需要依赖用户、商品、促销、价格、优惠券等各个微服务提供的接口,这些被依赖的微服务的稳定性直接影响了用户是否能够成功下单。因此,需要对微服务依赖的其他微服务接口进行可用性的治理。

在“第 10 讲”里,已经从写服务的角度介绍了通过依赖后置、依赖并行化、设置超时和重试、服务降级等手段,来对它的依赖进行治理,进而保障写服务的高可用。其实这些手段依然可以用在读服务里,此处便不再赘述,你可以回到“第 10 讲”进行复习。

下面将重点讲解在采用微服务架构后,如何应对随之而来的分布式事务。这里以提单作为案例,介绍分布式事务的实际场景。在微服务架构下,订单和库存是两个单独的微服务,它们之间的架构如下图 3 所示:

图 3:订单和库存组成的微服务架构图

在提单时,订单模块需要调用库存模块进行商品的扣减,以便判断用户购买的商品是否有货。订单调用库存的扣减接口会有以下几种情况发生。

调用库存接口返回成功且库存数量充足,订单模块便将此用户订单保存至数据库,并返回用户下单成功消息。

调用库存接口返回成功且库存数量充足,但订单模块将此用户订单保存至数据库时出错并进行数据库回滚,同时订单模块返回用户下单失败。

调用库存接口超时,订单模块判断此次调用库存接口失败,返回用户下单失败。

...

在微服务化之后,上述订单模块和库存模块的交互会产生非常多的可能性场景。此处我只罗列了几个,你可以继续向后梳理。其中,上述的第 2 、3 点描述的场景里就存在分布式事务问题。在第 2 点里,因为订单模块本地的数据库事务回滚了,但调用库存接口产生的已扣减的商品数量并没有回滚,此时就会导致库存数据少于实际的数据。

有一些基于 TCC 和 Saga 的成熟基础框架可以解决上述分布式事务问题,但理解和接入成本较高。此处介绍一种本质上和 TCC、Saga 理论相类似,但无须借助第三方框架的简单、易落地的解决方案。理解此方案也有助于你理解 TCC 和 Saga 的思想。

此方案的架构图如下图 4 所示,图中订单模块的数据库里除了订单原有的表之外,会增加一张任务表。

图 4:基于本地数据库的分布式事务架构

基于上述的架构,下单流程变更如下。

在接收到下单请求后,在调用任何外部 RPC 前,先将此订单的相关信息,如此次用户购买的商品、商品数量、用户账号、此次订单的编号等信息写入新增的任务表中。

调用库存的接口进行商品数量的扣减,并根据库存模块的返回值更新订单模块的数据库。这一步,又细分为以下几种场景情况:

(1)如果调用库存接口成功,则在同一个事务中,将订单信息写入订单库中,同时更新第一步写入任务的状态为“已成功”;

(2)如果调用库存接口明确返回失败,则直接更新订单库中的任务状态为“待回滚”,并返回用户下单失败;

(3)如果调用库存接口超时,则直接更新订单库中的任务状态为“待回滚”,并返回用户下单失败;

(4)无论调用库存接口是成功还是失败,只要在更新本地订单库时失败,就返回用户下单失败,同时任务库的状态保留为“初始化”。

上述介绍的是用户下单的同步流程,完成这两个步骤后,用户下单便结束了。我们再来看看下单后的异步情况。

下单完成后,异步 Worker 功能是扫描订单库新增的任务表,获取状态为“待回滚”,任务创建时间距扫描时间点超过一定时间区间(如 5 分钟)仍为“初始化”状态的任务。获取到这些任务之后,会基于任务表中的商品和对应的数量信息,异步地调用库存接口进行商品数据的返还。

通过上述方式,能够将各种失败场景里漏返回的商品数量进行返还,保证库存数量的最终一致性,完成分布式事务。上述保障数据最终一致性主要是依赖任务表和订单表在同一个数据库里,可以通过本地事务来保障订单表数据写入成功后,任务表里的任务状态绝对能够更新为“已成功”。而当提单失败后,任务表的状态为“非成功”状态,再通过类似 TCC 和 Saga 的异步补偿性 Worker 来进行业务回滚即可保证最终最一致性。

在发起分布式事务的业务模块的数据库里创建补偿性任务,基本上可以复用在其他存在分布式事务的场景里。如果你不希望引入更加复杂的 TCC 和 Saga 框架,可以尝试利用此方式来解决架构微服务化之后带来的分布式事务的问题。

对数据库的依赖

除了对其他微服务的依赖,微服务中最常见的便是对数据库的依赖。在使用时,需要遵守以下几点基本原则。

原则一:数据库一定要配置从库,且从库部署的机房需要与主库不同,从而保障数据库具备跨机房灾备的能力。

此外,对于测试环境的数据库依然要配置主从复制,防止某天测试环境的数据库磁盘损坏,需要耗费大量人力恢复测试环境。

原则二:在能够完成功能的前提下,使用的 SQL 要尽可能简单。

因为 SQL 和代码一样,除了完成功能之外,最重要的是清晰简单地表达其自身含义,以供后续研发人员进行维护。我曾经在线上遇到过为了不使用唯一索引,纯使用 SQL 来完成防重的语句,它包含了四层 insert、select、exists、select 的语法嵌套。这一语句因为无法调试(Debug),导致后续一个需求的上线时间延期了 2 天,最终还是痛定思痛地进行了重构。

原则三:在业务需求不断更新迭代的场景里,最好不要使用外键。

大学时期的数据库理论课曾提到,需要使用外键来校验数据完整性。比如,在 A、B 表之间有了外键约束之后,可以设置外键级联删除,当 A 表中的某条数据删除后,自动级联地删除 B 表中的数据。此方式表面上可以极大地简化代码操作,但实则隐藏着巨大风险。因为现今互联网需求的迭代速度非常快,上个月可能 A、B 表中还存在外键关系,到了下个月又因为需求不存在了,或者需要更多字段组合才能形成外键关系。

此外,外键关系是隐藏在数据库的建表语句里的,在新需求开发时,很容易被遗忘、清除或者修改为新的外键关系。在新需求上线后,也可能因此疏漏导致线上数据被误删,进而引发线上问题。

原则四:表结构中尽可能不要创建一个长度为上千或上万的 varchar 类型字段,且用其来存储类似 JSON 格式的数据,因为这会带来并发更新的问题。

假设创建了一个长度一千的 varchar 字段,它存储了如下的信息:

{"fieldA":"valueA","fieldB":"valueB"}

此时假设有两个请求同时对此字段进行修改,A 线程将此字段的值读取后修改了其中 filedA 的值,具体修改如下:

{"fieldA":"valueAA",:"fieldB":"valueB"}

而 B 线程将此字段的值读取后修改了其中 fieldB 的值,具体修改如下:

{"fieldA":"valueA",:"fieldB":"valueBB"}

那么,最终数据库中此字段的值会变成什么呢?

答案是不一定。这取决于 A、B 这两个线程的最终修改顺序。但不管顺序如何,最终的结果都是错误的。因为 A、B 两个线程各修改了JSON 内容的其中一个字段,最终期望的结果是 fieldA、fieldB 两个字段都得到更新,但实际只会有一个字段得到更新。

因此,在创建表结构的时候,不建议设置此类型的字段。如果期望这两个字段都得到更新,你需要借助并发锁来实现,但这也增加了代码实现的难度。

对消息中间件的依赖

在微服务的架构里,微服务间的通信除了接口调用的方式外,当前最常见的方式便是基于消息中间件(如 RabbitMQ 和 Kafka)的消息通信。同样,在使用消息中间件时,仍有一些基础原则需要你尽可能地遵守。

原则一:数据要先写入数据库或缓存后,再发送消息通知。

因为很多消息接收方在接收到消息通知后,会调用发送消息的微服务的接口进行数据反查,以便获取更多信息来做下一步业务的流转。

假设订单模块在判断用户的下单请求的库存能够满足后, 便向外发送下单成功的消息。此时,如果物流系统监听了此消息,就会在获取到下单成功的通知后,第一时间去反查订单的接口,以便获取更多订单相关信息(如用户期望的收货时间、用户是否为会员等)来辅助判断何时发货。在极端情况下,可能会因为订单模块的数据还未写入数据库,导致反查不到数据,进而影响业务的正常流转。

原则二:发送的消息要有版本号。

有些消息中间件为了提升消息消费的吞吐量,支持乱序消费。但如果发送的消息没有数据变更版本号,消息消费方会因此无法判断数据是否乱序,进而有可能导致数据错乱,产生线上问题。

原则三:消息的数据要尽可能全,进而减少消息消费方的反查。

微服务间使用消息通信的目的就是解耦,但如果消息中包含的信息量太少,消息消费方就无法基于其中的信息处理业务,此时消息消费方便需要反查发送方的接口,来获取更多信息,但这样处理就达不到解耦的目的了,你可以参考第一点物流系统的案例。因此,在可能的情况下,建议发送尽可能全的信息。

原则四:消息中需要包含标记某个字段是否变更的标识。

根据原则三,你可能会发送包含较多字段的消息,有些字段可能在当次消息中并未发生数据变更。如果没有标记字段是否变更,可能会产生无效通知的情况。

比如一个消息包含两个字段(如为 A、B),而某一个消息的接收方(如用户模块)只关心 A 字段是否变更。如果没有标记变更字段,那么 B 字段变更后,消息发送方也会发送消息,这会导致“用户模块”误以为 A 字段发生了变更,进而触发“用户模块”执行一次本不应该执行的业务流程。

本节总结

本讲介绍了采用微服务架构后,不可避免的分布式事务的解决方案,同时介绍了微服务常见的依赖:数据库、消息中间件的基本治理原则。后续你可以将本讲学习到的内容应用到你所负责的微服务的依赖治理中去。

最后,我再给你留一道讨论题,你所负责的微服务对于它的依赖的使用,有哪些基本原则?欢迎留言区留言,咱们一起讨论。

这一讲就到这里,感谢你学习本次课程,接下来我们将学习20 | 如何通过监控快速发现问题。再见。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/5657.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于springboot实现迪迈手机商城设计系统项目【项目源码+论文说明】

基于springboot实现迪迈手机商城设计系统演示 研究背景 当前社会各行业领域竞争压力非常大,随着当前时代的信息化,科学化发展,让社会各行业领域都争相使用新的信息技术,对行业内的各种相关数据进行科学化,规范化管理。…

Java面试重点之反射机制

一、 反射是什么? 允许程序在运行时查询和操作对象的类型信息。通过反射,程序能够在运行时获取对象的类定义信息,如类的名称、方法、字段、注解等,并且可以动态地调用对象的方法或访问其字段,而无需在编译时具体知道对…

编写你的第一个 golang 的应用程序

进行你的第一个golang的程序 当你把程序都安装好以后 环境变量配置 好 vscode 插件下载好以后 1. 创建一个test.go 的文件 //主包,可执行文件所在包 package main//导入包 import "fmt"//主函数,入口函数 func main() { }2.解释 需要导入包 …

WPF之border标签边框控件、设置弧度、图片

border标签在WPF中承担着边框的角色又称之为边框标签,使用嵌套的方法去给一些标签添加边框,border标签包裹目标标签(border不能有多个子元素)。一般在给标签添加弧度时可以使用border。 常用属性 CornerRadius边框拐角的弧度,当宽高是一样的…

Alibaba Cloud Linux 3.2104 LTS 64位安装mysql 8.0报错

问题描述 Alibaba Cloud Linux 3.2104 LTS 64位安装mysql 8.0提示 Error: GPG check FAILED 问题原因 官方 MySQL 存储库的 GPG 密钥已过期,无法安装或更新 MySQL 包 mysql官网也提交了该bug: https://bugs.mysql.com/bug.php?id106188 …

动态增删表格

期望目标&#xff1a;实现一个能通过按钮来动态增加表格栏&#xff0c;每次能添加一行&#xff0c;每行末尾有一个删减按钮。 <el-button type"text" class"primary"click"addMember()">添加</el-button> <el-table:data"m…

Pandas Series的运算原来这么简单

Series的运算主要包括加法、减法、乘法和除法等基本算术运算。这些运算通常是按照索引对应计算的&#xff0c;如果两个Series的索引不同&#xff0c;则结果中对应位置将填充为NaN&#xff08;空值&#xff09;。 需要注意的是&#xff0c;在进行Series运算时&#xff0c;需要确…

【linux】进程(深入理解linux进程状态)

开始之前先说一个与本文无关的小知识&#xff0c;chdir命令可以更改当前进程的工作目录哦。 目录 linux具体进程状态&#xff1a;R && S&#xff1a;T && t&#xff1a;D&#xff1a;僵尸进程 && 孤儿进程&#xff1a; OS的理论线&#xff1a;运行&…

讯饶科技 X2Modbus 敏感信息泄露

讯饶科技 X2Modbus 敏感信息泄露 文章目录 讯饶科技 X2Modbus 敏感信息泄露漏洞描述影响版本实现原理漏洞复现修复建议 漏洞描述 X2Modbus是一款功能很强大的协议转换网关&#xff0c; 这里的X代表各家不同 的通信协议&#xff0c;2是To的谐音表示转换&#xff0c;Modbus就是最…

Ps:应用智能锐化滤镜

智能锐化 Smart Sharpen滤镜具有“USM 锐化”滤镜所没有的锐化控制功能。不仅可以设置不同的锐化算法&#xff0c;还可以分别控制在阴影区域和高光区域中进行的锐化量。 ◆ ◆ ◆ 一般使用方法与步骤 1、根据模糊的原因选择“移去”算法&#xff0c;默认是“高斯模糊”。 2、…

制作场景资源的Prefab

制作骨骼模型的Prefab 现在游戏内的使用骨骼模型是通过老版的Animator去实现控制的&#xff0c;所以需要将模型切换为Animator 第一步&#xff0c;动画类型设置为Generic&#xff0c;创建Avatar 模型里面会有对应的Avatar文件 我们还需要一个Controller文件&#xff0c;用于…

Go 语言基础(二)【数组、切片、指针、map、struct】

1、数组 特别需要注意的是&#xff1a;在 Go 语言中&#xff0c;数组长度也是数组类型的一部分&#xff01;所以尽管元素类型相同但是长度不同的两个数组&#xff0c;它们的类型并不相同。 1.1、数组的初始化 1.1.1、通过初始化列表{}来设置值 var arr [3]int // int类型的数…

ArrayList知识点详解

目录 1.简介 2.ArrayList的使用 &#xff08;1&#xff09;如何实例化ArrayList&#xff1f;&#xff08;如何创建&#xff1f;&#xff09; &#xff08;2&#xff09;如何构造使用&#xff1f; &#xff08;3&#xff09;为什么ArrayList的无参构造可以添加数据 &#…

rust疑难杂症

rust疑难杂症解决 边碰到边记录&#xff0c;后续可能会逐步增加&#xff0c;备查 cargo build时碰到 Blocking waiting for file lock on package cache 原因是Cargo 无法获取对包缓存的文件锁&#xff0c; 有时vscode中项目比较多&#xff0c;如果其中某些库应用有问题&…

深入理解多层感知机MLP

1. 基础理论 神经网络基础&#xff1a; 目标&#xff1a;了解神经网络的结构&#xff0c;包括神经元、权重、偏置和激活函数。 神经网络是由多个层次的神经元组成的网络&#xff0c;它模拟了人脑处理信息的方式。每个神经元可以接收输入、处理输入并生成输出。这一过程涉及到…

c#数据库: 11.分组统计学生信息/ 12.视图查询

该例以学生信息表为例&#xff0c;将学生信息按年级和性别分组&#xff0c;统计各年级男生和女生的人数、总成绩和平均成绩&#xff0c;并将查询结果按平均成绩降序排列。下图是原数据表staq: 【C#实现过程】 &#xff08;1&#xff09;创建一个名为StudentGroup的窗体应用程序…

RK3588S和ARM阵列服务器在虚拟化云平台的应用

RK3588是瑞芯微2021年底推出的首款高端8nm旗舰芯片&#xff0c;而RK3588S 则是针对消费端市场在RK3588基础上缩减了部分外围接口&#xff0c;CPU、GPU和NPU等主要参数得到了保留&#xff0c;主要应用范围为高端ARM平板、ARM笔电产品&#xff0c;会议平板类、ARM服务器、智能机器…

如何批量删除多个不同路径的文件但又保留文件夹呢

首先&#xff0c;需要用到的这个工具&#xff1a; 度娘网盘 提取码&#xff1a;qwu2 蓝奏云 提取码&#xff1a;2r1z 1、我准备了三个文件夹&#xff08;实际操作的时候可能是上百个文件夹&#xff0c;无所谓&#xff09;&#xff0c;里面都放了两个图片 2、然后打开工具&am…

【Gateway】网关集成Knife4j—swagger接口文档

文章目录 前言一、相关配置1.网关gateway配置①.网关增加配置 pom文件②.网关增加配置 SwaggerHandler③.网关增加配置 SwaggerResourceConfig④.网关增加配置 SwaggerConfig 2.网关过滤器 二、接口文档使用1.访问文档2.查看文档 总结 前言 在日常开发中是需要前后端联调的&am…

09_Scala函数和对象

文章目录 函数和对象1.函数也是对象 scala中声明了一个函数 等价于声明一个函数对象2.将函数当作对象来用&#xff0c;也就是访问函数&#xff0c;但是不执行函数结果3.对象拥有数据类型(函数类型)&#xff0c;对象可以进行赋值操作4.函数对象类型的省略写法&#xff0c;也就是…