微服务架构下静态数据通用缓存机制

在分布式系统中,特别是最近很火的微服务架构下,有没有或者能不能总结出一个业务静态数据的通用缓存处理机制或方案,这篇文章将结合一些实际的研发经验,尝试理清其中存在的关键问题以及探寻通用的解决之道。

什么是静态数据

这里静态数据是指不经常发生变化或者变化频率比较低的数据,比如车型库、用户基本信息、车辆基本信息等,车型库这种可能每个月会更新一次,用户和车辆基本信息的变化来源于用户注册、修改,这个操作的频率相对也是比较低的。

另外这类数据的另一个特点是要求准确率和实时性都比较高,不能出现丢失、错误,以及过长时间的陈旧读。

具体是不是应该归类为静态数据要看具体的业务,以及对变化频率高低的划分标准。在这里的业务定义中,上边这几类数据都归为静态数据。

为什么需要缓存

在面向用户或车联网的业务场景中,车型信息、用户基本信息和车辆基本信息有着广泛而高频的业务需求,很多数据都需要对其进行关联处理。在这里缓存的目的就是为了提高数据查询效率。静态数据通常都保存在关系型数据库中,这类数据库的IO效率普遍不高,应对高并发的查询往往捉襟见肘。使用缓存可以极大的提升读操作的吞吐量,特别是KV类的缓存,没有复杂的关系操作,时间复杂度一般都在O(1)。注意这里说的缓存指内存缓存。

当然除了使用缓存,还可以通过其它手段来提高IO吞吐量,比如读写分离,分库分表,但是这类面向关系型数据库的方案更倾向于同时提高读写效率,对于单纯提升读吞吐量的需求,这类方案不够彻底,不能在有限的资源情况下发挥更好的作用。

通用缓存机制

下面将直接给出一个我认为的通用处理机制,然后会对其进行分析。

640?wx_fmt=png

对于某个具体的业务,其涉及到六个核心程序:

  • 业务服务:提供对某种业务数据的操作接口,比如车辆服务,提供对车辆基本信息的增删改查服务。

  • 关系数据库:使用若干表持久化业务数据,比如SQLServer、MySQL、Oracle等。

  • 持久化队列:可独立部署的队列程序,支持数据持久化,比如RabbitMQ、RocketMQ、Kafka等。

  • 缓存处理程序:从队列接收数据,然后写入缓存。

  • 数据一致处理程序:负责检查缓存数据库和关系型数据库中数据是否一致,如果不一致则使用关系数据库进行更新。

  • 缓存数据库(Redis):支持持久化的缓存数据库,这里直接选了Redis,这个基本是业界标准了。

以及两个外部定义:

  • 数据生产者:业务静态数据的来源,可以理解为前端APP、Web系统的某个功能或者模块。

  • 数据消费者:需要使用这些业务静态数据的服务或者系统,比如报警系统需要获取车辆对应的用户信息以便发送报警。

下面以问答的形式来说明为什么是这样一种机制。

为什么需要业务服务?

既然是微服务架构,当然离不开服务了,因为这里探讨的是业务静态数据,所以是业务服务。不过为了更好的理解,这里还是简单说下服务出现的原因。

当今业务往往需要在多个终端进行使用,比如PC、手机、平板等,既有网页的形式,又有APP的形式,另外某个数据可能在多种不同的业务被需要,如果将数据操作分布在多个程序中很可能产生数据不一致的情况,另外代码不可避免的冗余,读写性能更很难控制,变更也基本上是不敢变的。通过一个业务服务可以将对业务数据的操作有序的管理起来,并通过接口的形式对外提供操作能力,代码不用冗余了,性能也好优化了,数据不一致也得到了一定的控制,编写上层应用的人也舒服了。

为什么不是进程内缓存?

很多开发语言都提供了进程内缓存的支持,即使没有提供直接操作缓存的包或库,也可以通过静态变量的方式来实现。对数据的查询请求直接在进程内存完成,效率可以说是杠杠滴了。但是进程内缓存存在两个问题:

  • 缓存数据的大小:进程可以缓存数据的大小受限于系统可用内存,同时如果机器上部署了多个服务,某个服务使用了太多的内存,则可能会影响其它服务的正常访问,因此不适合大量数据的缓存。

  • 缓存雪崩:缓存同时大量过期或者进程重启的情况下,可能产生大量的缓存穿透,过多的请求打到关系数据库上,可能导致关系数据库的崩溃,引发更大的不可用问题。

为什么是Redis?

Redis这类数据库可以解决进程内缓存的两个问题:

  • 独立部署,不影响其它业务,还可以做集群,内存扩容比较方便。

  • 支持数据持久化,即使Redis重启了,缓存的数据自身就可以很快恢复。

另外Redis提供了很好的读写性能,以及方便的水平扩容能力,还支持多种常用数据结构,使用起来比较方便,可以说是通用缓存首选。

为什么需要队列?

队列在这里的目的是为了解耦,坦白的说这个方案中可以没有队列,业务服务在关系数据库操作完成后,直接更新到缓存也是可以的。 之所以加上这个队列是由于当前的业务开发有很明显的系统拆分的需求,特别是在微服务架构下,为了降低服务之间的耦合,使用队列是个常用选择,在某些开发模型中也是很推崇的,比如Actor模型。

举个例子,比如新注册一个用户,需要赠送其300积分,同时还要给其发个注册成功的邮件,如果将注册用户、赠送积分、发成功邮件都写到一起执行,会产生两个问题:一是注册操作耗时增加,二是其中某个处理引发整体不可用的几率增大,三是程序的扩展性不好;通多引入队列,将注册信息分别发到积分队列和通知队列,然后由积分模块和通知模块分别处理,用户、积分、通知三个模块的耦合降低了,相互影响变小了,以后再增加注册后的其它处理也就是增加个队列的事,整体的扩展性得到了增强。

队列作为一种常用的解耦方案,在缓存这里虽然产生的影响不大,但是除了缓存难免同时还会有其它业务处理,所以为了统一处理机制,这里保留了下来。(既然用了,就把它发扬光大。)

为什么队列需要持久化?

持久化是为了解决网络抖动或者崩溃导致数据丢失的问题,在数据从业务服务到队列,队列自身处理,再从队列到缓存处理程序,中间都可能丢失数据。为了解决丢失数据的问题,需要发送时确认、队列自身持久化、接收时确认;但是需要注意确认机制可能会导致重复数据的产生,因为在未收到确认时就需要重新发送或接收,而数据实际上可能被正常处理,只是确认丢失了;确认机制还会降低队列的吞吐量,但是根据我们的定义业务静态数据的变更频率应该不高,如果同时还需要较高的并发分片是个不错的选择。

这里持久化队列推荐选择RabbitMQ,虽然吞吐量支持的不是很大,但是各方面综合不错,并发够用就好。

为什么需要数据一致检查程序?

在业务服务操作完关系数据库后,数据发送到队列之前(或者不用队列就是直接写入缓存之前),业务服务崩溃了,这时候数据就不能更新到缓存了。还有一种情况是Redis发生了故障转移,master中的更新没有同步到slaver。通过引入这么一个检查程序,定时的检查关系数据库数据和缓存数据的差别,如果缓存数据比较陈旧,则更新之。这样提供了一种极端情况下的挽救措施。

这个检查程序的运行频率需要综合考虑数据库压力和能够承受的数据陈旧时间,不能把数据库查死了,也不能陈旧太久导致大量数据不一致。可以通过设置上次检查时间点的方式,每次只检查从上次检查时间点(或者最近几次,防止Redis故障转移数据未同步的问题)到本次检查时间点发生变更的数据,这样每次检查只对增量变更,效率更高。

同时需要理解在分布式系统中,微服务架构下,数据不一致是经常出现的,必须在一致性和可用性之间做出权衡,尽力去降低影响,比如使用准实时或最终一致性。

只要数据一致检查程序是不是就够了?

假设没有缓存处理程序,通过定时同步关系数据库和缓存数据库是不是就够了呢?这还是取决于业务,如果是车型库这种数据,增加一个新的车型,本来之前就没有,时间上并不是很敏感,这个是可以的。但是对于新增了用户或者车辆,数据消费者还是希望能够马上使用最新的数据进行处理,越快越好,这时使用同步或者准同步更新就能更加贴近需求。

640?wx_fmt=jpeg

为什么不用缓存过期机制?

使用缓存过期机制可以不需要缓存处理程序和数据一致检查程序,业务服务首先从Redis查询数据,如果数据存在就直接返回,如果不存在则从关系数据库查询,然后写入Redis,然后再返回,这也是一种常用的缓存处理机制,网上可以查询到很多,很多人用的也很好。

但是缓存的过期时间是个问题:缓存多长时间过期,设置的短可以降低数据的陈旧,但是会增加缓存穿透的概率,即使采用随机的缓存过期时间,在Redis重启或者故障转移的情况下还是会可能导致缓存雪崩,雪崩的情况下采用数据预热机制,也可能会导致服务更长时间的不可用;设置的长可以提升缓存的使用率,但是增加了数据陈旧,在上边对静态数据的定义中对其准确率和实时性都有较高的要求,业务上能不能接受需要考虑。而且如果操作数据和查询存在波动的峰谷,是不是要引入动态TTL的机制,以达到缓存使用和直接访问数据库的一种平衡,这就需要权衡业务需求和技术方案。

总结

通过上边的这些问题问答,再来看看上面提出的微服务架构下静态数据通用缓存处理机制。

  • 通过业务服务来包装对数据的操作,不管是操作关系数据库还是缓存数据库,数据消费者其实不需要关心,它只关心业务服务能不能提供高并发实时数据的查询能力。

  • 利用分布式系统中经常使用队列进行解耦的方式,业务服务不干写入缓存的事,增加一个队列订阅数据变更,然后从队列取数据写入缓存数据库。

  • 对于绝大部分正常的情况,通过队列更新缓存数据和业务服务中更新缓存数据,其实时性是差不多的,同时实现了业务操作和写缓存的解耦。

  • 在极端崩溃导致数据不一致的情况下,通过数据一致检查程序进行补救,尽快更新缓存数据。

  • 现在业务服务可以通过访问Redis缓存来提供对静态数据的高并发准实时查询能力,缓存中不存在的数据就是不存在,没有缓存穿透。

对于微服务架构而言,这个机制借助队列这种通用的解耦方式,独立了缓存更新处理,通过准实时更新和定时检查,保证了缓存的实时性和极端情况下较短时间内达到最终一致,通过缓存的持久化机制消除了缓存穿透和雪崩,在缓存的数据较大或读取并发较高时支持水平扩容,可以认为对业务静态数据提供了一种广泛适用的缓存处理机制。

这个方案在某些情况下可能是没有必要的,比如你要缓存一个全国限行的城市列表,使用一个进程内缓存就够了。

最后剩下的就是工作量的问题了,这个会给开发和维护带来复杂性,队列有没有用的顺手的,人手是不是够,业务需求是什么样的,需要考虑清楚。

后记

Redis耦合问题:图中业务服务直接访问了Redis,如果要实现业务服务对Redis的完全透明,这个还比较复杂,可以考虑采用AOP的方式,对关系数据库和Redis保持相同的类型定义,分别采用ORM和反序列化的方式标准化输出,这是个想法我也没有实现;同时缓存数据是准实时的,如果要求完全一致,还是应该提供从关系数据库查询的版本。另外如果要摆脱对Redis的直接依赖,还可以通过OpenResty来实现对资源的透明访问,这个不是本文的重点。

服务可用性问题:这篇文章没有关注服务可用性问题,为了保证服务的高可用,每个服务或者程序都应该有多份部署的,无论是负载均衡的方案,或者传统的主备方案,在部分部署不可用时仍能够继续提供服务。

写的比较快,有些理解不免偏颇,欢迎指正。

另外附上我的独立博客访问地址:

http://blog.bossma.cn/architecture/microservice-business-static-data-universal-cache-mechanism/

原文地址:https://www.cnblogs.com/bossma/p/9858847.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/315596.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ARC080F - Prime Flip(贪心,差分,二分图匹配)

ARC080F - Prime Flip Solution 差分,转化为每次可以翻转i,j(j−i∈oddprime)i,j(j-i\in odd\;prime)i,j(j−i∈oddprime)。 显然若j−ij-ij−i是奇质数,则需要111次。 否则若j−ij-ij−i是偶数,则需要222次。 否则若j−ij-ij−i是奇数&am…

Codeforces Round #703 (Div. 2) E. Paired Payment 最短路 + 思维

link 题意: 给一张图,每次只能一下走两个点,比如当前在aaa,往下走到bbb再到ccc,权值为(wa,bwb,c)2(w_{a,b}w_{b,c})^2(wa,b​wb,c​)2。求1到其他点的最短路,不存在输出−1-1−1。 思路: 如果…

ARC077E - guruguru(差分)

ARC077E - guruguru Solution 考虑每一次改动对于每一个xxx的影响。 设我们要从aaa变到bbb。 当a−>x−>ba->x->ba−>x−>b时,该次对xxx的贡献为Da,b−Da,x1D_{a,b}-D_{a,x}1Da,b​−Da,x​1,即一个公差为−1-1−1的递减序列&#…

Codeforces Round #700 (Div. 2) C. Searching Local Minimum 交互二分

传送门 题意: 给一个数组&#xff0c;让你找到a[i]<min(a[i1],a[i−1])a[i]<min(a[i1],a[i-1])a[i]<min(a[i1],a[i−1])位置iii&#xff0c;每次询问iii可以得到a[i]a[i]a[i]&#xff0c;最多询问100次&#xff0c;且a[0]a[n1]∞a[0]a[n1]∞a[0]a[n1]∞。 我们考虑假…

WCF服务端的.NET Core支持项目Core WCF 正式启动

长期以来在wcf客户端库https://github.com/dotnet/wcf里反应最强烈的就是.NET Core的服务端支持https://github.com/dotnet/wcf/issues/2695&#xff0c;在build 2019大会上微软明确说明在将WinForms&#xff0c;WPF和Entity Framework 6添加到.NET Core 3.0后&#xff0c;不打…

LG P3233 [HNOI2014]世界树(虚树,树形dp)

LG P3233 [HNOI2014]世界树 Solution 看完题意&#xff0c;显然是虚树。 建出虚树后&#xff0c;可以容易地求出虚树上的点会被哪一个点管辖&#xff0c;关键在于不在虚树上的点归属于哪个点&#xff0c;我们分类讨论不在虚树上的点的贡献&#xff1a; 我们先假设虚树上的点…

Codeforces Round #700 (Div. 2) D1 D2. Painting the Array 思维

link 题意&#xff1a; 给一个数组&#xff0c;让你从头开始选出一些数放在AAA数组中&#xff0c;剩下的放在BBB数组中&#xff0c;且是有序选择&#xff0c;让后把两个数组中相邻且相等的元素合并。 D1&#xff1a; 使合并后Len(A)Len(B)Len(A)Len(B)Len(A)Len(B)最大。 D2&a…

阿里云物联网 .NET Core 客户端 | CZGL.AliIoTClient:4. 设备上报属性

设备自身 CPU 温度、电源输入电压、内存使用率等&#xff0c;以及接入到设备的传感器如温度传感器、光敏传感器等&#xff0c;这些硬件的数据输出即是 属性 。设备将这些硬件的数据上传到阿里云物联网平台&#xff0c;实时显示这些设备的状态和实测数据&#xff0c;这个过程是 …

Codeforces Round #694 (Div. 2) D. Strange Definition 质因子分解 + 平方数

传送门 题意&#xff1a; 定义相邻数为lcm(x,y)gcd(x,y)\frac{lcm(x,y)}{gcd(x,y)}gcd(x,y)lcm(x,y)​是一个平方数&#xff0c;则xxx和yyy是相邻的。现在给出q个询问&#xff0c;每次询问一个iii&#xff0c;表示询问第iii秒后max1<i<ndimax_{1<i<n}d_imax1<i…

ARC086E - Smuggling Marbles(虚树,树形dp)

ARC086E - Smuggling Marbles Solution 感觉这题和LG P3233 [HNOI2014]世界树几乎一模一样啊&#xff1f;&#xff01; 大概就是对于每一个深度分别计算贡献&#xff0c;对该深度的点建出虚树&#xff0c;然后树形dpdpdp。 令fxf_xfx​表示xxx子树中2szx2^{sz_x}2szx​种方…

Docker最全教程之MySQL容器化 (二十五)

前言 MySQL是目前最流行的开源的关系型数据库&#xff0c;MySQL的容器化之前有朋友投稿并且写过此块&#xff0c;本篇仅从笔者角度进行总结和编写。目录 镜像说明 运行MySQL容器镜像 1.运行MySQL容器 2.修改“root”账户的认证模式和密码 管理MySQL 1. MySQL命…

CF639F Bear and Chemistry(虚树,边双)

CF639F Bear and Chemistry Solution 显然题目的条件就是所有点在一个边双连通分量内。 所以我们先缩边双求出边双树。 然后对于每一个询问&#xff0c;对询问的点和边的端点建虚树&#xff0c;然后把询问的边连上跑tarjantarjantarjan求边双判断是否所有询问点在同一个边双…

Codeforces Round #694 (Div. 2) E. Strange Shuffle 交互 + 思维分块

link 题意&#xff1a; nnn个人围成一圈&#xff0c;一开始每个人都有kkk张卡片&#xff0c;每回合n−1n-1n−1个人会给左边⌊x2⌋\left \lfloor \frac{x}{2} \right \rfloor⌊2x​⌋&#xff0c;给右边⌈x2⌉\left \lceil \frac{x}{2} \right \rceil⌈2x​⌉&#xff0c;剩下…

Ocelot(五)- 流量限制、服务质量

作者&#xff1a;markjiang7m2原文地址&#xff1a;https://www.cnblogs.com/markjiang7m2/p/10965300.html源码地址&#xff1a;https://gitee.com/Sevenm2/OcelotDemo本文是我关于Ocelot系列文章的第五篇&#xff0c;流量限制、服务质量。Ocelot允许针对具体的服务接口进行流…

java中静态修饰符(static)的使用

static-静态 修饰属性 静态属性,也称为静态变量 类变量等 static 数据类型 属性名; 使用 静态内容独立存放在方法区 静态内容在内存中只有一份,被该类所有对象共享 普通属性所有对象在对象内容中都有一份 可以通过类名.静态属性名的方式直接访问静态属性 静态属性封装之…

ARC082F - Sandglass(思维)

ARC082 D - Sandglass Solution 这题睡觉的时候 想了挺久的。 一段时间Δt\Delta tΔt内要么是让xΔtx\Delta txΔt对XXX取minminmin&#xff0c;要么是让x−Δtx-\Delta tx−Δt对000取maxmaxmax。 如果没有对边界取max/minmax/minmax/min&#xff0c;就是一个单纯的前缀和…

Educational Codeforces Round 101 (Rated for Div. 2) D. Ceil Divisions 思维 + 根号数

传送门 题意&#xff1a; 给一个数组aiia_iiai​i&#xff0c;每次可以进行操作ax⌈axay⌉a_x\left \lceil \frac{a_x}{a_y} \right \rceilax​⌈ay​ax​​⌉&#xff0c;操作不能超过n5n5n5次&#xff0c;最终需要把数组中的数变成n−1n-1n−1个111和一个222。 思路&#x…

Ocelot(三)- 服务发现

作者&#xff1a;markjiang7m2原文地址&#xff1a;https://www.cnblogs.com/markjiang7m2/p/10907856.html源码地址&#xff1a;https://gitee.com/Sevenm2/OcelotDemo本文是我关于Ocelot系列文章的第三篇&#xff0c;主要是给大家介绍Ocelot的另一功能。与其说是给大家介绍&a…

Educational Codeforces Round 101 (Rated for Div. 2) F. Power Sockets 哈希 + 乱搞

传送门 题意&#xff1a; 给一个二进制串aaa&#xff0c;让后定义两个串相似为有至少一个相同位置相等。现在让你找一个字典序最小的长度为kkk的串使其与aaa中每个长度为kkk的字串相似。 思路&#xff1a; 首先我们知道所有可能的串一共有2k2^k2k&#xff0c;我们把aaa串全部…

LG P4198 楼房重建(线段树)

LG P4198 楼房重建 Solution 基础的线段树题&#xff0c;虽然我还不熟练就是了。 大概就是单点修改&#xff0c;求全局的极大子序列。 我们需要维护一个区间最大值aaa和极大子序列长度sss。 合并xxx的左右儿子ls,rsls,rsls,rs时&#xff0c;axa_xax​直接取max{als,ars}max…