精确掌控并发:漏桶算法在分布式环境下并发流量控制的设计与实现

这是《百图解码支付系统设计与实现》专栏系列文章中的第(16)篇,也是流量控制系列的第(3)篇。点击上方关注,深入了解支付系统的方方面面。

本篇重点讲清楚漏桶原理,在支付系统的应用场景,以及使用reids实现的核心代码。

1. 前言

在流量控制系列文章中的前两篇,分别介绍了固定时间窗口算法和滑动时间窗口算法在支付渠道限流的应用以及使用redis实现的核心代码。

这两个算法有一个共同的问题:那就是超过阀值的数据会直接拒绝掉。如果超过阀值也不想拒绝请求,后面仍然发出去,怎么办?这就是本篇要说的漏桶及下篇要讲的令牌桶解决的问题。

2. 漏桶原理

漏桶算法通过模拟水桶漏水的过程来控制数据的传输速率。它允许短时间的突发数据流,随后以恒定的速率排空积聚的数据。这种机制特别适合于需要平滑处理瞬时高流量冲击,但后端需要恒定速率处理的场景。比如批量接收上游商户的退款,然后根据渠道的要求以极低的TPS慢慢退出去到渠道。

最简单的理解,漏桶 = 队列 + 固定窗口算法。其中队列用于先保存数据。固定窗口算法用于获取可用计数,获取到就从队列获取一个请求进行业务处理。

工作原理:

  1. 桶容量:漏桶有一个固定的容量,代表在任何时刻系统能够容纳的最大请求量。比如上面图中的队列。
  2. 数据流入:数据来了后就保存到桶(队列)中,如果桶已满,则溢出的数据会被丢弃。
  3. 恒定速率流出:数据以固定的速率从桶中“漏出”,即被处理。这个速率是预先设定的,与请求量无关。
  4. 计数器最简单的做法,就是把固定时间窗口的代码用起来。
  5. 保存到数据库,是为了持久化,以及队列出现问题时,可以重新恢复。

3. 在支付系统下的应用场景

中国的IT基础设施领先于全球各个国家,各大银行和第三方钱包也被各电商双十一等大促场景狂虐之后进化到支持极高的TPS,但是在跨境场景下,比如东南亚或南美的国家,他们的银行IT基础设施差,系统老旧,无法支持高并发流量。甚至碰到过一些银行要求退款只能有1TPS。

在分布式场景下,要做到1TPS的高精度限流,只能依赖漏桶来做。

4. Redis实现漏桶的核心代码

漏桶算法通常通过队列 + 固定时间窗口计数法来实现。队列存储待处理的请求,而一个线程以固定速率从队列中取出并处理这些请求。

为什么又是Redis?因为前面已经实现过Redis版本的固定时间窗口算法,再加一个队列就可以搞定。当然大家也可以选择其它的方案实现,这只是一个抛砖引玉。

下面是单机版本的伪代码:

public class LeakyBucket {private final int capacity;private final long leakIntervalInMillis;private final LinkedBlockingQueue<Data> bucket;public LeakyBucket(int capacity, long leakRateInMillis) {this.capacity = capacity;this.leakIntervalInMillis = leakRateInMillis;this.bucket = new LinkedBlockingQueue<>(capacity);}// 尝试添加数据到桶中public boolean addToBucket(Data data) {return bucket.offer(data);}// 启动桶的漏水过程public void startLeaking() {new Thread(() -> {while (true) {try {Data data = bucket.poll(leakIntervalInMillis, TimeUnit.MILLISECONDS);if (data != null) {process(data);}} catch (InterruptedException e) {log.debug("Leaking process interrupted");continue;}}}).start();}// 处理桶中的数据private void process(Data data) {// 业务处理... ...}
}

上面单机的代码实用性不高,因为在分布式环境下,并发请求量是根据部署机器累计起来的,1台机器限流1TPS,20台机器就到了20TPS。

优化为分布式:

class LeakyBucketHolding {private final LinkedBlockingQueue<Data> bucket;private int limit;private String bizType;public LeakyBucketHolding(String bizType, int capacity, int limit) {this.bizType = bizType;this.bucket = new LinkedBlockingQueue<>(capacity);this.limit = limit;}// 其它代码略
}class LeakyBucket {@Autowiredprivate RedisLimitUtil redisLimitUtil;private Map<String, LeakyBucketHolding> leakyBucketHoldingMap = new HashMap();// 添加数据到桶中public boolean addData(Data data) {String key = buildKey(data);LeakyBucketHolding holding = leakyBucketHoldingMap.get(key);if (null == holding) {holding = buildHolding(data);leakyBucketHoldingMap.put(key, holding);}return holding.getLinkedBlockingQueue().offer(data);}public Data getData() {for(LeakyBucketHolding holding : leakyBucketHoldingMap.values()) {if(holding.getBucket().size() == 0) {return null;}/* RedisLimitUtil的实现参考* "精确掌控并发:固定时间窗口算法在分布式环境下并发流量控制的设计与实现"中的示例代码*/boolean limited = RedisLimitUtil.isLimited(holding.getBizType(), holding.getLimit());if (limited) {return null;}try {return holding.getBucket().poll(10, TimeUnit.MILLISECONDS);} catch (InterruptedException e) {log.log("Leaking process interrupted");}return null;}}
}

上面的代码只是写一个示例,也没有做方法的抽取,真实的代码会比这个写得更优雅一点,大家将就看一下,理解思路就行。

代码使用的是内存列队,也就是请求过来后,先保存到DB,然后发到内存队列。在重启服务器时,内存列队的数据会丢失,这种情况下,依赖定时任务从DB中恢复任务到内存列队。

还有一种做法,就不使用内存队列,而是使用redis来实现队列。代码如下:

public class LeakyBucket {// 其它代码略... ...// 添加数据到队列中public void addData(Data data) {return redisTemplate.rpush(data.getBizType(), data);}// 添加数据到队列中public Data getData(String bizType) {return redisTemplate.lpop(bizType);}// 其它代码略... ...
}

退款流量控制实例:RefundServiceImpl

/*** 支付服务示例*/
public class RefundServiceImpl implements RefudnService {@Autowireadprivate LeakyBucket leakyBucket;@Overridepublic RefundOrder refund(RefundRequest request) {// 前置业务处理... ...Data data = buildData(request);leakyBucket.addData(data);// 其它业务处理... ...}@PostConstructpublic void init() {new Thread(() -> {while (true) {Data data = leakyBucket.getData();if (null != data) {process(data);} else {sleep(10);}}}).start();}
}

在代码中可以看到,退款请求来后,只需要往桶里扔就完事。然后等另外的线程按固定速度发出去。

代码中还存在的问题:

  1. 上述代码只是示例,真实的代码还有很多异常处理,比如队列数据丢失,需要重新处理。
  2. 暂时只能用于退款,因为退款的时效要求不高。另外,单机只需要开一个线程就行,因为服务器是分布式部署,多个服务器合并起来仍然是多个线程在并发处理。对退款是足够的。

5. 为什么不使用消息中间件来做队列

为什么不直接使用RabbitMQ或Kafaka等消息中间件来做队列?主要是因为有些公司使用自码的消息中间件,可能只有推模型而没有拉的模式。

如果只有推的模式,就会出现推下来后发现限流,又抛回来,来回做无用功。

如果消息中间件有拉的模式,同时配合redis的固定窗口实现,也是完全没有问题的。

6. 为什么不直接使用消息中间件来做流控

消息中间件是另外的选型方案,会在后面的文章中介绍。

7. 结束语

今天主要介绍了漏桶原理、在支付系统中的使用场景,以及基于redis实现的核心代码。

下一篇将介绍令牌桶在分布式场景下流量控制的应用和核心代码实现。

8. 精选

专栏地址百图解码支付系统设计与实现
《百图解码支付系统设计与实现》专栏介绍
《百图解码支付系统设计与实现》专栏大纲及文章链接汇总(进度更新于2023.1.15)
领域相关(部分)
支付行业黑话:支付系统必知术语一网打尽
跟着图走,学支付:在线支付系统设计的图解教程
图解收单平台:打造商户收款的高效之道
图解结算平台:准确高效给商户结款
图解收银台:支付系统承上启下的关键应用
图解支付引擎:资产流动的枢纽
图解渠道网关:不只是对接渠道的接口(一)

技术专题(部分)
交易流水号的艺术:掌握支付系统的业务ID生成指南
揭密支付安全:为什么你的交易无法被篡改
金融密语:揭秘支付系统的加解密艺术
支付系统日志设计完全指南:构建高效监控和问题排查体系的关键基石
避免重复扣款:分布式支付系统的幂等性原理与实践
支付系统的心脏:简洁而精妙的状态机设计与核心代码实现
精确掌控并发:固定时间窗口算法在分布式环境下并发流量控制的设计与实现
精确掌控并发:滑动时间窗口算法在分布式环境下并发流量控制的设计与实现

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/629029.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【RPC】网络通信:哪种网络IO模型最适合RPC框架?

一、背景 RPC是解决进程间通信的一种方式。一次RPC调用&#xff0c;本质就是服务消费者与服务提供者间的一次网络信息交换的过程。服务调用者通过网络IO发送一条请求消息&#xff0c;服务提供者接收并解析&#xff0c;处理完相关的业务逻辑之后&#xff0c;再发送一条响应消息…

重学Java 7 数组Arr.1

我欲与君相知&#xff0c;长命无绝衰 ——24.1.16 一、数组的定义 1.概述&#xff1a;数组是一个容器&#xff0c;数组本身属于引用数据类型 2.作用&#xff1a;一次存储多个数据 3.特点&#xff1a; ①既可以存储基本类型的数据&#xff0c;也可以存储引用类型的数据 ②定长&a…

【软件测试】学习笔记-统一测试数据平台

这篇文章主要探讨全球大型电商企业中关于准备测试数据的最佳实践&#xff0c;从全球大型电商企业早期的测试数据准备实践谈起&#xff0c;分析这些测试数据准备方法在落地时遇到的问题&#xff0c;以及如何在实践中解决这些问题。其实&#xff0c;这种分析问题、解决问题的思路…

mathtype2024版本下载与安装(mac版本也包含在内)

安装包补丁主要是mathtype的安装包&#xff0c;与它的补丁。 详细安装过程&#xff1a; step1&#xff1a; 使用方法是下载完成后先安装MathType-win-zh.exe文件&#xff0c;跟着步骤走直接安装就行。 step2&#xff1a; 关闭之后&#xff0c;以管理员身份运行MathType7PJ.exe…

CF1178F2 Long Colorful Strip 题解 搜索

Long Colorful Strip 传送门 题面翻译 题目描述 这是 F 题的第二个子任务。F1 和 F2 的区别仅在对于 m m m 和时间的限制上 有 n 1 n1 n1 种颜色标号从 0 0 0 到 n n n&#xff0c;我们有一条全部染成颜色 0 0 0 的长为 m m m 的纸带。 Alice 拿着刷子通过以下的过…

一、ArcGIS Pro SDK for Microsoft .NET 开发环境配置

ArcGIS Pro二次开发需要的工具&#xff1a; 1.Visual Studio 2.ArcGIS Pro SDK 一、Visual Studio安装 经过查阅资料&#xff0c;ArcGIS Pro3.0版本需要安装Visual Studio2022版&#xff0c;因为只有22版的才会有有ArcGIS Pro3.0以上版对应ArcGIS Pro SDK&#xff0c;因此&…

如何编译openssl的早期版本的共享库,如openssl 1.0

背景介绍 最近在为客户排查问题的时候&#xff0c;发现客户提供的日志是加密的&#xff0c;解密工具依赖到了openssl 1.0的共享库。可是手头没有这么老版本的openssl共享库。因此只好手动编译一个出来。 编译步骤 因为openssl 1.0是比较老的版本&#xff0c;很多系统上的库已…

新能源汽车智慧充电桩解决方案:智慧化综合管理与数字化高效运营

一、方案概述 TSINGSEE青犀&触角云新能源汽车智慧充电桩解决方案基于管理运营平台&#xff0c;覆盖业务与应用、数据传输与梳理、多端开发、搭建等模块&#xff0c;融合AI、5G、Wi-Fi 、移动支付等技术&#xff0c;实现充电基础设施由数字化向智能化演进&#xff0c;通过构…

翻译: Pyenv管理Python版本从入门到精通一

你是否经常在管理系统上多个Python版本时遇到困难&#xff1f;这可能是一个艰巨的任务&#xff0c;尤其是在处理需要不同Python版本的不同项目时。 但别担心&#xff0c;有一个解决方案&#xff1a;pyenv。就像一个熟练的杂技演员&#xff0c;pyenv可以轻松处理多个Python版本…

连接超时的问题

连接超时的问题 通用第三方工具连接超时 connect timeout 方案一&#xff1a; /etc/ssh/sshd_config node1上操作&#xff0c;图是错的 方案二&#xff1a; windows上Hosts文件域名解析有问题 比如&#xff1a; 192.168.xx.100 node1 192.168.xx.161 node1 两个都解析成node…

绝地求生:【PC】未授权程序使用行为的相关公告

各位玩家大家好&#xff0c; 最近闲游盒通过PUBG玩家社区收到了关于未授权程序的举报&#xff0c;举报称有人在游戏内使用了能测量玩家间的距离并辅助迫击炮射击的未授权辅助程序。为此&#xff0c;我们想就该事项向大家进行如下公告&#xff1a; 使用此类未授权程序的行为违反…

23/76-LeNet

LeNet 早期成功的神经网络。 先使用卷积层来学习图片空间信息。 然后使用全连接层转换到类别空间。 #In[]LeNet,上世纪80年代的产物,最初为了手写识别设计from d2l import torch as d2l import torch from torch import nn from torch.nn.modules.loss import CrossEntropyLos…

工业平板定制方案_基于联发科、紫光展锐平台的工业平板电脑方案

工业平板主板采用联发科MT6762平台方案&#xff0c;搭载Android 11.0操作系统&#xff0c; 主频最高2.0GHz&#xff0c;效能有大幅提升;采用12nm先进工艺&#xff0c;具有低功耗高性能的特点。 该工业平板主板搭载了IMG GE8320图形处理器&#xff0c;最高主频为680MHz, 支持108…

Flume 之自定义Sink

1、简介 前文我们介绍了 Flume 如何自定义 Source&#xff0c; 并进行案例演示&#xff0c;本文将接着前文&#xff0c;自定义Sink&#xff0c;在这篇文章中&#xff0c;将使用自定义 Source 和 自定义的 Sink 实现数据传输&#xff0c;让大家快速掌握Flume这门技术。 2、自定…

Python - 深夜数据结构与算法之 Sort

目录 一.引言 二.排序简介 1.排序类型 2.时间复杂度 3.初级排序 4.高级排序 A.快速排序 B.归并排序 C.堆排序 5.特殊排序 三.经典算法实战 1.Quick-Sort 2.Merge-Sort 3.Heap-Sort 4.Relative-Sort-Array [1122] 5.Valid-anagram [242] 6.Merge-Intervals […

Java NIO (二)NIO Buffer类的重要方法(备份)

1 allocate()方法 在使用Buffer实例前&#xff0c;我们需要先获取Buffer子类的实例对象&#xff0c;并且分配内存空间。需要获取一个Buffer实例对象时&#xff0c;并不是使用子类的构造器来创建&#xff0c;而是调用子类的allocate()方法。 public class AllocateTest {static…

如何快速看懂一篇英文AI论文?

已经2024年了&#xff0c;该出现一个写论文解读AI Agent了。 大家肯定也在经常刷论文吧。 但真正尝试过用GPT去刷论文、写论文解读的小伙伴&#xff0c;一定深有体验——费劲。其他agents也没有能搞定的&#xff0c;今天我发现了一个超级厉害的写论文解读的agent &#xff0c…

某银行主机安全运营体系建设实践

随着商业银行业务的发展&#xff0c;主机规模持续增长&#xff0c;给安全团队运营工作带来极大挑战&#xff0c;传统的运营手段已经无法适应业务规模的快速发展&#xff0c;主要体现在主机资产数量多、类型复杂&#xff0c;安全团队难以对全量资产进行及时有效的梳理、管理&…

HCIA—— 16每日一讲:HTTP和HTTPS、无状态和cookie、持久连接和管线化、(初稿丢了,这是新稿,请宽恕我)

学习目标&#xff1a; HTTP和HTTPS、无状态和cookie、持久连接和管线化、HTTP的报文、URI和URL&#xff08;初稿丢了&#xff0c;这是新稿&#xff0c;请宽恕我&#x1f636;‍&#x1f32b;️&#xff09; 学习内容&#xff1a; HTTP无状态和cookieHTTPS持久连接和管线化 目…

vue2 pdfjs-2.8.335-dist pdf文件在线预览功能

1、首先先将 pdfjs-2.8.335-dist 文件夹从网上搜索下载&#xff0c;复制到public文件夹下. 2、在components下新建组件PdfViewer.vue文件 3、在el-upload 中调用 pdf-viewer 组件 4、在el-upload 中的 on-preview方法中加上对应的src路径 internalPreview(file) { //判断需要…