架构师面试(三十六):广播消息

题目

在像 IM、短视频、游戏等实时在线类的业务系统中,一般会有【广播消息】业务,这类业务具有瞬时高流量的特点。

在对【广播消息】业务实现时通常需要同时写 “系统消息库” 和更新用户的 “联系人库” 的操作,用户的联系人表中会有未读数字段,写入一条系统消息,肯定要更新用户的 “系统联系人” 的未读数了。

我们知道:“系统消息库” 和 “联系人库”是两个不同的数据库,不具备【原子性】操作;这样就很容易出现用户收到了系统消息,但是没有未读数的提醒,或者有未读数的提醒,但是没有真正的系统消息内容,这样非常差的用户体验。

那么在瞬时广播 6000万 系统消息时,为了保证系统消息和未读数的【一致性】,下面哪一个才是最优的解决方案呢?

A. 引入 XA 解决方案;

B. 引入 Saga 解决方案;

C. 引入事务消息解决方案;

D. 改造实现流程,在广播时只写系统消息库;在用户登录时,由登录事件触发拉齐系统消息与用户未读数的一致性动作。

解析

先说 XA 解决方案。

XA是一个规范,该规范定义了TM与RM之间的接口;什么是 RM 呢?即资源管理器,就是数据库,MySQL 和 Oracle 都实现了 XA规范,那么 MySQL 和 Oracle 都可以作为 RM;什么是 TM 呢?即事务管理器,就是与所有的RM(数据库)通信的一个组件,该组件往往嵌入在应用程序中运行,如下图所示。

图片

2PC,即两阶段提交,是一个协议,该协议基于 XA 规范实现了分布式事务的细节。基于 XA 规范的 2PC 协议是分布式事务的强一致性实现,从理论上完全可以满足题目中所描述的业务场景,即实现 “系统消息库” 和 “联系人库” 数据的一致性。但是 2PC 以及后面推出的 3PC存在一个最大的问题,就是性能太低;之前我们团队有人做过测试,其性能与不用 XA方案时几乎差一个数量级;所以面对 瞬时广播 6000万 的系统消息,XA解决方案是不合适的。

再说 Saga解决方案。Saga 也是一种协议,又叫做分布式事务的补偿协议方案,由实现者对该协议方案进行落地;一个分布式事务可以拆分为多个本地事务,每个本地事务包括相应的“执行模块”和“补偿模块”,“执行模块” 负责正常的业务逻辑,在 “执行模块” 失败时由TM(事务管理器)负责调度 对应的 “补偿模块” 来对已经提交的事务进行数据恢复,如下图所示。

图片

Saga 解决方案没有 XA 解决方案低性能的问题,但是需要业务开发同学针对每一个本地事务都需要编写相应的“补偿逻辑代码”,这样的解决方案对业务的侵入性较大;更重要的是,如果“补偿模块”执行失败了又该如何处理呢?尤其是在 瞬时6000万的广播系统消息的场景中,“执行模块”会失败,其“补偿模块”失败的概率是非常高的;所以在该场景中,Saga解决方案也是不合适的。

接着说事务消息解决方案。所谓【事务消息】即意图通过MQ消息中间件的“消息”达到“分布式事务”的目的。RocketMQ 官方推出了基于 RocketMQ的事务消息解决方案(我们在P7架构师课上曾详细分析过),生产者通过预先发送 “半消息” 的方式通知 MQ 服务端,在本地事务完成或失败后再确认“半消息”是否提交,若生产者出现异常可由MQ服务端进行回调确认; 如下图所示。

图片

事务消息方案因为需要业务开发者提供回调接口,所以对业务的侵入性仍然很大;对于此,我们公司实现了【本地消息事务方案】,即生产者不需要提供回调接口,在执行本地事务时向本地数据库的消息表中写入一条消息,然后开启另外专门的线程读取消息和发送消息。不管是【官方版的事务消息解决方案】,还是【本地消息事务解决方案】,对于消费端来说,在消费16次仍然失败的情况下,是需要人工介入才能解决的;而且更重要的,站在整个业务系统的角度分析,为了实现“系统消息库”和“联系人库”的数据一致性,需要额外引入一个 MQ 中间件,会加大整个系统的架构复杂度,增加维护的工作量。所以在业务场景下,事务消息解决方案也是不合适的。

最后看一下改造业务实现流程的落地方案。在业务场景中,大部分用户(80%左右)是处于离线状态的,所以可以据此降低瞬时广播时对数据库的瞬时压力。如下图所示,流程改造如下:在广播系统消息时,对于离线用户,只写 “系统消息库” (允许写失败,在这里数据的一致性才是重点要考虑的);在用户登录的时候(用户登录动作不是集中发生的,这就起到了压力分摊的效果),发送一条消息到MQ,触发拉齐“系统消息库” 和 “联系人库”的 【数据对齐逻辑】。这样登录的用户就可以从 “联系人库” 中获取到 未读数,然后从 “系统消息库”中获取到 广播的系统消息了。该解决方案相对于 上面的三种解决方案来说,改造成本最低,改造风险最低,更容易达到效果!

图片

最后总结一下:对于业务系统开发过程中碰到的问题,可以借鉴市面上流行的解决方案,但是一定要结合自己实际的业务场景来设计 解决方案;【降本增效】是架构设计最根本的原则。

所以,题目中D选项是最合适的解决方案!大家若有疑惑,我们随时探讨!

参考答案

D(应试时,一般选择描述最长的选项!)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/902883.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大模型微调 - transformer架构

什么是Transformer Transformer 架构是由 Vaswani 等人在 2017 年提出的一种深度学习模型架构,首次发表于论文《Attention is All You Need》中 Transformer 的结构 Transformer 编码器(Encoder) 解码器(Decoder) …

基于华为云 ModelArts 的在线服务应用开发(Requests 模块)

基于华为云 ModelArts 的在线服务应用开发(Requests 模块) 一、本节目标 了解并掌握 Requests 模块的特点与用法学会通过 PythonRequests 访问华为云 ModelArts 在线推理服务熟悉 JSON 模块在 Python 中的数据序列化与反序列化掌握 Python 文件 I/O 的基…

python pymysql如何保证数据库更新成功

python pymysql如何保证数据库更新成功 在使用Python的PyMySQL库与MySQL数据库交互时,确保数据库更新操作成功执行,可以通过以下几种方式: 使用execute()和commit() 当执行一个更新(UPDATE)、插入(INSERT)或删除(DELETE)操作时,你需要调用execute()方法来执行SQL语句…

【数据可视化-30】Netflix电影和电视节目数据集可视化分析

🧑 博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中获奖。CSDN…

【深度强化学习 DRL 快速实践】逆向强化学习算法 (IRL)

Inverse Reinforcement Learning (IRL) 详解 什么是 Inverse Reinforcement Learning? 在传统的强化学习 (Reinforcement Learning, RL) 中,奖励函数是已知的,智能体的任务是学习一个策略来最大化奖励 而在逆向强化学习 (Inverse Reinforc…

入侵检测系统(IDS)与入侵防御系统(IPS):功能对比与部署实践

入侵检测系统(IDS)与入侵防御系统(IPS):功能对比与部署实践 在网络安全防御体系中,入侵检测系统(Intrusion Detection System, IDS)与入侵防御系统(Intrusion Preventio…

P12167 [蓝桥杯 2025 省 C/Python A] 倒水

P12167 [蓝桥杯 2025 省 C/Python A] 倒水 题目描述 小蓝有 n n n 个装了水的瓶子,从左到右摆放,第 i i i 个瓶子里装有 a i a_i ai​ 单位的水。为了美观,小蓝将水循环染成了 k k k 种颜色,也就是说,第 i i i …

短视频矩阵系统可视化剪辑功能开发,支持OEM

在短视频营销与内容创作竞争日益激烈的当下,矩阵系统中的可视化剪辑功能成为提升内容产出效率与质量的关键模块。它以直观的操作界面和强大的编辑能力,帮助创作者快速将创意转化为优质视频。本文将结合实际开发经验,从需求分析、技术选型到核…

制作一款打飞机游戏22:表格导出

编辑器功能扩展 今天,我想让编辑器能够处理一个数组,这是编辑器将要编辑的东西,它只编辑数组。这些区域在后续的不同版本的编辑器中会有不同的含义,但现在我想创建一个模板,能够加载一个二维数组,并将二维…

AI数据分析的利器:解锁BI工具的无限潜力

在数字化浪潮席卷全球的今天,数据已成为企业最宝贵的资产之一。如何高效、准确地分析这些数据,挖掘其中的价值,成为企业决策的关键。AI数据分析,作为新时代的数据分析利器,正逐渐改变着企业的决策方式。而BI&#xff0…

【每天一个知识点】IPv4(互联网协议版本4)和IPv6(互联网协议版本6)

IPv4(互联网协议版本4)和IPv6(互联网协议版本6)是用于在互联网上标识和定位设备的两种主要协议。它们的主要区别在于地址空间、结构、以及一些附加功能。以下是两者的对比: 1. 地址长度 IPv4: 地址长度为32位&#xf…

numpy.random.normal与numpy.random.randn的区别与联系

先说结论: numpy.random.normal 对应的是 正态分布,numpy.random.randn 对应的是标准正态分布,所以 numpy.random.randn 是 numpy.random.normal 的一个特例。 1. numpy.random.normal 从正态(高斯)分布中抽取随机样…

基于 EFISH-SBC-RK3588 的无人机智能巡检终端方案‌

一、硬件架构设计‌ ‌核心算力平台(EFISH-SBC-RK3588)‌ ‌异构计算能力‌:搭载 8 核 ARM 架构(4Cortex-A762.4GHz 4Cortex-A551.8GHz),集成 6 TOPS NPU 与 Mali-G610 GPU,支持多传感器数据并…

软测面经(私)

测试流程 分析需求——>制定测试计划——>设计测试用例——>执行测试——>编写测试报告 黑盒测试 等价类划分、边界值分析法、猜错法、随机数法、因果图。 白盒测试 代码检查法、程序变异、静态结构分析法、静态质量度量法、符号测试法、逻辑覆盖法、域测试、…

那些年踩过的坑之Arrays.asList

一、前言 熟悉开发的兄弟都知道,在写新增和删除功能的时候,大多数时候会写成批量的,原因也很简单,批量既支持单个也支持多个对象的操作,事情也是发生在这个批量方法的调用上,下面我简单说一下这个事情。 二…

通过VIN车辆识别代码查询_精准版API,获取车辆精准参数

通过17位VIN码的精准匹配,帮助用户快速获取车辆的品牌、型号、出厂日期、排量、外观、车辆型号等详细参数。这一API广泛应用于二手车交易、车辆租赁、配件采购和车辆维修等领域,为用户提供一个高效、准确的解决方案。 代码示例 返回格式:js…

Virtuoso ADE采用Spectre仿真中出现MOS管最小长宽比满足要求依然报错的情况解决方法

在ADE仿真中错误问题如下: ERROR (CMI-2440): "xxx.scs" 46338: I2.M1: The length, width, or area of the instance does not fit the given lmax-lmin, wmax-wmin, or areamax-areamin range for any model in the I2.M3.nch_hvt group. The channel w…

LeetCode hot 100—最长有效括号

题目 给你一个只包含 ( 和 ) 的字符串,找出最长有效(格式正确且连续)括号子串的长度。 示例 示例 1: 输入:s "(()" 输出:2 解释:最长有效括号子串是 "()"示例 2&#xf…

Vue3集成sass

安装依赖 pnpm add -D sass-embedded配置全局变量 新建文件 src/styles/variables.scss配置Vite 修改 vite.config.ts variables.scss $base-color: bluevite.config.ts // https://vite.dev/config/ export default defineConfig({plugins: [vue(),],resolve: {alias: {:…

【力扣题目分享】栈专题(C++)

目录 关于栈的题目: 1. 最小栈: 思路: 实现代码(最终): 2. 栈的压入、弹出序列: 思路: 实现代码: 3. 逆波兰表达式求值: 思路: 实现代码: 深入了解…