蚂蚁金服天街:OceanBase 在大促 5 年来的技术演进

为了与金融从业者、科技从业者共同探讨金融 + 业务的深层次问题,蚂蚁金服联手 TGO 鲲鹏会,在 12 月 8 日举办了「走进蚂蚁金服:双十一背后的蚂蚁金服技术支持」活动。蚂蚁金服高级技术专家天街为大家分享了《蚂蚁双 11 大促 OceanBase 核心技术全解析》。本文根据当天演讲整理,有部分不改变原意的删减。

\"\"

天街现场演讲照片

今天给大家介绍一下 OceanBase 在大促 5 年来的技术演进,主要内容是 OceanBase 大促体系,下文简称 OB。今年 OB 大促上有三个核心技术:百万支付、容器化和平台智能化。

OB 大促主要做什么事情?大促就是把平常的能力在双 11 舞台上做最大的展示。大促的内容很多,落到技术层面就是整个体系的分析,我们可以把它抽象出六个能力:

  • 容量。面对这种脉冲式的压力上升,我们可以从单机性能和集群性能量方面来考虑满足大促容量;

  • 可靠性。作为金融级公司,我们在峰值上要保持脉冲风险稳定可靠;

  • 成本。日常使用的机器与双 11 相比非常少,需要降低大促使用的机器成本;

  • 效率。大促是常态化的流程,一年之中会有很多大促,要用最高的效率来实现大促,这是成败的关键;

  • 抗压。用压测试保证各方面的系统满足双 11 的峰值;

  • 弹性。这是双 11 最核心的技术,需要把应用服务器、DB 各种计算能力都弹到一个新的单元上,利用这部分资源支撑大促,同时在大促之后快速还回来。

\"\"

上图是 OB 这几年在大促上的弹性化体系,分为四层:

1、基础设施。今年大促的基础设施是网络、存储计算的介质、底层与内核的交互、网络互联。

2、基础架构。这是底层对业务可见的基础部署,我们把业务放到容器里,上面是业务可见的架构,有独立的异构 FO 和同城三级房部署。为了弹性的效率,我们还做了多副本的架构,比如传统的主库、备库以及最近两年新加的日志节点。

3、能力沉淀。大促需要的能力和日常需要的能力相辅相成,如果日常就具备这样的能力,那么大促时就能从容应对。

4、大促服务。我们今年双 11 做了 4 万 + 的变更,实际上是通过 AutoScale 平台做的,同时我们也会结合稳定性的要求,比如变更三把斧,把这些能力做进去。

我们的三年战略是百万支付,经测算三年之内交付峰值将达到一百万。因为应用是无状态的,只要我们在整个系统上做到可扩容、可弹性,把机器加上去就可以解决。但是 DB 端不行,一份数据所能够使用的存储空间和很多东西相关,比如业务方的分表、单机的性能都有一定的瓶颈,百万支付落到 DB 端最核心的问题就是怎么解决最小的数据分片,解决资源规格异构和负载均衡偏差的资源问题。

\"\"

这个图代表了当前支付宝架构的解决方案。右边 00 代表一个分片,全中国路由出来是 UID 的 00。支付事务跨多张表,每一张表对应的多个分片,我们会把它聚合在一起,代表一个实例或者租户,一个租户使用的最大资源是物理机的资源。如果想要把 00 继续拆分,就把 00 分片再取两位做哈希。对新的业务通过弹性规则,访问对应的库。这样业务改造的工作量很大,因为要加四个数据库,并且加了之后没有办法回收。而且伸缩是有损的,因为要缩小服务器资源必然涉及到大量数据的缩容,那么应用就会感知到。

基于这些,我们提出了 OB2.0。这个项目最大的价值是做到 OB 分区,就是可以把一个应用维度看成一个数据分片,可以在 DB 端做到无限度的 sharding。我们通过 Partition Group 的概念,把不同表格相同分区聚合到相同的机器,同时还把任意一个分片结合物理机的数目进行二次聚合,聚合成大的 Partition Group,根据 server 数的不同,自动把分片分到不同的机器上,这就是百万支付结合 OB2.0 的架构。

OB2.0 打造百万支付能力的优势:

  • 弹性伸缩。分片可以无限 sharding,实现线性扩展,并且每一个分片都具备独立的扩展能力,可以满足多元化的弹性需求;

  • 业务无感无损。无感是指业务感觉不到 DB 的伸缩,外部公司如果想要做一个大促活动,不需要业务感知,直接由 DB 完成。无损是指整个弹性过程中业务不会有失败,因为这是通过我们的协议来实现的;

  • 极致高可用。通过灰度做到不同分片之间互相隔离,并且可低版本和高版本同时运行,如果一个分片一个星期没有问题,就可以自动对下一个版本进行处理;

  • 资源。我们可以把一个在高峰期占有很大资源的数据源拆成一个非常统一的资源粒度,它的好处就是可以很独立地做负载均衡。

我们做容器化有两方面原因:第一,常态;第二,大促。

常态会面临什么样的问题?现在 DB 服务器有几万台,如果对资源进行深入统计,就会发现 DB 资源肯定是过剩的。DB 资源无非就是 CPU、IO、内存,一个数据库不可能这三类都占满。我们做一个简单的统计,大促时所有的服务器的瓶颈是 CPU,而日常的瓶颈是存储空间,绝对不会是 CPU。另外,业务状态注定存在高峰 / 低峰访问。资源负载分为长尾、碎片两类,我们需要把碎片收集起来再利用。资源分为绝对资源和相对资源,在不同业务间它们的比例差距很大,在现在的支付宝规模下使用的资源浪费很大。我们每年采用的机型都有很大的变化,现在 CPU 越来越多、内存越来越多,CPU 也有换代更新,所以针对异构的机型要把能力统一标准化,提供统一的服务能力。

而大促态的成本体现在哪里?第一,大促所需服务器总数;第二,持有服务器的时长。如果使用一千台服务器,持有一个月,资源开销远远大于持有两千台服务器五小时,这涉及到服务器运营。

这些问题就对 DB 提出了要求,DB 要有容器化的能力,目的是要调度 DB,把它放在我们想要的地方。

我们做的容器化主要有三点:

  • 规格归一。分区是一种方案,还有一种方案是业务拆分,比如把一些明显不合理的长尾业务进行拆分,我们会把线上所有的 DB 顺序分为五个可以满足需求的规格,比如 2C8G、8C32G。我们做容器化的时候,只要是这五种规格就可以;

  • 资源隔离 / 抢占,这是一个重点,因为容器化的目的是保证系统的正常运行,不要因为成本丢弃系统的稳定性。这里有三大块:CPU、内存和 IO 通过 Cgroup 隔离,同时结合应用画像,比如根据这个业务过去三个月的增长情况、存储空间,做一个容器画像,打上业务属性的标签,比如关键点的地域信息、资源信息;

  • 多维调度,应用、机房、机架的调度。在 DB 层面,哪些租户放在一起最节省资源,这是从上到下贯穿整个资源载体的调度。

\"\"

这是 OB 大促容器化的架构。底层是通用的调度平台,要识别各种 IaaS,包括蚂蚁、金融云、阿里云、混合云。再往上是统一的调度层:一层是 sigma,主要做统一资源规划、资源生命周期、资源弹性、资源规划;二层调度层分为 kipp 和 OB,按照不同租户的画像信息,得出调度策略是平铺、抢占还是资源亲和(资源亲是指,单机不超过 1% 的容灾,通过资源亲和,把一笔支付链路上所能够经过所有的应用和 DB 统一调度在同一台机器上,通过一个亲和性标签放在一起,大大降低宕机的影响面);右边是调度管控,包含水位、资源 Plan 和资源标签;最上层是容器化达到的价值,首先是资源利用率,第二是单机 1% 容灾,第三是无损压测,第四是存区 \u0026amp; 存储就近,让存储节点和计算节点两者离得最近、网络和 IO 离得最近。

为什么要做平台智能化?第一是大促常态化。往年支付宝只有两个活动:双 11、双 12,但是现在每个月都有三四个大促,大促的稳定性要求很高,那怎么把活动支持得更好呢?传统上是做简单的扩容,做一些预案,但现在会发现光做这些不够了,我建议通过智能化的手段解决。可以把流程抽出来,结合最小的集群智能化,两者有机结合实现根本目标。第二是随着业务规模爆发,怎么解决硬件存在的隐患,怎么解决 10w+ 机器操作系统从 6U 升级到 7U。第三是稳定性,我们要做到 5 个 9,换算出来也就是全年停服不能超过 60 分钟。要到达到这个目标,任何的应急措施都不能依赖于人,也不能通过指令触发,必须通过智能。

介绍一下 OB 在大促智能化上的实践,主要有两点:第一,自动扩缩容;第二,SQL 调优。我们首先会对链路信息和 DB 运行状态进行建模,从应用服务器中间件数据源清洗出来链路信息,从 CPU、IO 各方面对每一条链路的 DB 节点进行数据拟合,得到拟合线后,通过指标的输入,推测在这个压力下 DB 的水位会产生什么样的波动或者峰值,从而可以把每一个业务的容量信息、每一个租户信息刻划出来,结合调度做一些智能的 rebalance;第二是 SQL 调优,我们会监控每一条 SQL 的状态,比如这一条 SQL 的使用概率、任意资源的消耗情况,给出 SQL 调优的建议。

第三是压测的资源预测和垄断。如果预测在接下来三分钟之内内存会占满,就自动停止掉。如果预测到 RT 水位对于业务来说是超时的,就停止自动压测。

\"\"

我们把稳定性做到 5 个 9,分成三个模块:第一,感知,我们会对各种 workload 建模,形成非常丰富的曲线,通过曲线得出模型归纳和预测变化;第二,决策,第一个方法是基于经验,形成每一个数,每一个数的子节点是上一个节点的原因分析,往下是它的根因;第二个方法是机器学习,这是自我认知的过程,我们会把这些经验做输入,通过演进和优化不断得出最佳的决策树;第三,执行器,我们会对上一层信息进行更新阶段,根据诊断得出需要执行的方案,比如需要调优、扩容、还是修复。

OB 结合大促场景下的未来规划主要有两个方面:

资源。资源是我们做大促的核心价值,用最小的资源解决用户最大的问题。第一,统一调度。不仅仅是 DB 端的统一调度,我们还要把用户服务器、各种机型、资源池全部打通,这样就有了更大的池子,技术可发挥的空间更大;第二,混合部署。统一部署之后会分池分布、分类混布;第三,分时复用。混布和分时复用的效率体现很明显,因为不需要做大促处理时候可以节省资源开销;

自治。第一是 OB 内核的自治,第二是平台化的自治。自治分为三块:

自愈,主要解决稳定性的问题,有硬件故障、流量无峰、软件异常类的垄断;

自驾驶,集群容量、租户容量、集群升级等完全不需要人参与,实现无人职守;

自调优,把线上流量全部抓下来,在线下库里对流量进行滚放,滚放出来的流量可以自编程核对、关联度分析,所有的线上场景都可以在线下进行演练。


TGO鲲鹏会,系极客邦科技旗下高端技术人聚集和交流的组织,旨在组建全球最具影响力的科技领导者社交网络,线上线下相结合,为会员提供专享服务。目前,TGO鲲鹏会已在北京、上海、杭州、广州、深圳、成都、硅谷、台湾、南京、厦门、苏州十一个城市设立分会,武汉分会即将成立。现在全球拥有在册会员 740 余名,60% 为 CTO、技术 VP、技术合伙人。

会员覆盖了 BATJ 等互联网巨头公司技术领导者,同时,阿里巴巴王坚博士、同程艺龙技术委员会主任张海龙、苏宁易购 IT 总部执行副总裁乔新亮已经受邀,成为 TGO 鲲鹏会荣誉导师。

如果你想和这些优秀的科技领导者们一起前行,欢迎点击「报名表单,申请加入」。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/276529.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

学习 jQuery 源码整体架构,打造属于自己的 js 类库

虽然现在基本不怎么使用 jQuery了,但 jQuery流行 10多年的 JS库,还是有必要学习它的源码的。也可以学着打造属于自己的 js类库,求职面试时可以增色不少。本文章学习的是 v3.4.1版本。unpkg.com源码地址:https://unpkg.com/jquery3…

5分钟轻松教您如果组建100-500路大型拼接监控系统!

冰山融汇百家号17-07-2700:41大型监控系统如何组网,分布式还是集中式?可靠性与性价比又如何取舍?什么才是最合适的视频监控存储产品?在不同地区、行业的项目中,这些疑问均成为业主、专家、系统集成商等各方面共同关注的…

(转)mssql2005生成表字典

出处不详 CodeSELECT TOP 100 PERCENT --a.id, CASE WHEN a.colorder 1 THEN d.name ELSE END AS 表名, CASE WHEN a.colorder 1 THEN isnull(f.value, ) ELSE END AS 表说明, a.colorder AS 字段序号, a.name AS 字段名, CASE WHEN COLUMNPROPERTY(a.id, a.name, IsIdenti…

表操作

2019独角兽企业重金招聘Python工程师标准>>> 字段修改 alter table TA drop partition (day<2018-12-10); ALTER TABLE TB ADD COLUMNS (userStatus String) CASCADE; ALTER TABLE TC change appversion appCommonVersion String CASCADE; ALTER TABLE TD DROP C…

学习underscore源码整体架构,打造属于自己的函数式编程类库

前言上一篇文章写了 jQuery整体架构&#xff0c;学习 jQuery 源码整体架构&#xff0c;打造属于自己的 js 类库虽然看过挺多 underscore.js分析类的文章&#xff0c;但总感觉少点什么。这也许就是纸上得来终觉浅&#xff0c;绝知此事要躬行吧。于是决定自己写一篇学习 undersco…

拓扑目的 1.Pc9通过van3访问pc10 2.Pc9通过Vlan1\Vlan2访问pc11

1拓扑图2设置路由器R12的接口的IPint g0/0/0ip address 192.168.20.254 24undo shutdown int g0/0/01ip address 192.168.1.1 24undo shutdownint g2/0/00ip address 192.168.3.1 24undo shutdown 3设置路由器R10的接口的IPint g0/0/0ip address 192.168.2.1 24undo shutdownin…

学习 lodash 源码整体架构,打造属于自己的函数式编程类库

前言这是 学习源码整体架构系列第三篇。整体架构这词语好像有点大&#xff0c;姑且就算是源码整体结构吧&#xff0c;主要就是学习是代码整体结构&#xff0c;不深究其他不是主线的具体函数的实现。文章学习的是打包整合后的代码&#xff0c;不是实际仓库中的拆分的代码。上上篇…

推荐一个快速反射调用的类

使用传统的.net反射机制&#xff0c;调用类的方法时&#xff0c;在调用频率大的情况下&#xff0c;会感觉速度很慢。最近浏览卢彦的博客时&#xff0c;找到一个他改进后的反射调用类。试用以后感觉效率明显提高&#xff0c;特推荐给大家。作者重新实现了&#xff0c;反射调用方…

面试官问:JS的继承

原文作者若川&#xff0c;掘金链接&#xff1a;https://juejin.im/post/5c433e216fb9a049c15f841b写于2019年2月20日&#xff0c;现在发到公众号声明原创&#xff0c;之前被《前端大全》公众号等转载阅读量超1w&#xff0c;知乎掘金等累计阅读量超过1w。导读&#xff1a;文章主…

qt 快速按行读取文件_这是知识点之Linux下分割文件并保留文件头

点击上方"开发者的花花世界"&#xff0c;选择"设为星标"技术干货不定时送达&#xff01;这是一个知识点方便快捷的给结构化数据文件分割大小并保留文件的表头&#xff0c;几十个G的结构化文件不仅阅读编辑麻烦&#xff0c;而且使用受限&#xff0c;因此高效…

mono 调用windows webService

1. 实现linux mono Develop中调用windows 中的webService l linux 与 windows 在一个局域网的网段中 l windows 的IIs中发布webService 2. windows 中的设置 l webService 的代码 using System; using System.Collections.Generic; using System.Linq; using S…

学习 sentry 源码整体架构,打造属于自己的前端异常监控SDK

前言这是学习源码整体架构第四篇。整体架构这词语好像有点大&#xff0c;姑且就算是源码整体结构吧&#xff0c;主要就是学习是代码整体结构&#xff0c;不深究其他不是主线的具体函数的实现。文章学习的是打包整合后的代码&#xff0c;不是实际仓库中的拆分的代码。其余三篇分…

绑定dictionary 给定关键字不再字典中_VBA代码集锦-利用字典做两列数据的对比并对齐...

源数据&#xff1a;代码&#xff1a;Sub 对比()Dim arr, brr, crrDim i, j, n, lastrowA, lastrowB As Integer建立字典对象Set d CreateObject("scripting.dictionary")获取数据区域最后一行的行数lastrowA Sheets("对比对齐两列数据").Cells(Rows.Coun…

前端使用puppeteer 爬虫生成《React.js 小书》PDF并合并

前端也可以爬虫&#xff0c;写于2018年08月29日&#xff0c;现在发布到微信公众号申明原创。掘金若川 本文章链接&#xff1a;https://juejin.im/post/5b86732451882542af1c80821、 puppeteer 是什么&#xff1f;puppeteer: Google 官方出品的 headless Chrome node 库puppetee…

信息安全管理与评估_计算机工程学院教师参加“信息安全管理与评估赛项”说明会...

看了就要关注我&#xff0c;喵呜~2019年3月15日下午&#xff0c;2019年陕西省高等职业院校技能大赛“信息安全管理与评估赛项说明会”在咸阳职业技术学院举行。出席本次会仪的有咸阳职业技术学院教务处长杨新宇、神州数码范永强经理、神州数码信息安全工程师高峰和各院校指导教…

haproxy概念和负载均衡

https://pan.baidu.com/s/1Sq2aJ35zrW2Xn7Th9j7oOA //软件百度网盘连接 在80.100虚拟机上 systemctl stop firewalld //关闭防火墙 setenforce 0 //关闭监控 yum install lrz* -y //安装上传软件 tar xf haproxy-1.5.15.tar.gz -C /opt/ //解压压缩包到/opt/ cd /op…

知乎问答:一年内的前端看不懂前端框架源码怎么办?

知乎问答&#xff1a;一年内的前端看不懂前端框架源码怎么办&#xff1f;以下是我的回答&#xff0c;阅读量 1000。现在转载到微信公众号中。链接&#xff1a;https://www.zhihu.com/question/350289336/answer/910970733其他回答的已经很好了。刚好最近在写学习源码整体架构系…

冷启动问题:如何构建你的机器学习组合?

作为即将告别大学的机器学习毕业狗的你&#xff0c;会不会有种迷茫的感觉&#xff1f;你知道 HR 最看重的是什么吗&#xff1f;在求职季到来之前&#xff0c;毕业狗要怎么做&#xff0c;才能受到 HR 的青睐、拿到心仪的 Offer 呢&#xff1f;负责帮助应届生找到机器学习工作的 …

JavaScript 对象所有API解析【2020版】

写于 2017年08月20日&#xff0c;虽然是2017年写的文章&#xff0c;但现在即将2020年依旧不过时&#xff0c;现在补充了2019年新增的ES10 Object.fromEntries()。发到公众号申明原创。若川顺便在此提前祝大家&#xff1a;2020年更上一层楼。近日发现有挺多人对对象基础API不熟悉…

PHP生成各种验证码和Ajax验证

转载链接&#xff1a;http://www.helloweba.com/view-blog-191.html 验证码在WEB应用中非常重要&#xff0c;通常用来防止用户恶意提交表单&#xff0c;如恶意注册和登录、论坛恶意灌水等。本文将通过实例讲解使用PHP生成各种常见的验证码包括数字验证码、数字字母验证码、中文…