【参天引擎】华为参天引擎内核架构专栏开始更新了,多主分布式数据库的特点,类oracle RAC国产数据开始出现了

cantian引擎的介绍

专栏内容

  • 参天引擎内核架构
    本专栏一起来聊聊参天引擎内核架构,以及如何实现多机的数据库节点的多读多写,与传统主备,MPP的区别,技术难点的分析,数据元数据同步,多主节点的情况下对故障容灾的支持。

  • 手写数据库toadb
    本专栏主要介绍如何从零开发,开发的步骤,以及开发过程中的涉及的原理,遇到的问题等,让大家能跟上并且可以一起开发,让每个需要的人成为参与者。
    本专栏会定期更新,对应的代码也会定期更新,每个阶段的代码会打上tag,方便阶段学习。

开源贡献

  • toadb开源库

个人主页:我的主页
管理社区:开源数据库
座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物.

文章目录

  • cantian引擎的介绍
  • 前言
  • 概述
  • cantian引擎是什么
  • 多主分布式架构的特点
    • 高可用
    • 扩展性
    • 应用无修改
  • 多主分布式架构的技术难点
    • 数据库元数据的同步
    • 数据库分布式锁
    • 多节点事务一致性
    • 多写下的恢复
    • 多机共享文件系统
  • 参天引擎可以做什么
  • 结尾

前言

国内数据库的发展如火如荼,每年的各种大会都会听到好消息,今年除了数据库本身的各种技术演进之外,华为发布了参天引擎,而且是做为数据库的一种基座形式,也就是所有数据库可以在参天引擎基础上,构建形成多主分布式架构的数据库系统,这也就是它叫引擎的目的。

本专栏就来详细聊一聊参天引擎内部架构,以及如何适配参天引擎。

概述

据华为官网发布的新闻,题为:华为宣布CANTIAN引擎开源,携手共建数据库存储新生态,已经有万里数据库适配完成,万里数据库是基于mysql,也就是说mysql与参天引擎结合成功,达到了分布式数据库集群,基于共享存储的多主效果。

华为在数据库方向上开源了GuassDB之后,又宣布开始了参天引擎,这又是什么神器呢,今天我们就一起来看一看。

cantian引擎是什么

随着数据库国产化的推进,基础模型的数据库大多都与国外品牌有了对标产品,比如说主从,延伸出来的一主多从,读写分离等,已经很成熟,也有很多中间键可以应用开源数据库mysql,postgresql都有类型部署模式;

还有MPP模式,也就是元数据在master节点,通过切片将实际数据放在worker节点,已经有开源的citus, greenplum等数据库支持;

但是对于数据库巨头oracle的 oracle RAC产品对标产品一直没有进展,也就是说它还不能被很好的替代。

oracle RAC主要特点是高可用,不是其它一些模型能达到了,而华为cantian引擎的出现,就是干了这么一件事,可以对标oracle RAC了。

基于共享存储的架构

oracle RAC其实是一种基于共享存储的分布式集群架构,从上图可以看到,集群中的每个数据库节点都访问同一份相同的数据,同时每个数据库节点都可以进行读写操作,比如两个节点上同时可以对同一张表进行插入数据操作。

这种架构模型下,集群中一个节点故障后,其它节点完全可以接管所有业务。

参天引擎的目标是让数据库具有“分布式架构+集中式体验”的多主架构数据库,它通过client,server, 存储三层,将传统单机数据库,如mysql,postgresql与client进行结合,从而改造成多主的分布式集群式数据库。

换句话说,参天引擎可以是一种标准服务,只要数据库系统与client进行改造对接后,就可以使用server,存储层,这样就可以支持多主的分布式架构。

多主分布式架构的特点

oracle RAC类型的共享存储下的分布式数据库,有什么特点,或者它的优势在那里呢?

在历年的oracle RAC白皮书中反复提到这几个特性,而且对它们进行持继的更新演进,当然也是多主分布式架构的最核心特点。

高可用

集群中的多个节点完全对称,也就是任意两个节点是一模一样的,这就是说业务可以运行在任意节点上,真实使用时只是通过负载均衡将业务分散到了各节点上,使负载达到了均衡。

各节点对称,这一特性使得当任意节点故障时,业务可以立马转移到其它节点上,这与主从架构,MPP架构完全不同。

主从架构中,只有主具有处理所有业务的能力,从节点具有处理只读业务的能力,当主节点故障时,需要重新选主,再进行业务切换;

而MPP架构中,特点区分更加明显,它具有两个节点角色,对于master角色的节点,只存储元数据,也即数据分布信息,它的高可用一般也采用一主多从的形式,故障时处理与主从是一样的;而对于worker角色的节点,它们存储了一部分分片的数据,它们一般通过多副本机制达到冗余备份的高可用,故障节点的数量不能超过副本数量,副本越多管理成本越高。

按照oracle RAC最新的版本,这个故障处理的能力已经非常丝滑,可以达到事务级别的转移,这在其它两个架构,由于架构的限制很难做到。

在这里插入图片描述

业务连续性的用户体验,这在一些关键应用中体现非常重要,这里借用oracle rac技术白皮书中的一张图来说明。

扩展性

当然对于多主架构,集群中增加一个节点,业务负载就可以立即分担;同样减少一个节点时,对应业务负载也可以转移到剩余节点上。有点像现在的云部署的感觉,通过自动化的控制,完全可以按照业务负载调整资源的使用情况。

当然,这在其它架构也是很难达到的。

应用无修改

经过几年的数据库国产化后,这一点体验比较深刻,现在都会支持单机,主从,MPP部署,但这三种都需要应用能够做一些适配,尤其MPP部署,需要这种应用的业务要完全适合此种架构,就有很多限制,比如复杂联合查询就要特别当心了,最好提前能够整改了。

而对于多主分布式架构,这些情况都不存在,不需要区分只读,读写业务,也不需要担心SQL的不支持,单机部署也开发正确,在多主分布式架构下就是可以的;

这大大简化了业务应用的开发,同时对于业务应用架构设计的成本也降低了,不需要对每种数据库的限制深入了解。

多主分布式架构的技术难点

多主的分布式架构为什么迟迟在国内没有大的推进呢,它主要有几大技术难点,每个难度都是一个重量型的开发,所以对企业,尤其是资本业讲,很难在短期得到收益。

数据库元数据的同步

对于多主的分布式系统,最先面临的就是元数据的多机同步,数据库也是一样,在多写的情况下,每个节点都会产生元数据,需要实时同步。

数据库分布式锁

多节点如果访问同一数据元素时,需要进行加锁,那这个锁不再是单机系统下的某个内核变量,而是要扩展到分布式下多节点间的锁,在多节点起到加锁互斥的效果。当然在分布式下有很多实践,但是数据库这样高频使用场景下,如何能提高性能是不得不考虑的问题。

多节点事务一致性

在数据库概念专栏,分享并发控制的可串行化相关内容,那些都是单机架构下的,如何在多节点时做到事务的并发一致性,需要将封锁,时间戳,有效性确认几种方式扩展到多节点。

其中事务号,也就是事务时间戳的实现,就有好几种方式,如时钟,统一分发的序号等等。

多写下的恢复

多个节点都可以写入数据,那么故障时,如何恢复,数据的一致性又如何保障呢?

比如两个节点修改了数据,它们的先后顺序的确定,单机也是由日志的时间戳方式进行排序,而多机时,如何使用统一的日志,那竞争必然加大。

在数据库概念专栏中对于恢复,分享了几种技术,如redo, checkpoint等,那对于redo,checkpoint都需要日志先落盘,或者对日志进行回收处理,在多节点间如何保障日志先于数据落盘。

多机共享文件系统

当然以上各点都是对于数据库来讲的,对于基于共享存储的多主分布式架构,还有一个重要的技术难点,就是文件系统。

假如多个节点同时对一个表文件进行写入,或者扩展,传统的ext4,xfs肯定是不行的,多节点各自部署在独立的服务器上,对应着多个操作系统,各自的文件系统元数据是不交互的,此时就会混乱。

而对于分布式文件系统,一般都会将元数据缓存在客户端,也就是每个使用者的机器上,会导致更新不及时。

参天引擎可以做什么

从华为官方发布的消息来看,已经与厂商合作适配成功了,也达到了多主分布式集群的效果,从其它媒体发布的消息来看,测试的数据还是不错。

目前看起来对于mysql进行了适配,另一个主流开源数据库postgresql还没有看到消息,其它也没有看到更多介绍的文档。

既然开源了,那接下来我们就从源码角度看看,参天引擎可以做什么,拿postgresql来适配的话,难度会有多少。

结尾

非常感谢大家的支持,在浏览的同时别忘了留下您宝贵的评论,如果觉得值得鼓励,请点赞,收藏,我会更加努力!

作者邮箱:study@senllang.onaliyun.com
如有错误或者疏漏欢迎指出,互相学习。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/213136.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python 中 4 个高效的技巧(建议收藏)

今天我想和大家分享 4 个省时的 Python 技巧,可以节省 10~20% 的 Python 执行时间。 反转列表 Python 中通常有两种反转列表的方法:切片或 reverse() 函数调用。这两种方法都可以反转列表,但需要注意的是内置函数 reverse() 会更改原始列表…

【数据结构】C语言结构体详解

目录 前言 一、结构体的定义 二、定义结构体变量 三、结构体变量的初始化 四、使用typedef声明新数据类型名 五、指向结构体变量的指针 总结 🌈嗨!我是Filotimo__🌈。很高兴与大家相识,希望我的博客能对你有所帮助。 &#x1f4a1…

做题笔记:SQL Sever 方式做牛客SQL的题目--查询每天刷题通过数最多的前二名用户

----查询每天刷题通过数最多的前二名用户id和刷题数 现有牛客刷题表questions_pass_record,请查询每天刷题通过数最多的前二名用户id和刷题数,输出按照日期升序排序,查询返回结果名称和顺序为: date|user_id|pass_count 表单创建…

Spring JDBC和事务管理

Spring JDBC是Spring框架用来处理关系型数据库的模块&#xff0c;对JDBC的API进行了封装。 Spring JDBC的核心类为JdbcTemplate&#xff0c;提供数据CRUD方法 Spring JDBC使用步骤 Maven工程引入依赖spring-jdbc <dependency><groupId>org.springframework<…

对Spring源码的学习:Bean实例化流程

目录 SpringBean实例化流程 Spring的后处理器 Bean工厂后处理器 Bean后处理器 SpringBean实例化流程 Spring容器在进行初始化时&#xff0c;会将xml配置的<bean>的信息封装成一个BeanDefinition对象&#xff0c;所有的BeanDefinition存储到一个名为beanDefinitionMa…

Docker容器的可视化管理工具—DockerUI本地部署与远程访问

文章目录 前言1. 安装部署DockerUI2. 安装cpolar内网穿透3. 配置DockerUI公网访问地址4. 公网远程访问DockerUI5. 固定DockerUI公网地址 前言 DockerUI是一个docker容器镜像的可视化图形化管理工具。DockerUI可以用来轻松构建、管理和维护docker环境。它是完全开源且免费的。基…

2023 CCF中国软件大会(CCF ChinaSoft) “程序语义深度理解前沿进展”论坛成功召开...

2023年12月2日&#xff0c;2023年度CCF中国软件大会软件程序语义深度理解前沿进展论坛成功召开。 本次论坛由南京大学卜磊老师和国防科技大学陈振邦老师主持&#xff0c;计算机研究与发展期刊代表侯丽珊老师致辞&#xff0c;旨在反映程序语义理解及其应用相关研究前沿进展与实践…

Vue之模板语法

模板语法有两大类&#xff1a; 1.插值语法 2.指令语法 让我为大家介绍一下吧&#xff01; 一、插值语法 功能:用于解析标签体内容。 写法: {{xxx}}&#xff0c;xxx是js表达式&#xff0c;且可以直接读取到data中的所有属性。 举个例子&#xff1a; <!DOCTYPE html> &l…

探索未来新趋势:鸿蒙系统的崭新时代

探索未来新趋势&#xff1a;鸿蒙系统的崭新时代 随着科技的不断发展&#xff0c;操作系统作为计算机和移动设备的核心&#xff0c;扮演着至关重要的角色。近年来&#xff0c;一种备受瞩目的操作系统——鸿蒙系统&#xff08;HarmonyOS&#xff09;崭露头角&#xff0c;正引领着…

Selenium 中并行测试的重要性!

随着技术的进步&#xff0c;测试解决方案变得更具可扩展性&#xff0c;加速了团队从手动测试到Selenium测试自动化的转型。但是成年人的世界&#xff0c;没有什么是容易的。对于许多团队来说&#xff0c;并行运行多个测试仍然是不可扩展的。他们倾向于遵循传统的顺序执行测试方…

MIT6.5840-2023-Lab2A: Raft-leader election

前置知识 什么是一致性算法&#xff1f; 安全性保证&#xff0c;绝对不会返回一个错误的结果&#xff1b;可用性&#xff0c;容忍集群部分节点失败&#xff1b;不依赖时序来保证一致性&#xff1b;一条指令可以尽可能快的在集群中大多数节点响应一轮远程过程调用时完成。小部分…

uniapp实战 —— 可滚动区域 scroll-view (自适配高度,下拉刷新)

自适配高度 自定义的顶部导航栏&#xff0c;可参考博文 https://blog.csdn.net/weixin_41192489/article/details/134852124 如图可见&#xff0c;在页面滚动过程中&#xff0c;顶部导航栏和底栏未动&#xff0c;仅中间的内容区域可滚动。 整个页面的高度设置为 100%&#xf…

鸿蒙开发—学习声明式UI

基本UI描述 ArkTS通过装饰器Component和Entry装饰struct关键字声明的数据结构&#xff0c;构成一个自定义组件。自定义组件中提供了一个build函数&#xff0c;开发者需在该函数内以链式调用的方式进行基本的UI描述&#xff0c;UI描述的方法请参考UI描述规范。 基本概念 stru…

GZ029 智能电子产品设计与开发赛题第4套

2023年全国职业院校技能大赛高职组 “GZ029智能电子产品设计与开发”赛项赛卷四 题目&#xff1a;模拟工业传送带物品检测系统的设计与开发 1 竞赛任务 在智能电视机上播放工业传送带传输物品视频&#xff0c;模拟工业传送带物品检测系统&#xff08;以下简称物品检测系统&…

DALI1.0学习——BIT解码

最近在学习DALI调光相关知识并下载了Microchip提供的基于ATMega88PA的软件工程及硬件设计参考方案。写这些文章的目的就是把自己对知识的理解作一些梳理。 芯片厂果然专业&#xff0c;考虑得相当周到&#xff0c;为了芯片销量连软件和硬件方案全都提供了。芯片厂关于DALI1.0实…

【unity小技巧】实现枪武器随镜头手臂摇摆效果

文章目录 前言方法一、改变武器位置方法二、改变武器旋转结语完结 前言 如果我们视角移动转向&#xff0c;武器如果不跟着进行摇摆&#xff0c;会感觉我们的动作很生硬&#xff0c;特别是射击类游戏&#xff0c;如下 实现武器摇摆这里主要分享两种实现方法&#xff0c;一种是…

SSD数据在写入NAND之前为何要随机化?-Part1

SSD的存储介质是什么&#xff0c;它就是NAND闪存。那你知道NAND闪存是怎么工作的吗&#xff1f;其实&#xff0c;它就是由很多个晶体管组成的。这些晶体管里面存储着电荷&#xff0c;代表着我们的二进制数据&#xff0c;要么是“0”&#xff0c;要么是“1”。NAND闪存原理上是一…

0基础学java-day14-(集合)

一、集合 前面我们保存多个数据使用的是数组&#xff0c;那么数组有不足的地方&#xff0c;我们分析一下 1.数组 2 集合 数据类型也可以不一样 3.集合的框架体系 Java 的集合类很多&#xff0c;主要分为两大类&#xff0c;如图 &#xff1a;[背下来] package com.hspedu.c…

设计模式之GoF23介绍

深入探讨设计模式&#xff1a;构建可维护、可扩展的软件架构 一、设计模式的背景1.1 什么是设计模式1.2 设计模式的历史 二、设计模式的分类2.1 创建型模式2.2 结构型模式2.3 行为型模式 三、七大设计原则四、设计模式关系结论 :rocket: :rocket: :rocket: 在软件开发领域&…

算法:爬楼梯(迭代和动态规划)

迭代 时间复杂度 O(n) 空间复杂度 O(1) /*** param {number} n* return {number}*/ var climbStairs function(n) {let l 0, r 0 , sum 1for(let i1; i<n; i){l rr sumsum l r}return sum }; 动态规划 时间复杂度 O(n) 空间复杂度 O(n) /*** param {number} n* r…