ShardingSphere再回首

概念:

 连接:通过协议 方言及库存储的适配,连接数据和应用,关注多模数据苦之间的合作

  增量:抓取库入口流量题提供重定向, 流量变形(加密脱敏)/鉴权/治理(熔断限流)/分析等

  可插拔:微内核

DDL:create table/index | alter table |drop table |truncate table|drop index/table 表结构

DML:insert update delete 表数据的操作

DQL:select 

DCL:grant分权限 revoke废除权限

分表分库

数据分片:按某维度将存放在单一数据库中的数据分散地存放至多个数据库或表

垂直分片

专库专用,按业务

水平分片

通过某个字段(或某几个字段),根据某种规则将数据分散至多个库或表中

流程

Standard 内核流程:SQL 解析 => SQL 路由 => SQL 改写 => SQL 执行 => 结果归并,用于处理标准分片场景下的 SQL 执行

Federation 执行引擎流程:SQL 解析 => 逻辑优化 => 物理优化 => 优化执行 => Standard 内核流程,在优化执行阶段依赖Standard内核流程,对优化后的逻辑 SQL 进行路由、改写、执行和归并

sql解析:词法/语法解析,词法解析器SQ拆分不可再拆的词 Token,词法解析器 理解 sql,解析上下文(表/选择项/排序项/分组项/聚合函数/分页信息/查询条件/占位符标记)

sql路由:分片/广播,解析上下文匹配分片策略,生成路由路径

sql改写:在真实数据可以执行的语句,正确性/优化改写

sql执行:多线程执行器异步执行

结果归并:结果由统一的JDBC接口输出,流式归并/内存归并/装饰者模式追加归并

   流式归并:以结果集游标下移进行结果归并,省内存 减少垃圾回收

查询优化:Federation提供,优化关联/子查询跨库分布式查,关系代数优化查询计划,最优计划查询出结果

解析引擎

抽象语法树

    sql解析阶段的token,再据不同数据库方言提供的字典,将其归类为关键字 表达式 字面量 操作符,语法解析器将sql转换为抽象语法树

 解析过程不可逆,token按原本顺序依次解析,性能高

sql解析引擎

   3.0 ANTLR作为SQL解析的引擎(兼容sql),据DDL -> TCL -> DAL –> DCL -> DML –>DQL依次替换原有的解析引擎,慢 需要搭配PreparedStatement预编译

路由引擎

上下文匹配数据库/表的分片策略,生成路由

携带分片键sql,分片键不同划分单片路由(=)多片路由(in)范围路由(between)

不携带 分片键 的广播路由

分片策略

 内置:尾数取模 哈希 范围 标签 时间

 用户配置:需求定制复合分片策略

分片路由

直接路由:分库不分表 hint指定路由到库,避免sql解析 结果归并;可子查询 自定义函数等任意sql

标准路由:推荐,不含关联查 仅绑定表间关联的sql,=单表 between/in不定 sql拆分数目与单表一致

笛卡尔积路由:复杂 非绑定表间关联查询需拆解为笛卡尔积组合执行 t0t0  t0t1  t1t0  t1t1

广播路由
  • 全库表:库中逻辑表相关的all操作,DQL DML DDL,all库all表匹配逻辑表和真实表名 执行
  • 全库:对库操作,set/TCL事务控制语句,据逻辑名字遍历符合名字匹配的真实库
  • 全实例:DCL 每个库只执行一次
  • 单播:获取真实的表信息 任意库的任意真实表即可
  • 阻断:屏蔽sql对数据库的操作

改写引擎

逻辑SQL改写在真实数据库中可正确执行的SQL:正确性改写 优化改写

流式归并优化:group by 的sql增加order by和分组项相同的排序项/顺序

执行引擎

 执行引擎的目标是自动化的平衡资源控制与执行效率

连接模式

   每个分片查询维持一个独立的数据库连接:利用多线程提供执行效率/并行处理io消耗/避免过早将结果放到内存/持有查询结果集游标位置的引用

  无法保证每个分片持有独立数据库连接,在复用该库连接获取下一张分表查询结果集之前,当前查询结果集全数加载至内存,流式退化为内存归并

   抉择:对库连接资源控制保护 更优归并模式对中间件内存资源节省

内存限制模式

  不限制一次操作所耗费的数据库连接数量,多线程并发处理,执行效率最大化

  且在sql满足条件情况下,优先选择流式归并,防止内存溢出 避免频繁垃圾回收

  OLAP:提供吞吐量,联机分析处理 复杂计算和统计 数据分析预测

连接限制模式

   控制连接数量唯一连接串行执行处理,分片散落不同数据库 多线程处理不同库的操作 一个库一个连接,防止对一次请求对数据库连接占用过多所带来的问题,内存归并

   OLTP(联机事务) 实时性 事务处理数据操作

      带分片键 路由到单一分片 保证库资源被更多应用使用到

自动化执行引擎

由执行引擎根场景自动选择最优的执行方案

连接模式的选择粒度细化至每一次SQL的操作

    据路由结果,实时演算和权衡,自主选择:资源 效率最优 

    仅配置maxConnectionSizePerQuery一次查询时每个数据库所允许使用的最大连接数

准备阶段

结果集分组 执行单元执行两步

  1. sql路由结果按数据源的名称分组
  2. 获得在数据库实例在maxConnectionSizePerQuery范围,一连接需执行的SQL路由结果组,计算出本次请求的最优连接模式

避免死锁:同步获取连接,创建执行单元 原子性一次性获取本次sql需要all库连接

  • 避免锁定一次性只需要1个库连接的操作,不需锁定,OLTP分片键路由唯一节点 读写分离
  • 内存限制模式才资源限定,连接限制all结果集在内存后释放连接资源 不会死锁
执行阶段

分组执行

   准备执行阶段生成的执行单元下发到底层并发执行引擎,执行过程中关键步骤发送事件 执行引擎仅关注事件发布 订阅感兴趣的并处理

归并结果

   内存归并结果集或流式归并结果集,将其传递至结果归并引擎   

归并引擎

   结果归并:从各个数据节点获取的多数据结果集,组合成结果集并正确的返回给请求客户端

   返回结果集方式归并,减少内存消耗

流式归并:每一次从结果集中获取到的数据,能通过逐条获取的方式返回正确的单条数据,与数据库原生的返回结果集的方式契合

   遍历、排序以及流式分组都属于流式归并的一种

内存归并:需将结果集的all数据都遍历并存储在内存,通过统一的分组、排序及聚合等计算,再将其封装成逐条访问的数据结果集返回

装饰者归并:对all结果集归并进行统一的功能增强,分页归并和聚合归并这2种类型

遍历:将多个数据结果集合并为一个单向链表

   遍历完当前结果集,链表元素后移一位,继续遍历下一个数据结果集

排序:ORDER BY每个数据结果集自身是有序的,将结果集当前游标指向的数据值进行排序

    将每个结果集的当前数据值进行比较(通过实现Java的Comparable接口),将其放入优先级队列, 获取下一条数据时,只需将队列顶端结果集的游标下移,并据新游标重新进入优先级排序队列找到自己的位置即可

  ???

分组:流式分组归并/内存分组归并

聚合:之前介绍的归并类的之上追加的归并能力,比较min max、累加sum count和求平均值avg

分页:通过结果集的next方法跳过无需取出的数据,不会将其存入内存

数据脱敏

完整、安全、透明化、低改造成本的数据加密整合解决方案

  •   解析用户输入的SQL进行,依据用户提供的加密规则改写SQL,实现对原数据加密,将原文数据(可选)及密文数据同时存储到底层数据库
  • 查询数据,从数据库中取出密文数据,并对其解密,将解密后的原始数据返回给用户。
  • 自动化 & 透明化数据加密过程,无需关注数据加密的细节,像使用普通数据那样使用加密数据

    加密模块拦截 SQL ,语法解析器进行解析、理解 SQL 行为,依传入的加密规则,找出需加密的字段和所使用的加解密算法对目标字段进行加解密处理后,与底层数据库交互

    在用户查询时,将密文从数据库中取出进行解密后返回给终端用户。 屏蔽对数据的加密解密处理过程

加密规则

加密处理过程

解决方案

新业务直接配置 

老业务

新的数据 走配置 新增字段 自动赋值

旧数据 自行加密清洗

将明文删除,建立映射关系 底层使用密文处理

加密算法

EncryptAlgorithm

 encrypt decrypt

    insert/delete/update ,按配置 sql解析/改写/路由 encrypt加密 存储到库

    查询decrypt从库取出加密 逆向解密,原始数据返回

md5 不可逆,aes可选,rc4可逆

QueryAssistedEncryptAlgorithm

相同的数据,库中也应该是不一样的

encrypt()阶段,设置某个变动种子,如时间戳。

    针对原始数据+变动种子组合的内容进行加密,加密数据是不一样的

decrypt()可依据之前规定的加密算法,利用种子数据进行解密

辅助查询列queryAssistedEncrypt

   另一种方式加密原始数据,针对原始数据相同的数据,产生的加密数据是一致的

事务

xa

X/OPEN组织定义的DTP模型抽象的 AP(应用程序), TM(事务管理器)和 RM(资源管理器)

  

    set autoCommit=0 ,XAShardingSphereTransactionManager 为调用具体的 XA 事务管理器开启 XA 全局事务,以 XID 的形式进行标记

   XAResource注册XA事务中,事务管理器 XAResource.start,库收到XAResource.end前,all的sql操作标记为xa事务

   XAShardingSphereTransactionManager收到接入端提交命令,委托xa事务管理器提交,收集到all注册xaResource, 发送XAResource.end 指令,依次发送prepare,手机xaResource投票,all均正确 commit最终提交,否rollback回滚

Saga

   一个Saga事务是一个有多个短时事务组成的长时的事务

   分布式事务场景下,一个Saga分布式事务看做是一个由多个本地事务组成的事务,每个本地事务都有一个与之对应的补偿事务

   在Saga事务的执行过程中,如某一步执行出现异常,Saga事务会被终止,同时会调用对应的补偿事务完成相关的恢复操作

自动反向补偿

     Saga事务管理器根程序执行结果生成一张有向无环图,在需要执行回滚操作时,据该图依次按照相反的顺序调用反向补偿操作

    Saga事务管理器只用于控制何时重试,何时补偿,补偿的具体操作需开发者提供

ShardingSphere采用反向SQL技术,将对数据库进行更新操作的SQL自动生成反向SQL,并交由saga-actuator执行,无需关注如何实现补偿,柔性事务管理器的应用范畴定位回了数据库层面

Seata

弹性伸缩

对现有的分片集群进行弹性扩容或缩容,4.1.0

临时建两个库集群,伸缩完切换

   解析旧分片规则,提取配置中的数据源、数据节点等,之后创建伸缩作业工作流

压测

   解析 SQL,对传入的 SQL 进行影子判定,根配置文件设置的影子规则,路由到生产库或者影子库

 以 INSERT 语句为例,对 SQL 进行解析,据配置文件规则,构造一条路由链

   在当前版本的功能中(很老的版本), 影子功能处于路由链中的最后一个执行单元:如果有其他需要路由的规则存在,如分片,据分片规则路由到某一个数据库,执行影子路由判定流程,判定执行SQL满足影子规则的配置,数据路由到对应的影子库,生产数据维持不变

DML:先判断执行SQL表与配置的影子表是否有交集,有:判交集影子表关联的影子算法,任一成功 sql路由到影子库,无交集 判定失败 路由到生产库

DDL:注解影子算法,初始化/修改影子库使用,执行的sql有注解 配置hint判定 成功路由影子库 否路由生产库

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/809142.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024最新AI系统【SparkAI】,ChatGPT商业运营版系统源码/ai问答/ai绘画/GPTs,SunoAI音乐生成大模型/带分销AIGC搭建部署教程

一、文章前言 SparkAi创作系统是基于ChatGPT进行开发的ai智能问答系统和Midjourney-AI绘画系统,支持OpenAI-GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美,那么如何搭建部署AI创作ChatGPT?小编这里写一个详细图文教程吧。已…

MySQL进阶一

目录 1.使用环境 2.条件判断 2.1.case when 2.2.if 3.窗口函数 3.1.排序函数 3.2.聚合函数 ​​​​​​​3.3.partiton by ​​​​​​​3.4.order by 4.待续 1.使用环境 数据库:MySQL 8.0.30 客户端:Navicat 15.0.12 2.条件判断 2.1.ca…

手机银行客户端框架之EMAS介绍

EMAS简介 阿里巴巴应用研发平台(Enterprise Mobile Application Studio,简称EMAS),是面向全端场景(移动App、H5应用、小程序、Web应用、PC应用等)的一站式应用研发平台。EMAS基于广泛的云原生技术&#xf…

5G智慧港口简介(一)

引言 港口作为交通运输的枢纽,在促进国际贸易和地区发展中起着举足轻重的作用,全球贸易中约 90% 的贸易由海运业承载,作业效率对于港口至关重要。在“工业 4.0”、“互联网 +”大发展的时代背景下,港口也在进行数字化、全自动的转型升级。随着全球 5G 技术浪潮的到来,华为…

用国内版Devin:DevOpsGPT开发一个简易官网

前言: 世界上第一个AI程序员Devin想必已经给大家带来了不小的震撼,这种L4级的技术也许已经昭示着AGI离我们或许真的不远了。 这里先给大家普及一个概念: L4是谷歌对AGI划分的第四个等级,把代码丢给 AI 改这个是 L1 或者 L2 级别的…

【精品PPT】智慧路灯大数据平台整体建设实施方案(免费下载)

1、知识星球下载: 如需下载完整PPTX可编辑源文件,请前往星球获取:https://t.zsxq.com/19QeHVt8y 2、免费领取步骤: 【1】关注公众号 方案驿站 【2】私信发送 【智慧路灯大数据平台】 【3】获取本方案PDF下载链接,直…

实战项目——智慧社区(三)之 门禁管理

1、人脸识别 实现思路 ①查询出所有的小区信息,下拉列表显示,用于后续判断人脸信息是否与所选小区匹配 ②人脸识别:调用腾讯人脸识别的API接口,首先判断传入图片是否为一张人脸;其次将这张人脸去服务器的人员库进行…

【简单讲解下WebView的使用与后退键处理】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共…

PDF文件内容可以转成word版本吗?答案是肯定的 PDF转word的方法

一,PDF转Word的必要性 随着信息技术的飞速发展,文档的格式和转换成为了我们日常生活和工作中不可避免的一部分。其中,PDF转Word的需求尤为突出。PDF作为一种跨平台的文档格式,具有阅读效果好、不易被篡改等优点,但在编…

基于Springcloud可视化项目:智慧工地可视化大数据云平台源码

目录 技术架构 智慧工地系统在实际推行过程中遇到的问题 智慧工地接纳程度较低 基础设施条件有待完善 智慧工地整体生态尚未完善 智慧工地平台各功能模块 施工过程工信程息信管息理管模理块 人员管理模块 生产管理模块 技术管理模块 质量管理模块 安全管理模块 绿…

【病毒分析】DevicData勒索病毒分析

1.背景 1.1来源 近期,Solar团队收到某医疗单位的援助请求,该公司的计算机受到了某勒索病毒的侵害,所有的文件被加密并且添加了.DevicData-P-470b1abd后缀,我司人员现场取证进行排查并提取加密器,本文是对于加密器的分析。 2.恶…

1.Godot引擎|场景|节点|GDS|介绍

Godot介绍 Godot是一款游戏引擎 可以通过在steam商城免费下载 初学者和编程基础稍差的推荐学习使用GDScript,和python有些相似 Godot节点 Godot的开发思想——围绕节点 节点的特征与优势 最常用基本的开发组件大部分都具有具体的功能,如图片&#xf…

ubuntu 应用程序设置 开机自启动

1. 通过.desktop方式 autostart 中.desktop 配置文件 1.1 用户级自启动 登录后才可以启动服务。 可视化配置:在ubuntu自带的可视化程序来配置,就是StartupApplications,它在启动台中可以找到。 在ubuntu下目录是 ~/.config/autostart 添…

大数据架构的演变与多种大数据架构类型说明——解读大数据架构(一)

文章目录 前言数据架构的演变关系型数仓数据湖现代数仓数据网络数据湖仓数据网格 前言 在搭建和使用大数据组件前,预先投入时间设计和构建正确的数据架构绝对至关重要。如果在前期没有设计正确的数据架构就开始实施方案,在后期想更改架构设计是十分困难…

12-pyspark的RDD算子注意事项总结

目录 相近算子异同总结相近变换算子异同foreach和foreachPartitionfold和reducecoalesce和repatition 相近动作算子异同cache和persist 算子注意事项需要注意的变换算子需要注意的动作算子 PySpark实战笔记系列第三篇 10-用PySpark建立第一个Spark RDD(PySpark实战笔记系列第…

Android性能优化RecyclerView预加载LayoutManager的getExtraLayoutSpace,Kotlin

Android性能优化RecyclerView预加载LayoutManager的getExtraLayoutSpace,Kotlin RecyclerView默认只加载当前屏幕肉眼可见区域的有限item数量,有些场景下,需要在屏幕外不可见的区域多加载一批item出来,这有时候被称之为“预加载”…

2024考研调剂须知

----------------------------------------------------------------------------------------------------- 考研复试科研背景提升班 教你快速深入了解掌握考研复试面试中的常见问题以及注意事项,系统的教你如何在短期内快速提升自己的专业知识水平和编程以及英语…

前端服务请求跨域被拦截,Java后端Springboot服务解决办法

跨域问题 跨域前端遇到的问题: Access to XMLHttpRequest at ‘http://www.xxx.xxxx/api/x/d/xc’ from origin ‘http://127.0.0.1:3000’ has been blocked by cors policy: No ‘Access-Contorl-Allow-Origin’ header is present on the requested resource. …

IDE Eval Reset —— idea 重置试用期插件安装

idea 重置试用期插件安装 一、在线安装: 1、打开IntelliJ IDEA 2、file—> setting —> plugins 添加三方插件库 点击后,跳出弹框点击号,添加图中的网址 https://plugins.zhile.io3、搜索 IDE Eval Reset ,安装插件 4…

Excel·VBA二维数组S形排列

与之前的文章《ExcelVBA螺旋数组函数》将一维数组转为二维螺旋数组 本文将数组转为S形排列的二维数组,类似考场座位S形顺序 Function S形排列(ByVal arr, ByVal num_rows&, ByVal num_cols&, Optional ByVal mode$ "row")将数组arr转为num_rows…