MySQL 8.0 Server层最新架构详解

简介: 本文基于MySQL 8.0.25源码进行分析和总结。这里MySQL Server层指的是MySQL的优化器、执行器部分。我们对MySQL的理解还建立在5.6和5.7版本的理解之上,更多的是对比PostgreSQL或者传统数据库。然而从MySQL 8.0开始,持续每三个月的迭代和重构工作,使得MySQL Server层的整体架构有了质的飞越。下面来看下MySQL最新的架构。

image.png

作者 | 道客
来源 | 阿里技术公众号

一 背景和架构

本文基于MySQL 8.0.25源码进行分析和总结。这里MySQL Server层指的是MySQL的优化器、执行器部分。我们对MySQL的理解还建立在5.6和5.7版本的理解之上,更多的是对比PostgreSQL或者传统数据库。然而从MySQL 8.0开始,持续每三个月的迭代和重构工作,使得MySQL Server层的整体架构有了质的飞越。下面来看下MySQL最新的架构。

image.png

我们可以看到最新的MySQL的分层架构和其他数据库并没有太大的区别,另外值得一提的是从图中可以看出MySQL现在更多的加强InnoDB、NDB集群和RAPID(HeatWave clusters)内存集群架构的演进。下面我们就看下具体细节,我们这次不随着官方的Feature实现和重构顺序进行理解,本文更偏向于从优化器、执行器的流程角度来演进。

二 MySQL 解析器Parser

首先从Parser开始,官方MySQL 8.0使用Bison进行了重写,生成Parser Tree,同时Parser Tree会contextualize生成MySQL抽象语法树(Abstract Syntax Tree)。

image.png

MySQL抽象语法树和其他数据库有些不同,是由比较让人拗口的SELECT_LEX_UNIT/SELECT_LEX类交替构成的,然而这两个结构在最新的版本中已经重命名成标准的SELECT_LEX -> Query_block和SELECT_LEX_UNIT -> Query_expression。Query_block是代表查询块,而Query_expression是包含多个查询块的查询表达式,包括UNION AND/OR的查询块(如SELECT FROM t1 union SELECT FROM t2)或者有多Level的ORDER BY/LIMIT (如SELECT * FROM t1 ORDER BY a LIMIT 10) ORDER BY b LIMIT 5。

例如,来看一个复杂的嵌套查询:

 (SELECT *FROM ttt1)
UNION ALL(SELECT *FROM(SELECT *FROM ttt2) AS a,(SELECT *FROM ttt3UNION ALL SELECT *FROM ttt4) AS b)

在MySQL中就可以用下面方式表达:

image.png

经过解析和转换后的语法树仍然建立在Query_block和Query_expression的框架下,只不过有些LEVEL的query block被消除或者合并了,这里不再详细展开。

三 MySQL prepare/rewrite阶段

接下来我们要经过resolve和transformation过程Query_expression::prepare->Query_block::prepare,这个过程包括(按功能分而非完全按照执行顺序):

1 Setup and Fix

  • setup_tables:Set up table leaves in the query block based on list of tables.
  • resolve_placeholder_tables/merge_derived/setup_table_function/setup_materialized_derived:Resolve derived table, view or table function references in query block.
  • setup_natural_join_row_types:Compute and store the row types of the top-most NATURAL/USING joins.
  • setup_wild:Expand all '*' in list of expressions with the matching column references.
  • setup_base_ref_items:Set query_block's base_ref_items.
  • setup_fields:Check that all given fields exists and fill struct with current data.
  • setup_conds:Resolve WHERE condition and join conditions.
  • setup_group:Resolve and set up the GROUP BY list.
  • m_having_cond->fix_fields:Setup the HAVING clause.
  • resolve_rollup:Resolve items in SELECT list and ORDER BY list for rollup processing.
  • resolve_rollup_item:Resolve an item (and its tree) for rollup processing by replacing items matching grouped expressions with Item_rollup_group_items and updating properties (m_nullable, PROP_ROLLUP_FIELD). Also check any GROUPING function for incorrect column.
  • setup_order:Set up the ORDER BY clause.
  • resolve_limits:Resolve OFFSET and LIMIT clauses.
  • Window::setup_windows1:Set up windows after setup_order() and before setup_order_final().
  • setup_order_final:Do final setup of ORDER BY clause, after the query block is fully resolved.
  • setup_ftfuncs:Setup full-text functions after resolving HAVING.
  • resolve_rollup_wfs : Replace group by field references inside window functions with references in the presence of ROLLUP.

2 Transformation

  • remove_redundant_subquery_clause : Permanently remove redundant parts from the query if 1) This is a subquery 2) Not normalizing a view. Removal should take place when a query involving a view is optimized, not when the view is created.
  • remove_base_options:Remove SELECT_DISTINCT options from a query block if can skip distinct.
  • resolve_subquery : Resolve predicate involving subquery, perform early unconditional subquery transformations.

    • Convert subquery predicate into semi-join, or
    • Mark the subquery for execution using materialization, or
    • Perform IN->EXISTS transformation, or
    • Perform more/less ALL/ANY -> MIN/MAX rewrite
    • Substitute trivial scalar-context subquery with its value
  • transform_scalar_subqueries_to_join_with_derived:Transform eligible scalar subqueries to derived tables.
  • flatten_subqueries:Convert semi-join subquery predicates into semi-join join nests. Convert candidate subquery predicates into semi-join join nests. This transformation is performed once in query lifetime and is irreversible.
  • apply_local_transforms :

    • delete_unused_merged_columns : If query block contains one or more merged derived tables/views, walk through lists of columns in select lists and remove unused columns.
    • simplify_joins:Convert all outer joins to inner joins if possible
    • prune_partitions:Perform partition pruning for a given table and condition.
  • push_conditions_to_derived_tables:Pushing conditions down to derived tables must be done after validity checks of grouped queries done by apply_local_transforms();
  • Window::eliminate_unused_objects:Eliminate unused window definitions, redundant sorts etc.

这里,节省篇幅,我们只举例关注下和top_join_list相关的simple_joins这个函数的作用,对于Query_block中嵌套join的简化过程。

image.png

3 对比PostgreSQL

为了更清晰的理解标准数据库的做法,我们这里引用了PostgreSQL的这三个过程:

Parser

下图首先Parser把SQL语句生成parse tree。

testdb=# SELECT id, data FROM tbl_a WHERE id < 300 ORDER BY data;

image.png

Analyzer/Analyser

下图展示了PostgreSQL的analyzer/analyser如何将parse tree通过语义分析后生成query tree。

image.png

Rewriter

Rewriter会根据规则系统中的规则把query tree进行转换改写。

sampledb=# CREATE VIEW employees_list 
sampledb-#      AS SELECT e.id, e.name, d.name AS department 
sampledb-#            FROM employees AS e, departments AS d WHERE e.department_id = d.id;

下图的例子就是一个包含view的query tree如何展开成新的query tree。

sampledb=# SELECT * FROM employees_list;

image.png

四 MySQL Optimize和Planning阶段

接下来我们进入了逻辑计划生成物理计划的过程,本文还是注重于结构的解析,而不去介绍生成的细节,MySQL过去在8.0.22之前,主要依赖的结构就是JOIN和QEP_TAB。JOIN是与之对应的每个Query_block,而QEP_TAB对应的每个Query_block涉及到的具体“表”的顺序、方法和执行计划。然而在8.0.22之后,新的基于Hypergraph的优化器算法成功的抛弃了QEP_TAB结构来表达左深树的执行计划,而直接使用HyperNode/HyperEdge的图来表示执行计划。

image.png

举例可以看到数据结构表达的left deep tree和超图结构表达的bushy tree对应的不同计划展现:

| -> Inner hash join (no condition)  (cost=1.40 rows=1)-> Table scan on R4  (cost=0.35 rows=1)-> Hash-> Inner hash join (no condition)  (cost=1.05 rows=1)-> Table scan on R3  (cost=0.35 rows=1)-> Hash-> Inner hash join (no condition)  (cost=0.70 rows=1)-> Table scan on R2  (cost=0.35 rows=1)-> Hash-> Table scan on R1  (cost=0.35 rows=1)| -> Nested loop inner join  (cost=0.55..0.55 rows=0)-> Nested loop inner join  (cost=0.50..0.50 rows=0)-> Table scan on R4  (cost=0.25..0.25 rows=1)-> Filter: (R4.c1 = R3.c1)  (cost=0.35..0.35 rows=0)-> Table scan on R3  (cost=0.25..0.25 rows=1)-> Nested loop inner join  (cost=0.50..0.50 rows=0)-> Table scan on R2  (cost=0.25..0.25 rows=1)-> Filter: (R2.c1 = R1.c1)  (cost=0.35..0.35 rows=0)-> Table scan on R1  (cost=0.25..0.25 rows=1)

MySQL8.0.2x为了更好的兼容两种优化器,引入了新的类AccessPath,可以认为这是MySQL为了解耦执行器和不同优化器抽象出来的Plan Tree。

image.png

1 老优化器的入口

老优化器仍然走JOIN::optimize来把query block转换成query execution plan (QEP)。

这个阶段仍然做一些逻辑的重写工作,这个阶段的转换可以理解为基于cost-based优化前做准备,详细步骤如下:

  • Logical transformations

    • optimize_derived : Optimize the query expression representing a derived table/view.
    • optimize_cond : Equality/constant propagation.
    • prune_table_partitions : Partition pruning.
    • optimize_aggregated_query : COUNT(*), MIN(), MAX() constant substitution in case of implicit grouping.
    • substitute_gc : ORDER BY optimization, substitute all expressions in the WHERE condition and ORDER/GROUP lists that match generated columns (GC) expressions with GC fields, if any.
  • Perform cost-based optimization of table order and access path selection.

    • JOIN::make_join_plan() : Set up join order and initial access paths.
  • Post-join order optimization

    • substitute_for_best_equal_field : Create optimal table conditions from the where clause and the join conditions.
    • make_join_query_block : Inject outer-join guarding conditions.
    • Adjust data access methods after determining table condition (several times).
    • optimize_distinct_group_order : Optimize ORDER BY/DISTINCT.
    • optimize_fts_query : Perform FULLTEXT search before all regular searches.
    • remove_eq_conds : Removes const and eq items. Returns the new item, or nullptr if no condition.
    • replace_index_subquery/create_access_paths_for_index_subquery : See if this subquery can be evaluated with subselect_indexsubquery_engine.
    • setup_join_buffering : Check whether join cache could be used.
  • Code generation

    • alloc_qep(tables) : Create QEP_TAB array.
    • test_skip_sort : Try to optimize away sorting/distinct.
    • make_join_readinfo : Plan refinement stage: do various setup things for the executor.
    • make_tmp_tables_info : Setup temporary table usage for grouping and/or sorting.
    • push_to_engines : Push (parts of) the query execution down to the storage engines if they can provide faster execution of the query, or part of it.
    • create_access_paths : generated ACCESS_PATH.

2 新优化器的入口

新优化器默认不打开,必须通过set optimizer_switch="hypergraph_optimizer=on"; 来打开。主要通过FindBestQueryPlan函数来实现,逻辑如下:

  • 先判断是否属于新优化器可以支持的Query语法(CheckSupportedQuery),不支持的直接返回错误ER_HYPERGRAPH_NOT_SUPPORTED_YET。
  • 转化top_join_list变成JoinHypergraph结构。由于Hypergraph是比较独立的算法层面的实现,JoinHypergraph结构用来更好的把数据库的结构包装到Hypergraph的edges和nodes的概念上的。
  • 通过EnumerateAllConnectedPartitions实现论文中的DPhyp算法。
  • CostingReceiver类包含了过去JOIN planning的主要逻辑,包括根据cost选择相应的访问路径,根据DPhyp生成的子计划进行评估,保留cost最小的子计划。
  • 得到root_path后,接下来处理group/agg/having/sort/limit的。对于Group by操作,目前Hypergraph使用sorting first + streaming aggregation的方式。

举例看下Plan(AccessPath)和SQL的关系:

image.png

最后生成Iterator执行器框架需要的Iterator执行载体,AccessPath和Iterator是一对一的关系(Access paths are a query planning structure that correspond 1:1 to iterators)。


Query_expression::m_root_iterator = CreateIteratorFromAccessPath(......)unique_ptr_destroy_only<RowIterator> CreateIteratorFromAccessPath(THD *thd, AccessPath *path, JOIN *join, bool eligible_for_batch_mode) {
......switch (path->type) {case AccessPath::TABLE_SCAN: {const auto &param = path->table_scan();iterator = NewIterator<TableScanIterator>(thd, param.table, path->num_output_rows, examined_rows);break;}case AccessPath::INDEX_SCAN: {const auto &param = path->index_scan();if (param.reverse) {iterator = NewIterator<IndexScanIterator<true>>(thd, param.table, param.idx, param.use_order, path->num_output_rows,examined_rows);} else {iterator = NewIterator<IndexScanIterator<false>>(thd, param.table, param.idx, param.use_order, path->num_output_rows,examined_rows);}break;}case AccessPath::REF: {
......
}

3 对比PostgreSQL

testdb=# EXPLAIN SELECT * FROM tbl_a WHERE id < 300 ORDER BY data;QUERY PLAN                           
---------------------------------------------------------------Sort  (cost=182.34..183.09 rows=300 width=8)Sort Key: data->  Seq Scan on tbl_a  (cost=0.00..170.00 rows=300 width=8)Filter: (id < 300)
(4 rows)

image.png

五 总结

本文主要focus在MySQL最新版本官方的源码上,重点分析了官方的重构在多阶段和各阶段结构上的变化和联系,更多的是为了让大家了解一个全新的MySQL的发展。

原文链接

本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/512838.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

产品解读 | 敏捷版数据库场景 一站式快速构建企业全场景数据库管理平台

简介&#xff1a; Gartner 的报告显示预计到2022年将有75%数据库将采用云数据库&#xff0c;与此同时&#xff0c;IDC预计到2024年传统部署数据库市场将达到13亿美元&#xff0c;企业数字化转型升级&#xff0c;积极拥抱开源、云原生数据库成为重要趋势&#xff0c;也是必然选择…

核弹级漏洞,把 log4j 扒给你看!

作者 | 轩辕之风O来源 | 编程技术宇宙相信大家这两天应该被这么一条新闻刷屏了&#xff1a;这个漏洞到底是怎么回事&#xff1f;核弹级&#xff0c;真的有那么厉害吗&#xff1f;怎么利用这个漏洞呢&#xff1f;我看了很多技术分析文章&#xff0c;都太过专业&#xff0c;很多非…

外部工具连接SaaS模式云数据仓库MaxCompute实战——商业BI分析工具篇

简介&#xff1a; MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库&#xff0c;以 Serverless 架构提供快速、全托管的在线数据仓库服务&#xff0c;消除了传统数据平台在资源扩展性和弹性方面的限制&#xff0c;最小化用户运维投入&#xff0c;帮助企业和大数据开发者经济…

挑战程序设计竞赛_我系首次参加第六届中国大学生程序设计竞赛网络预选赛

点击上方蓝字关注 「龙外信息工程系」讲述有温度的故事 传递有态度的思想2020年9月20日12时至17时&#xff0c;第六届中国大学生程序设计竞赛网络赛预选赛在杭州电子科技大学OJ成功举办&#xff0c;黑龙江外国语学院(信息工程系)参赛队与来自清华大学、上海交通大学、复旦大…

如何用阿里云实行全链路数据追踪

简介&#xff1a; 阿里云采用了日志服务&#xff0c;帮助畅捷通构建了用户体验感知、业务安全合规、用户业务链路追踪、成本预算的使用场景&#xff0c;实现了对用户、业务、成本、安全等方面的全维度感知&#xff0c;使得运维效率提升了30%。 在日常生活中&#xff0c;遇到电…

谷歌能否赶上「元宇宙」这趟快车?

整理 | 禾木木出品 | CSDN云计算&#xff08;ID&#xff1a;CSDNcloud&#xff09;大多数人认为 Google Glass 只是领先于时代。虽然 Glass 不再出售给日常消费者&#xff08;它仍然存在于企业版本中&#xff09;&#xff0c;但它在很多方面都是公众对混合现实体验的首次介绍。…

Flink on Zeppelin 流计算处理最佳实践

简介&#xff1a; 欢迎钉钉扫描文章底部二维码进入 EMR Studio 用户交流群 直接和讲师交流讨论~ 点击以下链接直接观看直播回放&#xff1a;https://developer.aliyun.com/live/247106 开源大数据社区 & 阿里云 EMR 系列直播 第十二期 主题&#xff1a;Flink on Zeppelin…

储留香:一个智能运维系统就是一个中枢神经系统,我说的!

简介&#xff1a; 运维系统可以像神经系统一样&#xff0c;首先&#xff0c;做到数据的统一汇总&#xff1b;其次&#xff0c;可以对数据进行识别筛选输出有效信息&#xff1b;再次&#xff0c;可以预先感知到异常风险&#xff0c;并进行有效规避。而日志服务SLS凭借出色的数据…

云上资源编排的思与悟

简介&#xff1a; 在传统软件架构下&#xff0c;撇开业务层代码&#xff0c;都需要部署计算节点、存储资源、网络资源&#xff0c;然后安装、配置操作系统等。而云服务本质上是实现 IT 架构软件化和 IT 平台智能化&#xff0c;通过软件的形式定义这些硬件资源&#xff0c;充分抽…

阿里云力夺FewCLUE榜首!知识融入预训练+小样本学习的实战解析

简介&#xff1a; 7月8日&#xff0c;中文语言理解权威评测基准CLUE公开了中文小样本学习评测榜单最新结果&#xff0c;阿里云计算平台PAI团队携手达摩院智能对话与服务技术团队&#xff0c;在大模型和无参数限制模型双赛道总成绩第一名&#xff0c;决赛答辩总成绩第一名。 作…

【产品干货】经典营销模型的产品化介绍

简介&#xff1a; 为什么说Quick Audience是集数据资产构建、用户分析、精准营销投放、跨端社交互动和全域会员管理为一体的全域消费者运营平台&#xff0c;其中一个很大的原因是置入了经典营销模型&#xff0c;如RFM模型与AIPL模型&#xff0c;由方法论支撑消费者运营&#xf…

填平数据、产品、模式需求鸿沟,浪潮云发布新一代行业云 MEP战略

围绕安全这一核心&#xff0c;浪潮云从新模式&#xff08;New Model&#xff09;、新要素&#xff08;New Essential Factor&#xff09;、新产品&#xff08;New Product&#xff09;三大方面出发&#xff0c;提出新一代行业云MEP战略。 出品 | CSDN云计算 12月16日&#xff0…

hpsocket java代码_HPSocket介绍与使用

一、HPSocket介绍HP-Socket是一套通用的高性能TCP/UDP/HTTP 通信框架&#xff0c;包含服务端组件、客户端组件和Agent组件&#xff0c;广泛适用于各种不同应用场景的TCP/UDP/HTTP通信系统&#xff0c;提供C/C、C#、Delphi、E(易语言)、Java、Python等编程语言接口。HP-Socket对…

Dapr 在阿里云原生的实践

简介&#xff1a; Faas 场景下&#xff0c;比较吸引用户的是成本和研发效率&#xff0c;成本主要通过按需分配和极致的弹性效率来达成。而应用开发者期望通过 FaaS 提供多语言的编程环境&#xff0c;提升研发效率&#xff0c;包括启动时间、发布时间、开发的效率。​ 作者&…

postgre 生成数据库html文档_还在手动整理数据库文档?试试这个(螺丝钉)数据库文档生成工具...

简介在企业级开发中、我们经常会有编写数据库表结构文档的时间付出&#xff0c;从业以来&#xff0c;待过几家企业&#xff0c;关于数据库表结构文档状态&#xff1a;要么没有、要么有、但都是手写、后期运维开发&#xff0c;需要手动进行维护到文档中&#xff0c;很是繁琐、如…

OpenFaaS - 以自己的方式运行容器化函数

作者 | Addo Zhang来源 | 云原生指北译者注&#xff1a; 本文篇幅较长&#xff0c;有助于了解 FaaS 和 OpenFaaS。作者分别从开发人员和运维人员的视角来了解 OpenFaaS&#xff0c;对了解新的技术是个很好的方式。本文翻译自 Ivan Velichko[1] 的 OpenFaaS - Run Containerized…

技术人生第5篇——浅谈如何成为技术一号位?

简介&#xff1a; 认清每个人自己在日常工作中的思维定式非常重要&#xff0c;有助于转变自己对很多事情的认知&#xff0c;而这种转变也会从根本上带来行为上的变化。也就是说&#xff0c;可以通过理论分析和实践&#xff0c;来共同完成对个人实际生活的影响。今天这篇文章&am…

元宇宙真的是「割韭菜」吗?

作者 | 小枣君来源 | 鲜枣课堂我们究竟该如何看待元宇宙&#xff1f;元宇宙为什么会火&#xff1f;它到底有没有价值&#xff1f;它真的是“割韭菜”吗&#xff1f;今天这篇文章&#xff0c;小枣君想说说自己的看法。█ 元宇宙为什么会火&#xff1f;元宇宙的蹿红速度&#xff…

阿里仿真灰度变更测试简介

简介&#xff1a; 基础网络产品的生命周期大致包含研发、架构、交付、优化和运营等几个环节&#xff0c;每一个环节的质量保证都涉及重要的一环&#xff0c;即预期验证测试。本文将重点讲解一下如何在仿真测试平台进行灰度变更测试&#xff0c;从而保证变更的稳定性。 作者 | 聪…

树莓派开始玩转linux pdf_用树莓派构建 Kubernetes 集群 | Linux 中国

将 Kubernetes 安装在多个树莓派上&#xff0c;实现自己的“家庭私有云”容器服务。• 来源&#xff1a;linux.cn • 作者&#xff1a;Chris Collins • 译者&#xff1a;Xingyu.Wang •(本文字数&#xff1a;14330&#xff0c;阅读时长大约&#xff1a;18 分钟)将 Kubernetes …