SQL编译优化原理

最近在团队的OLAP引擎上做了一些SQL编译优化的工作,整理到了语雀上,也顺便发在博客上了。SQL编译优化理论并不复杂,只需要掌握一些关系代数的基础就比较好理解;比较困难的在于reorder算法部分。

文章目录

  • 基础概念
    • 关系代数等价
  • join等价规则
    • 基数
    • join算法的成本
    • 查询问题的分类
    • 连接树的可能数量(搜索空间)
    • 查询图、join树和问题复杂度
  • Calcite概念
  • cascade/volcano
  • Calcite volcano递归优化器实现
  • Join reorder
    • 基于连接次序优化的动态规划算法
    • IKKBZ算法
    • bushy-tree
    • ASI
    • 归一化
  • Calcite实践
    • MultiJoinOptimizeBushyRule
  • Join 算法选择
  • 关联子查询优化
    • 为什么要消除关联子查询?
    • 基本消除规则
    • project和filter去关联化
    • Aggregate的去关联化
    • 集合运算的去关联化

基础概念

关系代数等价

参考《数据库系统概念》第七版
下面是第六版
在这里插入图片描述
在这里插入图片描述
注意自然连接和θ连接的交换律不能用于外连接

join等价规则

https://www.comp.nus.edu.sg/~chancy/sigmod18-reorder.pdf
在这里插入图片描述

在这里插入图片描述

基数

基数(cardinality)表示不同值的数量
在这里插入图片描述

join算法的成本

从上到下依次为嵌套循环连接、hash连接、排序合并连接
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

ASI(相邻序列交换)

查询问题的分类

按照查询图:chain、cycle、star、clique
按照查询树结构:left-deep、zig-zag、bushy tree
按照join结构:有没有cross product
按照成本函数:有没有ASI属性

连接树的可能数量(搜索空间)

在这里插入图片描述

查询图、join树和问题复杂度

在这里插入图片描述
在这里插入图片描述

Calcite概念

RelNode:plan/subplan
relset:关系表达式等价的plan集合
relsubset :关系表达式和物理属性等价的plan集合
transformationRule:logical plan变化的规则集合
converterplan:将lp转化为pp的转化规则
RelOptRule :优化规则
RelOptNode 接口, 它代表的是能被 planner 操作的 expression node
statement:语句
reltrait 关系表达式特征
RelTraitDef 用于定义一类 RelTrait
RelTrait RelTrait是一个表示查询计划特征的抽象类。它用于描述查询计划的一些特性,是对应 TraitDef 的具体实例
Convention 是一种 RelTrait 用于表示 Rel 的调用约定(calling convention)
rexnode 行表达式
schema:逻辑模型
Program:一个SQL查询解析和优化的过程集合,可以将多个子过程组合在一起,以便进行SQL查询的解析和优化

cascade/volcano

volcano是top-down的模块化可剪枝sql优化模型。
volcano生成两个代数模型:logical and the physical algebras 分别优化lp和pp(pp主要选择执行算法)
一个volcano优化器必须提供如下部分:
(1) a set of logical operators,
(2) algebraic transformation rules, possibly with condition code,
(3) a set of algorithms and enforcers,
(4) implementation rules, possibly with condition code,
(5) an ADT “cost” with functions for basic arithmetic and comparison,
(6) an ADT “logical properties,”
(7) an ADT “physical property vector” including comparisons functions (equality and cover),
(8) an applicability function for each algorithm and enforcer,
(9) a cost function for each algorithm and enforcer,
(10) a property function for each operator, algorithm, and enf
volcano使用backward chaining的方式,只探索实际参与更大表达式的子查询和计划。这种方法可以避免对无关的子查询和计划进行搜索,从而提高查询优化的效率。

Calcite volcano递归优化器实现

RuleQueue 是一个优先队列,包含当前所有可行的 RuleMatch,findBestExpr() 时每次循环中我们从中取出优先级最高的并 apply,再根据 apply 的结果更新队列……如此往复,直到满足终止条件。
RuleQueue并没有使用大顶堆,仅仅保存了importance最大的节点。
我们想象我们现在有一组relnode,匹配上了很多RuleMatch,怎么决定先进行哪个match呢?
RuleMatch的importance决定了先进行哪个match,rulematch的importance定义为以下两个中较大的一个:

  1. 输入的 RelSubset 的 importance
  2. 输出的 RelSubset 的 importance
    RelSubset的importance又该如何定义?importance 定义为以下两个中比较大的一个:
    ● 该 RelSubset 本身的真实 importance
    ● 逻辑上相等的(即位于同一个 RelSet 中)任意一个 RelSubset 的真实 importance 除以 2
    真实importance的计算规则如下:
    在这里插入图片描述
    在这里插入图片描述

Join reorder

大部分的算法基于connectivity-heuristic,也就是说,只考虑equl-join

基于连接次序优化的动态规划算法

对于假设所有的连接都是自然连接的n个关系的集合,动态规划算法的复杂度为3^n
归并连接可以产生有序的结果,对于后面的排序可能有用(interesting sort order)。
目前我们用spark的连接算法,这条暂时没用。

IKKBZ算法

left-deep tree和bushy tree
left-deep tree 左深树
连接运算符的右侧输入都是具体关系,右子树必和左子树的节点之一有共享谓词。

左深树适合一般场景的优化。System R优化器只考虑左深树的优化,时间代价是n!,加入动态规划后,可以在n*2^n时间内找到最佳连接次序。

bushy-tree

适合多路连接和并行优化,但是很复杂。
不引入交叉乘的充要条件在于给定关系的父级必须已经得到。

ASI

简单来说就是等价谓词替换原则
定义rank函数:
在这里插入图片描述

成本函数
谓词的选择性指的是谓词对查询结果的过滤能力
对于join来说可以有如下定义:
在这里插入图片描述
在这里插入图片描述

我们将查询图视为一个有根树,我们说H的选择性指的是F和H之间的选择性。
行数和选择性之间则有如下关系(行数*选择性):
在这里插入图片描述
在这里插入图片描述

成本函数定义如下:
在这里插入图片描述

我们可以根据成本函数定义rank函数:
在这里插入图片描述

下面是对于ASI的证明:
在这里插入图片描述
在这里插入图片描述

归一化

在这里插入图片描述

Calcite实践

MultiJoinOptimizeBushyRule

第一部分进行初始化,unusedEdges存放join过滤条件(两个relnode之间)

final MultiJoin multiJoinRel = call.rel(0);final RexBuilder rexBuilder = multiJoinRel.getCluster().getRexBuilder();final RelBuilder relBuilder = call.builder();final RelMetadataQuery mq = call.getMetadataQuery();final LoptMultiJoin multiJoin = new LoptMultiJoin(multiJoinRel);final List<Vertex> vertexes = new ArrayList<>();int x = 0;for (int i = 0; i < multiJoin.getNumJoinFactors(); i++) {final RelNode rel = multiJoin.getJoinFactor(i);double cost = mq.getRowCount(rel);vertexes.add(new LeafVertex(i, rel, cost, x));x += rel.getRowType().getFieldCount();}assert x == multiJoin.getNumTotalFields();final List<Edge> unusedEdges = new ArrayList<>();for (RexNode node : multiJoin.getJoinFilters()) {unusedEdges.add(multiJoin.createEdge(node));}

第二步选出成本(此处就是行数)差异最大的过滤条件
选一个行数较小的vertex作为majorFactor,另一个作为minorFactor

    // Comparator that chooses the best edge. A "good edge" is one that has// a large difference in the number of rows on LHS and RHS.final Comparator<LoptMultiJoin.Edge> edgeComparator =new Comparator<LoptMultiJoin.Edge>() {@Override public int compare(LoptMultiJoin.Edge e0, LoptMultiJoin.Edge e1) {return Double.compare(rowCountDiff(e0), rowCountDiff(e1));}private double rowCountDiff(LoptMultiJoin.Edge edge) {assert edge.factors.cardinality() == 2 : edge.factors;final int factor0 = edge.factors.nextSetBit(0);final int factor1 = edge.factors.nextSetBit(factor0 + 1);return Math.abs(vertexes.get(factor0).cost- vertexes.get(factor1).cost);}};final List<Edge> usedEdges = new ArrayList<>();for (;;) {final int edgeOrdinal = chooseBestEdge(unusedEdges, edgeComparator);if (pw != null) {trace(vertexes, unusedEdges, usedEdges, edgeOrdinal, pw);}final int[] factors;if (edgeOrdinal == -1) {// No more edges. Are there any un-joined vertexes?final Vertex lastVertex = Util.last(vertexes);final int z = lastVertex.factors.previousClearBit(lastVertex.id - 1);if (z < 0) {break;}factors = new int[] {z, lastVertex.id};} else {final LoptMultiJoin.Edge bestEdge = unusedEdges.get(edgeOrdinal);// For now, assume that the edge is between precisely two factors.// 1-factor conditions have probably been pushed down,// and 3-or-more-factor conditions are advanced. (TODO:)// Therefore, for now, the factors that are merged are exactly the// factors on this edge.assert bestEdge.factors.cardinality() == 2;factors = bestEdge.factors.toArray();}// Determine which factor is to be on the LHS of the join.final int majorFactor;final int minorFactor;if (vertexes.get(factors[0]).cost <= vertexes.get(factors[1]).cost) {majorFactor = factors[0];minorFactor = factors[1];} else {majorFactor = factors[1];minorFactor = factors[0];}final Vertex majorVertex = vertexes.get(majorFactor);final Vertex minorVertex = vertexes.get(minorFactor);

遍历unusedEdges,加入newFactors,对之前选出的majorVertex和minorVertex进行归一化并且加入vertexes

      // Find the join conditions. All conditions whose factors are now all in// the join can now be used.final int v = vertexes.size();final ImmutableBitSet newFactors =majorVertex.factors.rebuild().addAll(minorVertex.factors).set(v).build();final List<RexNode> conditions = new ArrayList<>();final Iterator<LoptMultiJoin.Edge> edgeIterator = unusedEdges.iterator();while (edgeIterator.hasNext()) {LoptMultiJoin.Edge edge = edgeIterator.next();if (newFactors.contains(edge.factors)) {conditions.add(edge.condition);edgeIterator.remove();usedEdges.add(edge);}}double cost =majorVertex.cost* minorVertex.cost* RelMdUtil.guessSelectivity(RexUtil.composeConjunction(rexBuilder, conditions));final Vertex newVertex =new JoinVertex(v, majorFactor, minorFactor, newFactors,cost, ImmutableList.copyOf(conditions));vertexes.add(newVertex);

归一化之后进行选择性的重新计算,之后进入下一轮

// Re-compute selectivity of edges above the one just chosen.// Suppose that we just chose the edge between "product" (10k rows) and// "product_class" (10 rows).// Both of those vertices are now replaced by a new vertex "P-PC".// This vertex has fewer rows (1k rows) -- a fact that is critical to// decisions made later. (Hence "greedy" algorithm not "simple".)// The adjacent edges are modified.final ImmutableBitSet merged =ImmutableBitSet.of(minorFactor, majorFactor);for (int i = 0; i < unusedEdges.size(); i++) {final LoptMultiJoin.Edge edge = unusedEdges.get(i);if (edge.factors.intersects(merged)) {ImmutableBitSet newEdgeFactors =edge.factors.rebuild().removeAll(newFactors).set(v).build();assert newEdgeFactors.cardinality() == 2;final LoptMultiJoin.Edge newEdge =new LoptMultiJoin.Edge(edge.condition, newEdgeFactors,edge.columns);unusedEdges.set(i, newEdge);}}

最后一段,根据新的vertexes次序建立relnode节点

// We have a winner!
List<Pair<RelNode, TargetMapping>> relNodes = new ArrayList<>();
for (Vertex vertex : vertexes) {if (vertex instanceof LeafVertex) {LeafVertex leafVertex = (LeafVertex) vertex;final Mappings.TargetMapping mapping =Mappings.offsetSource(Mappings.createIdentity(leafVertex.rel.getRowType().getFieldCount()),leafVertex.fieldOffset,multiJoin.getNumTotalFields());relNodes.add(Pair.of(leafVertex.rel, mapping));} else {JoinVertex joinVertex = (JoinVertex) vertex;final Pair<RelNode, Mappings.TargetMapping> leftPair =relNodes.get(joinVertex.leftFactor);RelNode left = leftPair.left;final Mappings.TargetMapping leftMapping = leftPair.right;final Pair<RelNode, Mappings.TargetMapping> rightPair =relNodes.get(joinVertex.rightFactor);RelNode right = rightPair.left;final Mappings.TargetMapping rightMapping = rightPair.right;final Mappings.TargetMapping mapping =Mappings.merge(leftMapping,Mappings.offsetTarget(rightMapping,left.getRowType().getFieldCount()));if (pw != null) {pw.println("left: " + leftMapping);pw.println("right: " + rightMapping);pw.println("combined: " + mapping);pw.println();}final RexVisitor<RexNode> shuttle =new RexPermuteInputsShuttle(mapping, left, right);final RexNode condition =RexUtil.composeConjunction(rexBuilder, joinVertex.conditions);final RelNode join = relBuilder.push(left).push(right).join(JoinRelType.INNER, condition.accept(shuttle)).build();relNodes.add(Pair.of(join, mapping));}if (pw != null) {pw.println(Util.last(relNodes));}

Join 算法选择

关联子查询优化

我们将连接外部查询和子查询的算子叫做CorrelatedJoin(也被称之为lateral join, dependent join、apply算子等等。它的左子树我们称之为外部查询(input),右子树称之为子查询(subquery)。
在这里插入图片描述
在这里插入图片描述

注:bag语义,允许元素重复出现,和set语义正交

为什么要消除关联子查询?

在这里插入图片描述

CorrelatedJoin这个算子打破了以往对逻辑树自上而下的执行模式。普通的逻辑树都是从叶子节点往根结点执行的,但是CorreltedJoin的右子树会被带入左子树的行的值反复的执行。

基本消除规则

如果 Apply 的右边不包含来自左边的参数(或者只包含filter参数),那它就和直接 Join 是等价的
在这里插入图片描述
在这里插入图片描述

project和filter去关联化

尽可能把 Apply 往下推、把 Apply 下面的算子向上提。
在这里插入图片描述
在这里插入图片描述

Aggregate的去关联化

在这里插入图片描述

SELECT c_custkey
FROM CUSTOMER
WHERE 1000000 < (SELECT SUM(o_totalprice)FROM ORDERSWHERE o_custkey = c_custkey
)
// 等价于
select sum(p_price) > 1000000 from CUSTOMER.o_custkey left join ORDERS.c_custkey 
on CUSTOMER.o_custkey = ORDERS.c_custkey group by ORDERS.c_custkey

在这里插入图片描述

集合运算的去关联化

在这里插入图片描述
在这里插入图片描述

这一组规则很少能派上用场。在 TPC-H 的 Schema 下甚至很难写出一个带有 Union All 的、有意义的子查询。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/14441.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

k8s webhook实例,java springboot程序实现 对Pod创建请求添加边车容器 ,模拟istio实现日志文件清理

k8s webhook实例&#xff0c;java springboot程序实现 对Pod创建请求添加边车容器 &#xff0c;模拟istio实现日志文件清理 大纲 背景与原理实现流程开发部署my-docker-demo-sp-user服务模拟业务项目开发部署my-sidecar服务模拟边车程序开发部署服务my-docker-demo-k8s-opera…

零拷贝原来这么简单!

我们总会在各种地方看到零拷贝&#xff0c;那零拷贝到底是个什么东西。 接下来&#xff0c;让我们来理一理啊。 拷贝说的是计算机里的 I/O 操作&#xff0c;也就是数据的读写操作。计算机可是一个复杂的家伙&#xff0c;包括软件和硬件两大部分&#xff0c;软件主要指操作系统…

uniapp h5 竖向的swiper内嵌视频实现抖音短视频垂直切换,丝滑切换视频效果,无限数据加载不卡顿

一、项目背景&#xff1a;实现仿抖音短视频全屏视频播放、点赞、评论、上下切换视频、视频播放暂停、分页加载、上拉加载下一页、下拉加载上一页等功能。。。 二、前言&#xff1a;博主一开始一直想实现类似抖音进入页面自动播放当前视频&#xff0c;上下滑动切换之后播放当前…

Mac plist文件

macOS、iOS、iPadOS的应用程序都可能会有plist配置文件&#xff0c;他是苹果系列操作系统特有的配置文件。 plist的本质是个xml格式的文本文件&#xff0c;英文全称是property list&#xff0c;文件后缀使用.plist。 对于普通用户来说&#xff0c;基本不用管plist文件是什么&…

excel要如何自动累加某个单元格上方的所有单元格?

输入公式 SUM(INDIRECT("A1:A"&ROW()-1)) 运行实例如下图 注意图中b4&#xff0c;和b5单元格都输入相同的公式。 此方法可以避免写vba&#xff0c;以前此类问题的解决都是通过vba代码进行处理 对函数进行解析 主要使用了 INDIRECT() 2、公式说明&#xff1a;…

Linux-grep

grep 简介 grep &#xff08;global search regular expression_r(RE) and print out the line,全面搜索正则表达式并把行打印出来&#xff09;是一种强大的文本搜索工具&#xff0c;它能使用 正则表达式搜索文本&#xff0c;并把匹配的行打印出来。Unix的grep家族包括grep、e…

Leetcode | Binary search | 22. 74. 162. 33. 34. 153.

22. Generate Parentheses 要意识到只要还有左括号&#xff0c;就可以放到path里。只要右括号数量小于左括号&#xff0c;也可以放进去。就是valid的组合。recurse两次 74. Search a 2D Matrix 看成sorted list就好。直接用m*n表示最后一位的index&#xff0c;并且每次只需要 …

打印Winform控件实现简陋版的分页打印(C#)

本文的代码可以从这里获取&#xff1a;winformDemo.rar 张祥裕/分享的资源名称 - Gitee.com 作者的水平有限&#xff0c;如有错误&#xff0c;望指正。 为了简单起见&#xff0c;纸张大小&#xff0c;打印机等信息按照默认的来&#xff0c;本文的实现方案是&#xff1a;打印Pa…

C语言:反转一个单链表

Lei宝啊&#xff1a;个人主页 题目&#xff1a; 描述&#xff1a; 给你单链表的头节点 head &#xff0c;请你反转链表&#xff0c;并返回反转后的链表。 接口&#xff1a; struct ListNode* reverseList(struct ListNode* head){} 示例&#xff1a; 输入&#xff1a; head [1…

“深入解析SpringBoot:从入门到精通“

标题&#xff1a;Spring Boot&#xff1a;从入门到精通 摘要&#xff1a;本文将深入解析Spring Boot框架&#xff0c;从入门到精通&#xff0c;带你了解Spring Boot的基本概念、核心特性和使用方法&#xff0c;并提供示例代码帮助你快速上手。 正文&#xff1a; 一、什么是S…

全局ip代理安全吗? 手机设置全局代理方法详解

全局IP代理并不一定是安全的&#xff0c;因为全局IP代理会将所有网络流量都通过代理服务器进行转发&#xff0c;包括敏感信息和隐私数据。如果代理服务器受到黑客攻击或存在安全漏洞&#xff0c;可能会导致数据泄露和其他安全问题。因此&#xff0c;在使用全局IP代理时&#xf…

Spring Boot项目的创建

hi 大家好,又见面了,今天继续讲解Spring Boot 文章目录 &#x1f436;1.什么是Spring Boot?&#x1f436;2.Spring Boot的优势&#x1f436;3.Spring Boot项目创建&#x1f33c;3.1使用ieda创建&#x1f95d;3.1.1下载插件Spring Boot Helper&#x1f95d;3.1.2创建项目 &…

VS创建wsdl服务提供给java调用

文章目录 前言1.c#创建asp.net web服务1.1 创建ASP.NET Web应用程序1.2 添加服务类1.3 定义服务方法1.3 浏览服务1.4 发布服务1.5 IIS部署服务 2.Java中调用服务2.1 用动态客户端工厂类调用2.1.1 引入依赖2.1.2 调用测试代码2.1.3 测试结果 2.2 创建代理类进行调用2.2.1 使用ws…

vue3 如何获取env

标题import.meta.env是一个全局属性&#xff0c;它包含了许多有用的环境信息&#xff0c;比如MODE、BASE_URL等。你可以在任何Vue组件、模块或文件中使用它来获取这些环境变量。 console.log(import.meta.env.MODE); // 获取当前模式&#xff0c;比如 development 或 producti…

解决Oracle锁表问题

问题描述&#xff1a; 数据表不能修改或删除数据&#xff0c;如果操作则会卡住&#xff0c;这可能是锁表了。 解决步骤&#xff1a; &#xff08;1&#xff09;查看哪个表被锁 select b.owner,b.object_name,a.session_id,a.locked_mode from v$locked_object a,dba_object…

修改整数(有点坑,所以发出来了)

问题描述 小贝给了小聪一个正整数 x&#xff0c;但是小聪决定把这个数改掉。她可以把整数 x 每个位置上的数 t 改成 9-t。 请你帮助小聪来计算一下&#xff0c;如何把 x 改成一个最小的正整数&#xff0c;注意&#xff0c;不能出现首位为 0 的情况。 输入格式 输入一个正整数…

云原生环境下的安全风险与安全架构设计

随着云计算和容器技术的发展&#xff0c;云原生应用已经成为企业和开发者的新选择。然而&#xff0c;云原生环境也给企业带来了一系列安全挑战。本文将分析云原生环境下的安全风险&#xff0c;并提出相应的安全架构设计策略。 一、云原生环境下的安全风险 云原生环境具有动态性…

git:按照标签查询提交记录log日志

git log 可以查询提交历史&#xff0c;增加一些参数就可以对提交记录log日志进行过滤 # 查询标签v1.0.0之前提交的历史记录 git log v1.0.0 --prettyformat:"%s"# 查询标签v1.0.0之后提交的历史记录 git log v1.0.0.. --prettyformat:"%s"--prettyformat:…

ChatGLM-6B 部署与 P-Tuning 微调实战-使用Pycharm实战

国产大模型ChatGLM-6B微调部署入门-使用Pycharm实战 1.ChatGLM模型介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型&#xff0c;基于 General Language Model (GLM) 架构&#xff0c;具有 62 亿参数。结合模型量化技术&#xff0c;用户可以在消费级的显卡上进行本…

《吐血整理》进阶系列教程-拿捏Fiddler抓包教程(14)-Fiddler断点(breakpoints)实战,篡改或伪造数据

1.简介 上一篇主要就讲解和分享Fiddler断点的理论和操作&#xff0c;今天宏哥就用具体例子&#xff0c;将上一篇中的理论知识实践一下。而且在实际测试过程中&#xff0c;有时候需要修改请求或响应数据&#xff0c;或者直接模拟服务器响应&#xff0c;此时可以使用fiddler进行…