MySQL中order by是怎么工作的?

图片

在如上图中所示的explain的执行结果中,Extra字段中的“Using filesort”表示的就是需要排序,MySQL会给每个线程分配一块内存用于排序,称为sort_buffer。

图片

索引city如上图所示

上述语句的执行流程如下:

1、初始化sort_buffer,放入name  city  age这三个字段;

2、从索引city中找到第一个满足city='杭州'的主键id,也就是上图中的ID_X;

3、到主键id索引取出整行,取name  city  age三个字段的值,放入sort_buffer中;

4、从索引city取下一个记录的主键id;

5、重复步骤3、4直到city值不满足查询条件为止,即上图中的ID_Y;

6、对sort_buffer中的数据按照字段name做快速排序;

7、按照排序结果取前1000行返回给客户端;

上述过程可称之为“全字段排序”

“按name排序”这个动作,可能在内存中完成,也可能需要使用外部排序,这取决于排序所需的内存和参数sort_buffer_size。sort_buffer_size是MySQL为排序开辟的内存(sort_buffer)的大小。如果要排序的数据量小于sort_buffer_size,排序在内存中完成,否则,内存放不下,不得不利用磁盘临时文件辅助排序,称为外部排序,外部排序一般使用归并排序算法。

rowid排序

max_length_for_sort_data参数,是MySQL中专门控制用于排序的行数据长度的一个参数,含意是:如果需要取出来的单行数据的长度超过这个值,MySQL就认为单行太大,要换一个算法。假设city  name  age三个字段的定义总长度是36,把max_length_for_sort_data设置为16,则执行过程变为:

1、初始化sort_buffer,确定放入两个字段,即name和id;

2、从索引city找到第一个满足city='杭州’条件的主键id,也就是图中的ID_X;

3、到主键id索引取出整行,取name、id这两个字段,存入sort_buffer中;

4、从索引city取下一个记录的主键id;

5、重复步骤3、4直到不满足city='杭州’条件为止,也就是图中的ID_Y;

6、对sort_buffer中的数据按照字段name进行排序;

7、遍历排序结果,取前1000行,并按照id的值回到原表中取出city、name和age三个字段返回给客户端。

上述流程称之为rowid排序。

全字段排序 VS rowid排序:

综上可得出MySQL的一个设计思想:如果内存足够,就多利用内存,采取全字段排序,尽量减少磁盘访问。

其实,并不是所有的order by语句,都需要排序操作的。比如,如果创建一个city和name的联合索引。

alter table t add index city_user(city, name);

则执行流程变为:

1、从索引(city,name)找到第一个满足city='杭州’条件的主键id;

2、到主键id索引取出整行,取name、city、age三个字段的值,作为结果集的一部分直接返回;

3、从索引(city,name)取下一个记录主键id;

4、重复步骤2、3,直到查到第1000条记录,或者是不满足city='杭州’条件时循环结束。

图片

可以看到Extra字段中没有Using filesort了,也就是不需要排序了。

更进一步优化,还可以采用覆盖索引,即索引上的信息足够满足查询请求,不需要再回到主键索引上去取数据。

alter table t add index city_user_age(city, name, age);

则执行流程变为:

1、从索引(city,name,age)找到第一个满足city='杭州’条件的记录,取出其中的city、name和age这三个字段的值,作为结果集的一部分直接返回;

2、从索引(city,name,age)取下一个记录,同样取出这三个字段的值,作为结果集的一部分直接返回;

3、重复执行步骤2,直到查到第1000条记录,或者是不满足city='杭州’条件时循环结束。

图片

可以看到,Extra里面多了“Using index”,表示的就是使用了覆盖索引,性能上会快很多。

正文止。

感兴趣的朋友,欢迎关注我的公众号哈,公众号上已经集成了AI大模型,大家可以过来聊天、问问题了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/614302.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

每天刷两道题——第十二天+第十三天

1.1合并区间 以数组 i n t e r v a l s intervals intervals 表示若干个区间的集合,其中单个区间为 i n t e r v a l s [ i ] [ s t a r t i , e n d i ] intervals[i] [starti, endi] intervals[i][starti,endi] 。请你合并所有重叠的区间,并返回 …

C语言实现简易n子棋小游戏(代码含注解)

利用C语言简单实现一个n子棋小游戏,棋盘大小由自己定义 将源文件分为 执行游戏的测试文件(test.c)和保存游戏运行逻辑的相关函数的文件(game.c) 头文件中声明符号和函数的定义(game.h) 游戏执行主要依靠二维数组实现,电脑走棋采用随机值的方法简易地…

XGBoost(eXtreme Gradient Boosting)

什么是机器学习 XGBoost(eXtreme Gradient Boosting)是一种梯度提升树算法,它在梯度提升框架的基础上引入了一些创新性的特性,以提高模型性能和训练速度。XGBoost在解决结构化数据的分类和回归问题上表现出色,成为许多…

【OpenCV学习笔记05】- 鼠标作为画笔

这是对于 OpenCV 官方文档的 GUI 功能的学习笔记。学习笔记中会记录官方给出的例子,也会给出自己根据官方的例子完成的更改代码,同样彩蛋的实现也会结合多个知识点一起实现一些小功能,来帮助我们对学会的知识点进行结合应用。 如果有喜欢我笔…

leetcode-相同的树

100. 相同的树 使用递归的方法 # Definition for a binary tree node. # class TreeNode: # def __init__(self, val0, leftNone, rightNone): # self.val val # self.left left # self.right right class Solution:def isSameTree(self, p: …

QTAV的编译、使用及遇到的问题

最近有个功能需求,界面可以直播显示某个特定摄像头的实时画面,通过对Qt本身的 QMiediaPlayer,和其他一些在网上找到的组件做了一些对比,最终选择了QtAv作为我们的组件使用。 QtAV 是一个基于 Qt 和 FFmpeg 的跨平台、高性能多媒体播放框架。…

CSAPP - string_length反汇编

虽然先前已经把 phase_1 和 phase_2 做出来了, 但其实是参考了网络上的答案, 仅仅是大概知道了关键汇编代码。但其实并没有真的懂。为啥呢?因为很多模棱两可的地方是靠猜测的,而猜测是脆弱的。 重新看 phase_1, 第一个…

用win系统搭建Minecraft世界服务器,MC开服教程,小白开服教程

雨云VPS用Windows系统搭建我的世界世界服务器,Minecraft开服教程,小白开服教程,MC 1.19.4版本服务器搭建教程。 此教程使用 Mohist 1.19.4 服务端,此服务端支持Forge模组和Bukkit/Spigot/Paper插件,如果需要开其他服务…

Linux 开启Swap交换内存

Linux 开启Swap交换内存 Linux 开启Swap交换内存 Linux 开启Swap交换内存 由于阿里云服务器内存空间有点小,但是又不能加内存,则想到使用Swap交换空间,用硬盘空间充当内存使用。 开启步骤,以4G为例: 1.创建交换文件…

K8S---kubectl top

一、简介 该命令类似于linux–top命令,用于显示node和pod的CPU和内存使用情况 二、命令行 /opt/kubernetes/bin/kubectl --kubeconfig /opt/kubernetes/conf/default-admin.kubeconfig top pod --help /opt/kubernetes/bin/kubectl --kubeconfig /opt/kube…

MySQL-索引回顾

索引是面试高频问答题,参考百度/CSDN/尚硅谷/黑马程序员/阿里云开发者社区,决定将索引知识回顾一下,忘记时,点开即可,时刻保持更新,事不宜迟,即刻享用。 索引概述 索引(index&#…

transbigdata笔记:数据预处理

0 数据 使用 transbigdata/docs/source/gallery/data/TaxiData-Sample.csv at main ni1o1/transbigdata (github.com) 和transbigdata/docs/source/gallery/data/sz.json at main ni1o1/transbigdata (github.com) 0.1 导入库 import transbigdata as tbd import pandas …

VTK开发调试环境下载(VTK开发环境一步到位直接开发,无需自己配置编译 VS2017+Qt5.12.10+VTK)

一、无与伦比的优势 直接下载代码就可以调试的VTK代码仓库。 二、资源制作原理 这个资源根据VTK源码 编译出动态库文件 pdb lib dll 文件( x64 debug ) 并将这两者同时放在一个代码仓库里,下载就能用。 三、使用方法(vtk-so…

【Java代码审计】硬编码密码篇

【Java代码审计】硬编码密码篇 1.硬编码2.案例3.修复方案 1.硬编码 硬编码密码是指在系统中采用明文的形式存储密码,通常会导致严重的身份验证失败,这对于系统管理员而言可能很难检测到,一旦检测到,也很难修复。硬编码密码会造成…

使用rembg库提取图像前景(移除图像背景),并构建web应用

1、图像中的前景与背景 在深度学习图像处理领域中,图像内容可以被定义为前景与背景两部分,其中感兴趣图形的被定义为前景,不感兴趣区域的背景。如在目标检测中,被框出来的目标则被定义为前景。此外,前景识别也可以理解…

网络安全B模块(笔记详解)- nmap扫描渗透测试

nmap扫描渗透测试 1.通过BT5对服务器场景Linux进行TCP同步扫描 (使用工具Nmap,使用参数n,使用必须要使用的参数),并将该操作使用命令中必须要使用的参数作为Flag提交; Flag:sS 2.通过BT5对服务器场景Linux进行TCP同步扫描 (使用工具Nmap,使用参数n,使用必须要使用的参数…

oracle19c容器数据库data dump 数据泵传输数据(1)--pdb导pdb

目录 1.在pdb1创建实验环境 2.创建目标数据库pdb2 3.开始从pdb1全库导出 4.开始导入到pdb2 5. 解决报错:添加在pdb2添加users表空间 我們要記住一点:如果是全库导出导入的话,目标数据库没有的表空间我们要事先创建:不然就会导…

网工内推 | 高级网工,H3C认证优先,朝九晚六,周末双休

01 万德 招聘岗位:高级网络工程师 职责描述: 1、项目交付:项目管理和交付,包括项目前期的规划、实施以及后期的运维支持、项目验收等。 2、技术支持:为客户及合作伙伴提供网上问题远程和现场支持;对公司内…

移动通信系统关键技术多址接入MIMO学习(8)

1.Multiple-antenna Techniques多天线技术MIMO,从SISO到SIMO到MISO到如今的MIMO; 2.SIMO单发多收,分为选择合并、增益合并;SIMO,基站通过两路路径将信号发送到终端,因为终端接收到的两路信号都是来自同一天…

旋转的表示

欢迎访问我的博客首页。 旋转的表示 1.旋转轴的性质2.罗德里格斯公式3.右雅可比矩阵 三维空间内的旋转可以由三维旋转向量 n θ \bm n \theta nθ 表示。其中,单位向量 n \bm n n 表示旋转轴, θ \theta θ 表示旋转角度。旋转向量由一个轴和一个角表示…