MySQL为什么使用B+树来作索引

我来详细解释一下B+树的结构和特点。

graph TDA[根节点 40|70] --> B[20|30]A --> C[50|60]A --> D[80|90]B --> E[10|15]B --> F[25|28]B --> G[35|38]C --> H[45|48]C --> I[55|58]C --> J[65|68]D --> K[75|78]D --> L[85|88]D --> M[95|98]%% 叶子节点之间的链接E --> |链表连接| FF --> |链表连接| GG --> |链表连接| HH --> |链表连接| II --> |链表连接| JJ --> |链表连接| KK --> |链表连接| LL --> |链表连接| M

在这里插入图片描述
在这里插入图片描述

B+树的核心特征:

  1. 结构特点
  • 所有数据都存储在叶子节点上
  • 非叶子节点只存储索引键值,不存储实际数据
  • 所有叶子节点通过指针相连,形成有序链表
  • 每个节点可以存储多个键值
  1. 查询操作优势
  • 等值查询:通过索引键快速定位到叶子节点
  • 范围查询:利用叶子节点间的链表结构,只需遍历相关叶子节点
  • 稳定的查询性能:因为所有数据都在叶子节点,查询路径长度相同
  1. 为什么适合做数据库索引
  • 减少磁盘I/O:非叶子节点只存储索引,可以容纳更多索引项,降低树的高度
  • 支持区间查询:叶子节点相连的特性使得范围查询非常高效
  • 利用磁盘预读特性:节点大小通常等于磁盘页大小,一次I/O可以读取完整节点
  1. 与B树的主要区别
  • 数据存储:B+树只在叶子节点存储数据,B树在所有节点都可能存储数据
  • 索引结构:B+树的非叶子节点只存储索引,更节省空间
  • 查询稳定性:B+树的查询路径长度始终相同,B树可能提前终止
  • 范围查询:B+树的叶子节点相连,范围查询更高效
  1. 维护特性
  • 自平衡:在插入和删除操作时自动维护平衡
  • 分裂合并:节点满时自动分裂,过少时自动合并
  • 索引冗余:非叶子节点的索引项在叶子节点中都会重复出现

实际应用案例:

  1. 当执行类似 SELECT * FROM users WHERE age BETWEEN 20 AND 30 的范围查询时,B+树可以:

    • 快速定位到age=20的位置
    • 通过叶子节点链表顺序扫描到age=30
    • 高效获取这个范围内的所有数据
  2. 当执行 SELECT * FROM users WHERE id = 100 的等值查询时:

    • 从根节点开始,通过索引键逐层向下查找
    • 最终在叶子节点定位到具体数据
    • 整个过程的I/O次数等于树的高度

这就是为什么MySQL选择B+树作为默认索引结构的原因:它在查询效率、范围搜索和磁盘I/O优化等方面都表现出色,特别适合数据库这种需要同时处理单点查询和范围查询的场景。

我来用可视化详细展示B+树的结构。

<svg viewBox="0 0 800 400" xmlns="http://www.w3.org/2000/svg"><!-- 根节点 --><rect x="350" y="20" width="100" height="40" fill="#FFB6C1" rx="5"/><text x="400" y="45" text-anchor="middle" fill="black">50</text><!-- 第二层节点 --><rect x="200" y="120" width="140" height="40" fill="#ADD8E6" rx="5"/><text x="270" y="145" text-anchor="middle" fill="black">20 | 35</text><rect x="460" y="120" width="140" height="40" fill="#ADD8E6" rx="5"/><text x="530" y="145" text-anchor="middle" fill="black">70 | 85</text><!-- 连接线 --><line x1="400" y1="60" x2="270" y2="120" stroke="black" stroke-width="2"/><line x1="400" y1="60" x2="530" y2="120" stroke="black" stroke-width="2"/><!-- 叶子节点 --><rect x="50" y="220" width="120" height="40" fill="#98FB98" rx="5"/><text x="110" y="245" text-anchor="middle" fill="black">10 | 15</text><rect x="190" y="220" width="120" height="40" fill="#98FB98" rx="5"/><text x="250" y="245" text-anchor="middle" fill="black">20 | 30</text><rect x="330" y="220" width="120" height="40" fill="#98FB98" rx="5"/><text x="390" y="245" text-anchor="middle" fill="black">35 | 45</text><rect x="470" y="220" width="120" height="40" fill="#98FB98" rx="5"/><text x="530" y="245" text-anchor="middle" fill="black">70 | 75</text><rect x="610" y="220" width="120" height="40" fill="#98FB98" rx="5"/><text x="670" y="245" text-anchor="middle" fill="black">85 | 90</text><!-- 连接线到叶子节点 --><line x1="270" y1="160" x2="110" y2="220" stroke="black" stroke-width="2"/><line x1="270" y1="160" x2="250" y2="220" stroke="black" stroke-width="2"/><line x1="270" y1="160" x2="390" y2="220" stroke="black" stroke-width="2"/><line x1="530" y1="160" x2="530" y2="220" stroke="black" stroke-width="2"/><line x1="530" y1="160" x2="670" y2="220" stroke="black" stroke-width="2"/><!-- 叶子节点之间的链表连接 --><path d="M170 240 L190 240" stroke="blue" stroke-width="2" marker-end="url(#arrow)"/><path d="M310 240 L330 240" stroke="blue" stroke-width="2" marker-end="url(#arrow)"/><path d="M450 240 L470 240" stroke="blue" stroke-width="2" marker-end="url(#arrow)"/><path d="M590 240 L610 240" stroke="blue" stroke-width="2" marker-end="url(#arrow)"/><!-- 箭头定义 --><defs><marker id="arrow" markerWidth="10" markerHeight="10" refX="9" refY="3" orient="auto" markerUnits="strokeWidth"><path d="M0,0 L0,6 L9,3 z" fill="blue"/></marker></defs><!-- 图例 --><rect x="50" y="320" width="20" height="20" fill="#FFB6C1"/><text x="80" y="335" fill="black">根节点</text><rect x="150" y="320" width="20" height="20" fill="#ADD8E6"/><text x="180" y="335" fill="black">索引节点</text><rect x="250" y="320" width="20" height="20" fill="#98FB98"/><text x="280" y="335" fill="black">叶子节点(数据节点)</text><line x1="350" y1="330" x2="400" y2="330" stroke="blue" stroke-width="2" marker-end="url(#arrow)"/><text x="430" y="335" fill="black">叶子节点链表</text>
</svg>让我解释这个B+树的关键特征:1. 层级结构:
- 顶层粉色节点是根节点
- 中间蓝色节点是索引节点
- 底层绿色节点是叶子节点,存储实际数据2. 节点特点:
- 每个非叶子节点可以包含多个键值
- 键值用于指引查找方向
- 叶子节点存储实际数据记录3. 特殊设计:
- 所有叶子节点通过蓝色箭头连接,形成有序链表
- 这种设计特别有利于范围查询
- 非叶子节点只存储索引信息,不存储实际数据4. 数据查找示例:
- 要查找值为75的记录:1. 从根节点50开始2. 75>50,所以往右走到70|853. 70<75<85,定位到对应叶子节点70|755. 范围查询示例:
- 要查找20到45之间的所有记录:1. 先找到20所在的叶子节点2. 通过蓝色箭头顺序遍历到453. 期间经过的所有节点就是要查询的范围这种结构设计使得B+树特别适合数据库索引:
- 层级结构减少磁盘I/O次数
- 叶子节点链表支持高效的范围查询
- 所有数据都在叶子节点,查询路径稳定

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/62704.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python 下载 b站视频 和音频

video_bvid&#xff1a; import os import requests import json import re from bs4 import BeautifulSoup import subprocess # from detail_video import video_bvid# video_bvid 是一个从外部得到的单个视频ID video_bvid BV1cx421Q7veclass BilibiliVideoAudio:def __in…

以太网链路详情

文章目录 1、交换机1、常见的概念1、冲突域2、广播域3、以太网卡1、以太网卡帧 4、mac地址1、mac地址表示2、mac地址分类3、mac地址转换为二进制 2、交换机的工作原理1、mac地址表2、交换机三种数据帧处理行为3、为什么会泛洪4、转发5、丢弃 3、mac表怎么获得4、同网段数据通信…

Shell编程 脚本的运行方式与注释

目录 shell脚本的运行方式 1. 路径运行 2.bash或sh加脚本运行 ​编辑 3.source在加脚本路径运行 shell脚本注释 单行注释 多行注释 shell脚本的运行方式 我们在/usr/etc/demo01目录下新建了一个脚本 a.sh &#xff0c;脚本内容是要求输出数字1&#xff0c;怎么运行呢 1…

智算网络中Scale-out和Scale-up网络的技术原理

智算网络中Scale-out网络和Scale-up网络的本质区别是什么&#xff1f; 一、什么是智算中心的Scale-out网络和Scale-up网络 数据中心网络总体上可分为两大类&#xff1a;通算网络和智算网络。通算网络主要用于支持传统的计算任务和应用&#xff0c;如企业的IT系统、网站托管、电…

HCIA笔记7--OSPF协议入门

文章目录 0. 路由分类1. OSPF介绍1.1 概念1.2 报文类型 2. 邻接关系的建立2.1 邻居关系的建立2.2 邻接关系的形成2.3 ospf状态机 3. DR与BDR3.1 为什么要有DR和BDR&#xff1f;3.2 DR和BDR的选举原则 4. ospf的配置4.1 内部优先级 5. 问题5.1 三层环路如何解决&#xff1f; Ref…

mysql排序问题

mysql 建数据库时&#xff0c;需要指定 字符集 和 排序规则 建表时&#xff0c;也可以指定 也可以指定具体的字段 安照下面的sql顺序执行插入&#xff0c;它们的排序是什么样的&#xff1f; INSERT into test_sort (uid,create_time) VALUE (d,now()) INSERT into test_sort (u…

vulhub复现CVE-2021-44228log4j漏洞

目录 一&#xff1a;漏洞概述 二&#xff1a;漏洞原理 三&#xff1a;漏洞利用 lookup功能&#xff1a; JNDI解析器&#xff1a; ldap服务&#xff1a; RMI&#xff1a; 四&#xff1a;漏洞复现 4.1靶场 4.2dnslog测试 4.3部署jndi-injection-exploit 4.4打开监听端口 4.5触发请…

ip地址获取失败啥意思?ip地址获取失败怎么回事

在日常的网络使用中&#xff0c;我们时常依赖于稳定的IP地址来确保数据的顺畅传输和设备的正常识别。然而&#xff0c;有时我们会遇到“IP地址获取失败”的困扰&#xff0c;这不仅阻碍了我们的网络访问&#xff0c;还可能带来一系列的网络连接问题。那么&#xff0c;IP地址获取…

OpenGL ES详解——多个纹理实现混叠显示

目录 一、获取图片纹理数据 二、着色器编写 1. 顶点着色器 2. 片元着色器 三、绑定和绘制纹理 1. 绑定纹理 2. 绘制纹理 四、源码下载 一、获取图片纹理数据 获取图片纹理数据代码如下&#xff1a; //获取图片1纹理数据 mTextureId loadTexture(mContext, R.mipmap.…

十一、容器化 vs 虚拟化-Docker

文章目录 前言一、Docker 介绍1. 简介2. 应用场景3. 特点4. Docker和虚拟机之间的区别5. 解决痛点1. 解决依赖兼容2. 解决操作系统环境差异3. 小结 二、Docker 架构三、工作流程五、Docker 核心组件及其工作机制1. Docker 客户端&#xff08;Docker Client&#xff09;2. Docke…

linux学习笔记01 基础命令

目录 创建 touch 创建文件 &#xff08;创建但是不打开&#xff09; vi / vim 创建文件 (创建一个文件并打开) mkdir 创建文件夹 切换目录 cd 查看 pwd 查看当前目录完整路径 ls 查看目录信息 dir 查看目录信息 ll 表示查看目标目录下的信息 ls -a 查看当前目录下的…

【深度学习】深刻理解多模态模型CLIP

CLIP&#xff08;Contrastive Language-Image Pretraining&#xff09; 是由 OpenAI 提出的一个多模态模型&#xff0c;旨在学习视觉和语言的联合表示&#xff0c;能够通过图像和文本之间的对比学习来实现图像和文本之间的紧密联系。CLIP 模型可以通过自然语言描述理解和处理图…

mysql时间戳格式化yyyy-mm-dd

格式化到 年月日 # 将时间换成列名就行&#xff1b;当前是秒级时间戳&#xff0c;如果是毫秒的 / 1000即可 # SELECT FROM_UNIXTIME(1602668106666.777888999 / 1000,%Y-%m-%d) AS a; # SELECT FROM_UNIXTIME(列名 / 1000,%Y-%m-%d) AS a; SELECT FROM_UNIXTIME(1602668106.666…

PDFMathTranslate,PDF多语言翻译,批量处理,学术论文,双语对照(WIN/MAC)

分享一个非常实用的PDF文档翻译项目——PDFMathTranslate。作为一个经常逛GitHub的开发者&#xff0c;我总喜欢翻看各种项目附带的论文&#xff0c;虽然大多时候是瞎研究&#xff0c;但却乐在其中。该项目能够完美保留公式、图表、目录和注释&#xff0c;对于需要阅读外文文献的…

爬虫基础之代理的基本原理

在做爬虫的过程中经常会遇到一种情况&#xff0c;就是爬虫最初是正常运行、正常抓取数据的&#xff0c;一切看起来都是那么美好&#xff0c;然而一杯茶的工夫就出现了错误&#xff0c;例如 403 Forbidden&#xff0c;这时打开网页一看&#xff0c;可能会看到“您的IP访问频率太…

鲲鹏麒麟安装Kafka-v1.1.1

因项目需要在鲲鹏麒麟服务器上安装Kafka v1.1.1&#xff0c;因此这里将安装配置过程记录下来。 环境说明 # 查看系统相关详细信息 [roottest kafka_2.12-1.1.1]# uname -a Linux test.novalocal 4.19.148 #1 SMP Mon Oct 5 22:04:46 EDT 2020 aarch64 aarch64 aarch64 GNU/Li…

群控系统服务端开发模式-应用开发-登录退出发送邮件

一、登录成功发送邮件 在根目录下app文件夹下controller文件夹下common文件夹下&#xff0c;修改Login.php&#xff0c;代码如下 <?php /*** 登录退出操作* User: 龙哥三年风水* Date: 2024/10/29* Time: 15:53*/ namespace app\controller\common; use app\controller\Em…

[游戏开发] Unity中使用FlatBuffer

什么是FlatBuffer 官网&#xff1a; GitHub - google/flatbuffers: FlatBuffers: Memory Efficient Serialization LibraryFlatBuffers: Memory Efficient Serialization Library - google/flatbuffershttps://github.com/google/flatbuffers 为什么用FloatBuffer&#xff0c…

MySQL其一,概念学习,可视化软件安装以及增删改查语句

目录 MySQL 1、数据库的概念 2、数据库分类 3、MySQL的安装 4、安装过程中的问题 DataGrip的使用&#xff1a; SQLynx的使用&#xff1a; 5、编写SQL语句 6、DDL语句 7、DML 新增数据&#xff1a; 删除数据&#xff1a; 修改数据&#xff1a; MySQL SQL其实是一门…

05 在 Linux 使用 AXI DMA

DMA简介 DMA 是一种采用硬件实现存储器与存储器之间或存储器与外设之间直接进行高速数据传输的技术&#xff0c;传输过程无需 CPU 参与&#xff08;但是CPU需要提前配置传输规则&#xff09;&#xff0c;可以大大减轻 CPU 的负担。 DMA 存储传输的过程如下&#xff1a; CPU 向…