mysql的B+树索引结构介绍

一、B+树

  特性:

  • 所有的叶子结点中包含了全部关键字的信息,非叶子节点只存储键值信息,及指向含有这些关键字记录的指针,且叶子结点本身依关键字的大小自小而大的顺序链接,所有的非终端结点可以看成是索引部分,结点中仅含有其子树根结点中最大(或最小)关键字。 
  • 所有叶子节点之间都有一个链指针。
  • 数据记录都存放在叶子节点中。
  • 树的高度相对较低,IO次数相对较少。

树高度的影响:

  1. 树的深度与I/O次数的关系: 在B+树中,每次从根节点到叶子节点的查找都需要进行一次I/O操作。如果树的高度增加,意味着需要进行更多的I/O操作才能访问到数据。因此,树的高度越低,访问数据所需的I/O次数越少。

  2. 节点存储容量: B+树的节点可以存储更多的键值,这意味着每个节点可以包含更多的数据,从而减少了树的深度。例如,如果一个节点可以存储1000个键值,而B树的节点只能存储100个键值,那么B+树的高度将是B树的十分之一左右。

        由于B+Tree的非叶子节点只存储键值信息,假设每个磁盘块能存储3个键值及指针信息,则变成B+Tree后其结构如下图所示:

可能上面例子中只有22条数据记录,看不出B+Tree的优点,下面做一个推算:

I        InnoDB存储引擎中页的大小为16KB,一般表的主键类型为INT(占用4个字节)或BIGINT(占用8个字节),指针类型也一般为4或8个字节,也就是说一个页(B+Tree中的一个节点)中大概存储16KB/(8B+8B)=1K个键值(因为是估值,为方便计算,这里的K取值为1000。也就是说一个深度为3的B+Tree索引可以维护1000 * 1000 * 50(最后一层每个磁盘块存多少数据节点,假设是50个) = 5千万条记录。深度一般是三到四层。

        实际情况中每个节点可能不能填充满,因此在数据库中,B+Tree的高度一般都在2-4层。mysql的InnoDB存储引擎在设计时是将根节点常驻内存的,也就是说查找某一键值的行记录时最多只需要1~3次磁盘I/O操作。

二、B树

        

        B-树允许每个内部节点有多个子节点,这通常被称为树的“度”或“阶”。这意味着B-树的每个节点可以有多条路径到达子节点。

        B-树和B+树都是自平衡的多路搜索树,它们在很多方面有相似之处,但也有一些关键的结构差异。以下是B-树和B+树的主要结构对比:

  1. 数据存储位置

    • B-树:数据记录既可以存储在内部节点,也可以存储在叶子节点。
    • B+树:数据记录仅存储在叶子节点,内部节点仅存储键值和子节点的引用。
  2. 节点键值数量

    • B-树:每个节点的键值数量可以是其子节点数减一或加一。
    • B+树:每个内部节点的键值数量是其子节点数减一,而叶子节点的键值数量是其子节点数。
  3. 叶子节点的连接方式

    • B-树:叶子节点之间没有直接的链接。
    • B+树:所有叶子节点通过指针相互连接,形成一个有序的链表,便于顺序访问和范围查询。
  4. 树的高度

    • 由于B+树的内部节点可以存储更多的键值,B+树通常比相同条件下的B-树具有更少的高度,这意味着在B+树中进行查找、插入和删除操作可能需要更少的I/O次数。
  5. 范围查询效率

    • B-树:虽然可以执行范围查询,但效率不如B+树,因为B-树的叶子节点之间没有直接的链接。
    • B+树:由于叶子节点形成了有序链表,执行范围查询和顺序访问非常高效。
  6. 插入和删除操作

    • B-树:在插入和删除操作中,B-树可能需要在内部节点和叶子节点之间移动数据。
    • B+树:在B+树中,插入和删除操作通常只影响叶子节点,内部节点的键值仅用于导航。
  7. 分裂和合并操作

    • B-树:当节点满时,分裂操作可能涉及到将键值提升到父节点,并可能需要调整多个节点。
    • B+树:分裂操作通常只影响当前节点和其兄弟节点以及它们的父节点,因为B+树的内部节点不存储数据记录。
  8. 存储密度

    • B-树:由于内部节点也存储数据记录,B-树的存储密度可能不如B+树。
    • B+树:B+树的内部节点只存储键值和子节点的引用,因此具有更高的存储密度。
  9. 应用场景

    • B-树:适用于需要在内部节点和叶子节点都存储数据的场景。
    • B+树:由于其高效的范围查询性能和顺序访问性能,B+树通常用于数据库索引和文件系统。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/50117.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL数据库基本用法

了解数据库基本概念 什么是数据库? • 长期存放在计算机内,有组织、可共享的大量数据的集合,是一个数据“仓库” MySQL数据库的特点 • 开源免费,小巧但功能齐全 • 可在Windows和Linux系统上运行 • 操作方便,…

Hive 的 classpath 简介

Hive的classpath是Hive运行时用于查找所需类和资源文件的路径集合。它包含了Hive运行所需的所有JAR文件和配置文件的位置。理解和管理Hive的classpath对于确保Hive正常运行、添加自定义库或解决类加载问题非常重要。 以下是关于Hive classpath的一些关键点: 默认位…

昇思25天学习打卡营第22天|munger85

LSTMCRF序列标注 我们希望得到这个模型来对词进行标注,B是开始,I是实体词的非开始,O是非实体词。 我们首先需要lstm对序列里token的记忆,和计算每个token发到crf的分数,发完了再退出来,最后形成1模型。那么…

Python主页

文章目录 Python全套内容整理 Python全套内容整理 杂项 代码风格 Python之禅命名规范 基础语法 数值运算赋值判断循环函数 参数(*args、**krags、\、*) 包 import 基础类 字符串 str类方法 列表元组字典集合 集合速览 进阶功能 异常文件类 常见模块 ossys 常见模块&#xf…

免费可视化工具大显身手:公司财务报表一键生成

面对海量的财务数据,如何快速、准确地提炼出有价值的信息,并以直观易懂的方式呈现给管理层及利益相关者,成为了每一家企业面临的重大挑战。 传统财务报表编制过程繁琐,不仅耗时耗力,还容易出错。而一些可视化工具&…

Web服务统一身份认证协议设计与实现

Web服务统一身份认证协议设计与实现 “Design and Implementation of Unified Web Service Authentication Protocol” 完整下载链接:Web服务统一身份认证协议设计与实现 文章目录 Web服务统一身份认证协议设计与实现摘要第一章 绪论1.1 研究背景1.2 研究目的和意义1.3 研究内…

Java学习笔记(四)控制流程语句、循环、跳转控制语句

Hi i,m JinXiang ⭐ 前言 ⭐ 本篇文章主要介绍Java控制流程语句、循环、跳转控制语句使用以及部分理论知识 🍉欢迎点赞 👍 收藏 ⭐留言评论 📝私信必回哟😁 🍉博主收将持续更新学习记录获,友友们有任何问题…

Java多线线程-----等待唤醒机制(wait notify)

目录 一.等待唤醒机制简介: 二.synchronized,wait(),notify(): 三.等待唤醒机制案例: 例题一: 例题二: 四.什么时候释放锁—wait()、notify() 一.等待唤醒机制简介: 由于线程之…

华为嵌入式面试题及参考答案(持续更新)

目录 详细讲TCP/IP协议的层数 材料硬度由什么决定? SD3.0接口电压标准 晶振市场失效率 RS232-C的硬件接口组成 详细讲眼图的功能 局域网传输介质有哪几类? 详细讲OSI模型 NMOS与PMOS的区别 I2C和SPI的区别 Static在C语言中的用法 堆栈和队列的区别 数组的时间复…

pyqt5制作音乐播放器(第三版)

这次接入了数据库,增加了翻页模式,更新了功能跳转之间的细节 数据设计: 收藏 like1时表示被收藏,展示show0的时候表示表数据被搜索 from peewee import Model, PrimaryKeyField, CharField, BooleanField, MySQLDatabase,Integer…

【区块链+绿色低碳】基于区块链的碳排放管理系统 | FISCO BCOS应用案例

目前业内的碳排放核查方式主要依靠于第三方人工核查、手动填报数据,然后由具备有认证资质的机构进行核验 盖章。但在此过程中存在数据造假的情况,给碳排放量核算的准确性、可靠性带来挑战。 中科易云采用国产开源联盟链 FISCO BCOS,推出基于…

搭建博客系统#Golang

WANLI 博客系统 项目介绍 基于vue3和gin框架开发的前后端分离个人博客系统,包含md格式的文本编辑展示,点赞评论收藏,新闻热点,匿名聊天室,文章搜索等功能。 项目已经部署并运行,快速开发可以查看博客&am…

GitHub每日最火火火项目(7.25)

1. 项目名称:public - apis / public - apis 项目介绍:这是一个集体列表,收集了各种免费的 APIs。在当今的软件开发中,API(应用程序编程接口)扮演着至关重要的角色,它们允许不同的应用程序和服…

基于Go语言开发调用高德API地址逆编码

最近公司有一个需求,有一批数据只有经纬度没有确定地址,现在需要根据经纬度补全地址,刚好高德提供这么一个API,可以拿来使用。 不过因为提供的数据的经纬度是大地2000坐标系,跟高德坐标系还不一样,需要进行…

培训第十一天(nfs与samba共享文件)

上午 1、环境准备 (1)yum源 (一个云仓库pepl仓库) [rootweb ~]# vim /etc/yum.repos.d/hh.repo [a]nameabaseurlfile:///mntgpgcheck0[rootweb ~]# vim /etc/fstab /dev/cdrom /mnt iso9660 defaults 0 0[rootweb ~]# mount -a[…

WebKit与PWA:打造无缝的渐进式Web应用体验

WebKit与PWA:打造无缝的渐进式Web应用体验 随着移动互联网的快速发展,用户对于Web应用的体验要求越来越高。Progressive Web Apps(PWA),即渐进式Web应用,以其无需安装、易于更新、跨平台等特性&#xff0c…

JavaSE--基础语法--继承和多态(第三期)

一.继承 1.1我们为什么需要继承? 首先,Java中使用类对现实世界中实体来进行描述,类经过实例化之后的产物对象,则可以用来表示现实中的实体,但是 现实世界错综复杂,事物之间可能会存在一些关联,那在设计程…

Spring-一个接口拥有多实现类-企业应用场景

前言: 由于java的多态特性,往往一个接口有多种具体的实现,传统的做法是在一个实现类中新建不同方法。但这种做法既不符合OOP的思想,而且当每种实现逻辑都相对复杂的时候,会让我们的代码显得臃肿和凌乱,当我们只需要使用其中一种实现的时候,没有必要去关心其他实现,所以…

Java读取文件中多个JSON对象,并且16进制字符串和byte相互转换,将byte转为16进制字符串并写入json文件

Java读取文件中多个JSON对象 File file new File("/home/renjx/testcases.json");//将json转为mapsObjectMapper objectMapper new ObjectMapper();List<Map<String, String>> maps objectMapper.readValue(file, new TypeReference<List<Map&…

Apache虚拟主机VirtualHost配置项详解

在Apache中,VirtualHost容器用于定义一个虚拟主机的配置,它允许在单一的物理服务器上托管多个不同的网站,每个网站可以有自己的域名、文档根目录、错误日志等。VirtualHost内的配置项非常灵活,可以包含从基本的网站信息到高级的URL重写和安全设置。 以下是一些常见的Virtu…