39.B树,B+树(王道第7章查找补充知识)

目录

一. B树

(1)B树的定义

(2)B树的高度

(3)B树的插入

(4)B树的删除

二. B+树

(1)B+树的定义

(2)B+树与B树的区别


一. B树

(1)B树的定义

我们首先从二叉查找树到m叉查找树:如下是一个5叉查找树,这里每个结点最多可以有4个关键字,一个关键字可以把区间分成两个部分。

为了保证查找效率,防止树过高的策略:

(1)m叉查找树中,规定除了根节点外,任何结点至少有\left \lceil m/2 \right \rceil个分叉,即至少含有\left \lceil m/2 \right \rceil-1个关键字。如对于5叉排序树,每个结点至少要有3个分叉,2个关键字。

(2)仿照平衡二叉树:在m叉查找树中,规定对于任何一个结点,其所有子树的高度都要相同。

对于以上的m叉树,就称为m阶B树,下面给出B树的定义:

B树,又称多路平衡查找树,B树中所有结点的孩子个数的最大值称为B树的阶,通常用m表示。一棵m阶B树或为空树,或为满足如下特性的m叉树:

  • 1)树中每个结点至多有m棵子树,即至多含有m-1个关键字。
  • 2)若根结点不是终端结点,则至少有两棵子树。
  • 3)除根结点外的所有非叶结点至少有\left \lceil m/2 \right \rceil棵子树,即至少含有\left \lceil m/2 \right \rceil-1个关键字。
  • 4)所有非叶子结点的结构如下:
    nP_0K_1P_1K_2P_2...K_nP_n
  • 其中,Ki (i= 1,2.., n)为结点的关键字,且满足K1<K2<...<Kn;Pi (i = 0,1..., n)为指向子树根结点的指针,且指针Pi-1所指子树中所有结点的关键字均小于Ki,Pi所指子树中所有结点的关键字均大于Ki,n(\left \lceil m/2 \right \rceil-1\leq n\leq m-1)为结点中关键字的个数。
  • 5)所有的叶结点(失败结点)都出现在同一层次上,并且不带信息(可以视为外部结点或类似于折半查找判定树的查找失败结点,实际上这些结点不存在,指向这些结点的指针为空)。
     

(2)B树的高度

下面讨论B树的高度:对于一个包含n个关键字,高度为h,阶数为m的B树(需要说明的是高度一般不包含叶子结点/失败结点):

最小高度:尽可能填满。第一层1个结点,每个结点有m-1个关键字;第二层m个结点,每个结点有m-1个关键字;第三层m^2个结点,每个结点有m-1个关键字;所以有n\leq (m-1)(1+m+m^2+...+m^{h-1})=m^h-1,因此h\geq log_m(n+1)

最大高度:尽可能空置。第一层1个结点,第二层2个结点,第三层有2\left \lceil m/2 \right \rceil个结点,第h层有2\left \lceil m/2 \right \rceil^{h-2}个结点,叶子结点最少有2\left \lceil m/2 \right \rceil^{h-1}个,由于叶子结点就是n+1个(n个关键字分成n+1段区间),所以2\left \lceil m/2 \right \rceil^{h-1}\leq n+1,也就是h\leq log_{\left \lceil m/2 \right \rceil}((n+1)/2)+1

(3)B树的插入

核心要求:

(1)对m阶B树——除根节点外,结点关键字个数\left \lceil m/2 \right \rceil-1\leq n\leq m-1

(2)子树0<关键字1<子树1<关键字2<子树2<....

(3)新元素一定是插入到最底层“终端节点”,用“查找”来确定插入位置(否则失败结点将不在同一层)。


在插入key后,若导致原结点关键字数超过上限,则从中间位置(\left \lceil m/2 \right \rceil)将其中的关键字分为两部分,左部分包含的关键字放在原结点中,右部分包含的关键字放到新结点中,中间位置\left \lceil m/2 \right \rceil的结点插入原结点的父结点。若此时导致其父结点的关键字个数也超过了上限,则继续进行这种分裂操作,直至这个过程传到根结点为止,进而导致B树高度增1.

例:对于一个5阶B树,结点关键字个数是\left \lceil m/2 \right \rceil-1\leq n\leq m-1,也就是2\leqslant n\leqslant 4,现插入25,38,49,60,80,90,99,88,83,87,70,92,93,94,73,74,75

插入80的时候溢出,所以把49提到父结点

插入88的时候溢出,所以把88提到父结点

插入70的时候溢出,所以把80提到父结点(请注意这里的指针联系)

插入94的时候溢出,所以把93提到父结点(请注意这里的指针联系)

插入75的时候溢出,所以把73提到父结点,但此时父结点也溢出,所以要再次操作
把80往上提,得到最后的B树
(4)B树的删除

(1)若被删除关键字在终端节点,则直接删除该关键字(要注意节点关键字个数是否低于下限\left \lceil m/2 \right \rceil-1)

如在上面的B树里删除60:

(2)若被删除关键字在非终端节点,则用直接前驱或直接后继来替代被删除的关键字。对非终端结点关键字的删除,必然可以转化为对终端结点的删除操作。
直接前驱:当前关键字左侧指针所指子树中“最右下”的元素;直接后继:当前关键字左侧指针所指子树中“最左下”的元素;

直接前驱/直接后继一定是终端结点!

如在(1)的基础上删除80,找直接前驱77替代:

然后再删除77,用后继82替代:

(3)如果删除叶子结点导致结点关键字个数低于下限,且与此结点右(或左)兄弟结点的关键字个数还很宽裕,则需要调整该结点、右(或左)兄弟结点及其双亲结点(父子换位法)
说白了,当右兄弟很宽裕时,用当前结点的后继、后继的后继来填补空缺。

例如删除38,借用右面的兄弟结点中的70:

再删除90,借用左面的兄弟结点中的87:

(4)若被删除关键字所在结点删除前的关键字个数低于下限,且此时与该结点相邻的左、右兄弟结点的关键字个数均为\left \lceil m/2 \right \rceil-1,则将关键字删除后与左(或右)兄弟结点及双亲结点中的关键字进行合并。

例如:继续删除49:

此时合并完73又不满足最低关键字个数,所以还要合并一步

二. B+树

(1)B+树的定义

一棵m阶的B+树需满足下列条件:

  • 每个分支结点最多有m棵子树(孩子结点)。
  • 非叶根结点至少有两棵子树,其他每个分支结点至少有\left \lceil m/2 \right \rceil棵子树。
  • 结点的子树个数与关键字个数相等。
  • 所有叶结点包含全部关键字及指向相应记录的指针,叶结点中将关键字按大小顺序排列,并且相邻叶结点按大小顺序相互链接起来(支持顺序查找)。
  • 所有分支结点中仅包含它的各个子结点中关键字的最大值及指向其子结点的指针。

需要注意的是:对于多路查找,无论查找成功与否,最终都会走到叶子结点,这是和B树不一样的地方。

在B+树中,非叶结点不含有该关键字对应记录的存储地址。可以使一个磁盘块可以包含更多个关键字,使得B+树的阶更大,树高更矮,读磁盘次数更少,查找更快。

(2)B+树与B树的区别

对于m阶B+树与m阶B树:

1)B+树结点中的n个关键字对应n棵子树,B树结点中的n个关键字对应n+1棵子树

2)对m阶B+树,根结点关键字个数n\in \left [ 2,m \right ],其他结点关键字个数n\in \left [ \left \lceil m/2 \right \rceil,m \right ]。对m阶B树,根结点关键字个数n\in \left [ 1,m-1 \right ],其他结点关键字个数n\in \left [ \left \lceil m/2 \right \rceil-1,m-1 \right ]

3)在B+树中,叶结点包含全部关键字,非叶结点中出现过的关键字也会出现在叶结点中。在B树中,各结点中包含的关键字是不重复的。

4)在B+树中,叶结点包含信息,所有非叶结点仅起索引作用,非叶结点中的每个索引项只含有对应子树的最大关键字和指向该子树的指针,不含有该关键字对应记录的存储地址。B树的结点中都包含了关键字对应的记录的存储地址。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/118266.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件测试进阶篇----自动化测试脚本开发

自动化测试脚本开发 一、自动化测试用例开发 1、用例设计需要注意的点 2、设计一条测试用例 二、脚本开发过程中的技术 1、线性脚本开发 2、模块化脚本开发&#xff08;封装线性代码到方法或者类中。在需要的地方进行调用&#xff09; 3、关键字驱动开发&#xff1a;selen…

rust学习——智能指针

智能指针 在各个编程语言中&#xff0c;指针的概念几乎都是相同的&#xff1a;指针是一个包含了内存地址的变量&#xff0c;该内存地址引用或者指向了另外的数据。 在 Rust 中&#xff0c;最常见的指针类型是引用&#xff0c;引用通过 & 符号表示。不同于其它语言&#xf…

【可视化Java GUI程序设计教程】第4章 布局设计

4.1 布局管理器概述 右击窗体&#xff0c;单击快捷菜单中的Set Layout 4.1.2 绝对布局&#xff08;Absolute Layout&#xff09; 缩小窗口发现超出窗口范围的按钮看不见 Absolute Layout 4.1.2 空值布局&#xff08;Null Layout&#xff09; 4.1.3 布局管理器的属性和组件布…

STM32-通用定时器

通用定时器 通用定时器由一个可编程预分频器驱动的16位自动重新加载计数器组成。应用&#xff1a;测量输入的脉冲长度信号&#xff08;输入捕获&#xff09;、产生输出波形&#xff08;输出比较和PWM&#xff09;。 脉冲长度和波形周期可以从几微秒调制到几毫秒&#xff0c;使用…

STM32:TIM通道输入捕获

本文主要讲解如何使用TIMER通道的输入脉冲捕获功能。基于STM32F7的Timer2 Channel3来进行讲解。 配置时钟 Timer2的时钟频率&#xff0c;对应APB1 Timer。 分频设置为96-1&#xff0c;这样设置定时器每次counter加1&#xff0c;对应的时间为1us&#xff08;计时精度是1us&…

【windows】自动开机 + 免登陆 + 自动运行bat脚本 + 远程免登陆

一、场景 二、解决方案 三、实战 1. 键盘 Win R 键&#xff0c;在弹出的对话框中输入netplwiz&#xff0c;回车 2. 去掉必须输入用户名和密码的勾选&#xff0c;点击应用 3. 在弹出的对话框中输入用户名和密码 一、场景 主机服务器&#xff1a;windows 10 桌面docker &a…

【蓝桥每日一题]-贪心(保姆级教程 篇1)#拼数 #合并果子 #凌乱yyy

目录 题目&#xff1a; 拼数 思路&#xff1a; 题目&#xff1a; 合并果子 思路&#xff1a; 题目&#xff1a;凌乱yyy 思路&#xff1a; 题目&#xff1a;拼数 思路&#xff1a; 思路很简单。举个例子&#xff1a;对于a321,b32。我们发现ab32132,ba32321&#xff0c;那么…

LVS负载均衡集群 (NAT模式)

LVS集群 集群的概念&#xff1a; 为解决某个特定的问题&#xff0c;将多个计算机组合起来形成一个单个系统 集群的水平扩展&#xff1a; 增加设备&#xff0c;并行运行多个服务&#xff0c;通过网路连接和算法来调度服务分配的问题 集群的类型&#xff1a; 负载均衡集群&#…

postgresql14-表的管理(四)

表table 创建表 CREATE TABLE table_name --表名 (column_name data_type column_constraint, --字段名、字段类型、约束字段&#xff08;可选&#xff09;column_name data_type, --表级别约束字段...,table_constraint );CREATE TABLE emp1 --创建表 AS SELECT * FROM empl…

Spring Cloud之服务注册与发现(Eureka)

目录 Eureka 介绍 角色 实现流程 单机构建 注册中心 服务提供者 服务消费者 集群搭建 注册中心 服务提供者 自我保护机制 原理分析 Eureka 介绍 Eureka是spring cloud中的一个负责服务注册与发现的组件&#xff0c;本身是基于REST的服务&#xff0c;同时还提供了…

Redis数据库管理工具Redis Desktop Manager最新中文

Redis Desktop Manager是一款直观且易用的Redis数据库管理工具&#xff0c;支持Windows、macOS和Linux等多平台。它提供了丰富的功能和工具&#xff0c;使用户可以轻松地创建、编辑、删除和浏览Redis键值对&#xff0c;并执行各种Redis命令。通过SSH Tunnel连接&#xff0c;RDM…

28. 使用 k8e 玩转 kube-vip with Cilium‘s Egress Gateway 特性

因为在私有云环境下,我们需要保障集群服务 APIServer地址的高可用,所以提供的方案就是使用一个 VIP 让 API Server 的流量可以负载均衡的流入集群。另外,kube-vip 还支持 Service LB,方便SVC 服务的负载均衡,结合 cilium Egress Gateway 特性可以做到集群内的容器对外访问…

排序-表排序

当我们需要对一个很大的结构体进行排序时&#xff0c;因为正常的排序需要大量的交换&#xff0c;这就会造成时间复杂度的浪费 因此&#xff0c;我们引入指针&#xff0c;通过指针临时变量的方式来避免时间复杂度的浪费 间接排序-排序思路&#xff1a;通过开辟一个指针数组&…

Mac风扇控制电脑降温软件Macs Fan Control Pro 简体中文

Macs Fan Control Pro是一款功能强大的Mac风扇控制软件&#xff0c;旨在帮助用户更好地管理和控制Mac电脑的风扇速度和温度传感器。以下是该软件的主要特色介绍&#xff1a; 监测和调整Mac电脑的风扇速度和温度传感器&#xff0c;帮助用户控制设备温度&#xff0c;提高电脑性能…

Android Studio Gradle中没有Task任务,没有Assemble任务,不能方便导出aar包

Gradle中&#xff0c;没有Assemble任务 1. 在编译aar包或者编译module的时候&#xff0c;没有release包&#xff0c;我们一般都是通过assemble进行编译。 如果在Gradle中找不到task。 可以通过设置File->setting -->Experimental→取消勾选“Do not build Gradle task …

LeetCode 22. 括号生成【字符串,回溯;动态规划】中等

本文属于「征服LeetCode」系列文章之一&#xff0c;这一系列正式开始于2021/08/12。由于LeetCode上部分题目有锁&#xff0c;本系列将至少持续到刷完所有无锁题之日为止&#xff1b;由于LeetCode还在不断地创建新题&#xff0c;本系列的终止日期可能是永远。在这一系列刷题文章…

Java架构师内功嵌入式技术

目录 1 导学2 嵌入式微处理体系结构3 微处理器分类4 多核处理器5 嵌入式软件6 嵌入式系统6.1 系统组成7 嵌入式实时操作系统8 嵌入式软件设计9 软件开发工具想学习架构师构建流程请跳转:Java架构师系统架构设计 1 导学 嵌入式技术对软件架构的作用主要体现在以下几个方面: …

YOLOv5论文作图教程(1)— 软件介绍及下载安装(包括软件包+下载安装详细步骤)

前言:Hello大家好,我是小哥谈。在学习YOLOv5算法的过程中,很多同学都有发表论文的需求。作为文章内容的支撑,图表是最直接的整合数据的工具,能够更清晰地反映出研究对象的结果、流程或趋势。在发表论文的时候,审稿人除了关注论文的内容和排版外,也会审核图表是否清晰美观…

网络编程进化史:Netty Channel 的崭新篇章

上篇文章&#xff08;Netty 入门 — ByteBuf&#xff0c;Netty 数据传输的载体&#xff09;&#xff0c;我们了解了 Netty 的数据是以 ByteBuf 为单位进行传输的&#xff0c;但是有了数据&#xff0c;你没有通道&#xff0c;数据是无法传输的&#xff0c;所以今天我们来熟悉 Ne…

【Gan教程 】 什么是变分自动编码器VAE?

名词解释&#xff1a;Variational Autoencoder&#xff08;VAE&#xff09; 一、说明 为什么深度学习研究人员和概率机器学习人员在讨论变分自动编码器时会感到困惑&#xff1f;什么是变分自动编码器&#xff1f;为什么围绕这个术语存在不合理的混淆&#xff1f;本文从两个角度…