多路平衡查找树 --- B(B-)树

1 简介

可以用阶数来描述B树, 一棵M阶B树代表着该B树最多有M个孩子节点. 如果M为2, 那么该B树就是一棵二叉搜索树. 一棵M阶B树具有以下性质:

1. 每个节点最多有M - 1个关键字. 跟普通的树不同, B树的关键字有多个.

2. 根节点最少可以只有一个关键字.

3. 非根节点至少有k个关键字, 这里的k是指ceil(M / 2) - 1.(这里面的ceil是指大于等于参数的最小整数, 从下面插入操作分析可知, 叶子节点都是由父节点分裂而来, 而分裂的条件就是分裂前节点总数已经达到了M)

4. 每个节点中的关键字都按照从小到大的顺序排列, 每个关键字在左子树中的所有关键字都小于它本身的关键字, 右子树的都大于它本身关键字.

5. 所有叶子节点都位于同一层, 或者说根节点到每个叶子节点的长度都相同.

2 插入操作

一棵M阶树的插入操作可以总结为以下步骤:

1. 根据要插入的key的值, 找到对应的叶子节点(一定要注意是叶子节点)

2. 如果被插入后的节点的key总数达到了M, 就需要对该节点, 按照key序列的中间左右分开进行分裂, 中间的key插入其父节点.

3. 对父节点进行第二步检查.

下面以一棵5阶B树的插入操作举例:

1. 首先插入39, 22, 97, 41:

2.  插入39, 节点总key数量达到了5, 进行分裂:

3.  插入13, 21:

4. 插入40, 节点分裂, 22进入父节点:

5. 插入30, 27, 33, 其中33插入后, 该节点满, 导致其分裂, 33进入父节点:

6. 插入36, 35, 34, 其中34插入后, 该节点满, 导致节点分裂, 36进入父节点:

7. 插入24, 29:

8. 插入26, 导致该节点满, 分裂, 27 进入父节点, 然后父节点也满了, 再分裂, 创建新节点:

3 删除操作

1. 首先找到要删除的点, 如果点不在树中, 那么肯定删除失败了.

2. 如果要删除的节点位于叶子节点, 那么拿掉这个节点, 如果位于非叶子节点上, 那么就要找到其后继节点, 因为后继节点肯定位于叶子节点上(因为肯定位于最左, 如果还位于非叶上面, 因其左子节点肯定存在比其大的节点, 不可能出现这种情况), 把要删除的节点替换成后继节点的值, 然后删除后继节点.

3. 因为最终删除的点位于叶子上, 所以要观察此时该叶节点是否满足B树的性质3:

非根节点至少有k个关键字, 这里的k是指ceil(M / 2) - 1

如果满足, 那么结束删除操作, 如果不满足, 那么进行4.

4. 先观察兄弟节点的情况:

如果兄弟节点的key数量大于k, 那么把父亲节点的key下移至该节点, 并把兄弟节点的一个节点上移至父节点

否则, 将父节点中的key下移与当前节点及其兄弟节点中的key合并, 形成一个新的节点. 原父节点中的key的两个孩子指针就变成了一个孩子指针, 指向这个新节点, 然后当前节点的指针指向父节点, 重复第3步.

举例说明:

1. 原始状态5阶B树, 每个非根节点的最少关键字数量为ceil(5 / 2) - 1 = 2:

2. 删除21, 位于叶节点, 且删除完成后该节点关键字数量为2, 结束:

3. 删除27, 27位于非叶子节点上

3.1 首先把其值修改为后继节点28:

3.2 删除28, 28位于叶子节点上, 删去:

3.3 此时该节点key数量小于2, 其左边的兄弟节点有三个key, 可以把父节点一个key移下来, 把兄弟节点一个key移到父节点, 具体操作就是把28下移, 26上移, 完成:

4. 删除32

4.1 首先删除32:

4.2 该节点key数量为1, 小于2, 而兄弟节点也没有大于2的了, 所以让父节点中对应的key30下移与该节点和兄弟节点合并:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/505357.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

B+树操作方式

1 简介 B树与B树相似, 也存在不同. 可以理解为把所有元素都放在叶子节点, 索引B树化的树. B树的一些性质: 1. B树的节点分类: 内部节点(索引节点), 叶子节点. 如果只有根节点有元素, 那么其可以是内部节点也可以是叶子节点. 2. B树与B树最大的不同是内部节点不保存数据, 只…

java执行查询postgresql得到中文乱码_比这个夏天还要热的PostgreSQL数据库来啦!

什么是PostgreSQL?云数据库 PostgreSQL 是京东云基于开源的 PostgreSQL 10.6 版本构建的一款功能强大的企业级关系型数据库管理系统。PostgreSQL有“世界上可获得的最先进的开源数据库”之称,在过去20年的飞速发展中,该数据库已经广泛应用在G…

python按列读取txt文件_如何使用pandas读取txt文件中指定的列(有无标题)

最近在倒腾一个txt文件,因为文件太大,所以给切割成了好几个小的文件,只有第一个文件有标题,从第二个开始就没有标题了。 我的需求是取出指定的列的数据,踩了些坑给研究出来了。 import pandas as pd # 我们的需求是 取…

jpa多表关联查询_Spring Boot 整合mybatis如何自定义 mapper 实现多表关联查询

上一篇文章已经介绍了自定义 mapper 实现自定义的方法,其实实现了通过自定义的mapper就可以做多表关联等复杂查询。但是很多朋友还是反馈说没有实现多表关联查询,所以,今天把文章又重新修改了,增加了多表关联的实现步骤。Mybatis …

spark on yarn 完全分布式_「大数据」(七十一)Spark之架构介绍

【导读:数据是二十一世纪的石油,蕴含巨大价值,这是情报通大数据技术系列第[71]篇文章,欢迎阅读和收藏】1 基本概念Spark 架构采用了分布式计算中的 Master-Slave 模型。 Master 是对应集群中的含有 Master 进程的节点,…

计算机网络数据链路层 --- 停止等待协议

停止等待协议的意义 除了比特出差错,底层信道还会出现丢包问题。为了实现流量控制。 停止等待协议的前提 虽然现在常用全双工通信方式,但为了讨论问题方便,仅考虑一方发送数据(发送方),一方接收数据&…

python import如何使用_python之import引用

关于python的import引用的最大关键是init.py文件的作用,这个文件对于import的方法使用至关重要。这个是我在搭建自动化框架过程中用到的import的方法使用。 比如说,我现在login.py想引用bottom底下的log.py的时候,这个时候,我们如…

计算机网络数据链路层 --- 后退n帧协议(GBN)

滑动窗口 发送窗口 发送方维持一组连续的允许发送的帧的序号 接收窗口 接收方维持一组连续的允许接收帧的序号 发送过程 如图,假如发送方的发送窗口大小是6,首先发送0号帧,并建立0号帧的副本,防止帧丢失,然后发送…

简要描述内部连接和外部连接之间的区别_创新性的M12推拉式连接器推拉标准—跨制造商自动化技术的里程碑...

“八家知名制造商 – 菲尼克斯,浩亭,莫仕,穆尔电子,宾德,康耐,艾查和魏德米勒因建立M12推拉式连接器的推拉锁紧机制而在市场上确立了地位。我们共同追求一个目标,即确保各个制造商之间的兼容性。…

计算机网络数据链路层 --- 选择重传协议(SR)

引言 GBN协议的弊端 累计确认,从而导致某一帧错误后会批量重传。 可行的解决方案 可以只重传出错的帧,设置单个确认,同时加大接收窗口,设置接收缓存,缓存乱序到达的帧。这也就是选择重传协议SR。 SR中的滑动窗口 …

requests 返回的cookies为空_爬虫学习(2)(requests库)

POST请求import requestsdata {name: cxc, age: 18} r requests.post("http://httpbin.org/post", datadata) print(r.text)POST请求这样就成功地获得了返回结果,form部分就是提交的数据,证明POST请求成功发送了。响应之前我们使用了text和c…

计算机网络 --- 数据链路层介质访问控制

引言 传输数据使用的两种链路: 点对点链路:两个相邻的节点通过一个链路相连,没有第三者。应用:PPP协议,常用于广域网。广播式链路:所有主机共享通信介质。应用:早期的总线以太网,无…

6-7 使用函数输出水仙花数_学习C语言居然对printf函数不理解???

对于C语言的printf函数,可以说是我们学习C语言第一个接触到的函数了。printf命令的作用是格式化输出函数,一般用于向标准输出设备按规定格式输出信息。printf()函数的调用格式为:printf("", )。printf()是C语言标准库函数&#xff…

matplotlib 子图超过4个_Matplotlib从入门到精通

Matplotlib从入门到精通​mp.weixin.qq.comMatplotlib是基于Python语言的开源项目,旨在为Python提供一个数据绘图包。它提供了一整套和 matlab 相似的命令 API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入 GUI 应用程序…

c++求n的几次方_14.八年级数学:若a+b+c=1,怎么求 a+b+c的值?分式培优拓展

欢迎您来到方老师数学课堂,请点击上方蓝色字体,关注方老师数学课堂。所有的视频内容,全部免费,请大家放心关注,放心订阅。八年级数学:若abc1,怎么求 abc的值?分式培优拓展。这道题&a…

计算机网络 --- 数据链路层CSMA/CD协议

CSMA/CD协议 全称为载波监听多点接入/碰撞检测CSMA/CD(carrier sense multiple access with collision detection) CSMA/CD协议 - CS: CS指的是载波侦听/监听,每一个站点再发送数据之前以及发送数据时都要检测一下总线上是否有其他计算机在…

map insert异常失败_处理dubbo反序列化失败的坑

前言今天下午,当我经过一个小时的奋”键“疾”码“,准备好好的审查一下(摸鱼)自己写的代码,经过一段时间审查(摸的差不多了,该下班了),得出一个结论我写的代码很优雅、精简。所以大手一挥提交代码,并在 API…

class会不会回收?用不到的class怎么回收_牛X的java程序员必备的GC基础知识, 面试肯定用的到...

1. GC回收哪些内存区域呢?堆内存对象数组方法区该类所有的额实例都已经被回收, 也就是java堆中不存在该类的任何实例加载该类的ClassLoader已经被回收该类对应的java.lang.Class对象在任何地方没有被引用, 也无法通过反射访问该类方法。垃圾回…

c++读取utf8文件_Node.js 进阶之 fs 文件模块学习

前言文件操作是开发过程中并不可少的一部分。Node.js 中的 fs 模块是文件操作的封装,它提供了文件读取、写入、更名、删除、遍历目录、链接等 POSIX 文件系统操作。与其它模块不同的是,fs 模块中所有的操作都提供了异步和同步的两个版本,具有 sync 后缀的…

计算机网络 --- 数据链路层中局域网和广域网

局域网 简称LAN(Local Area Network):是指在某一区域内由多台计算机互联成的计算机组,使用广播信道。 局域网的特点 覆盖的地理范围较小,只在一个相对独立的局部范围内联,如一座或集中的建筑群内。使用专…