数据结构学习笔记——查找算法中的树形查找(B树、B+树)

目录

  • 前言
  • 一、B树
    • (一)B树的概念
    • (二)B树的性质
    • (三)B树的高度
    • (四)B树的查找
    • (五)B树的插入
    • (六)B树的删除
  • 二、B+树
    • (一)B+树的概念
    • (二)B+树的性质
    • (三)B+树的查找

前言

B树和B+树属于树形查找算法中的一种,主要用于数据库系统、文件系统和磁盘存取等方面,都是用于存储和索引大量的数据,以提高检索效率。例如,在磁盘存储中,通过将数据分散到多个磁盘块中,并使用树形结构来组织这些磁盘块,从而提高了查找速度和查找效率。若设B树中所有结点的孩子结点个数的最大值为m,则该B树是一棵m阶B树,另外B+树则是B树的变形。

一、B树

(一)B树的概念

二叉排序树也称为查找树(注意:与二分查找的判定树不同),其中各结点值的大小关系是:左子树<根结点<右子树,且左、右子树也是一棵二叉排序树满足其条件。

前面给过二叉查找树的定义,简单的来说,B树是二叉查找树的推广,即一棵m阶B树可看作一棵m叉查找树,但两者有些方面不同,如下:
1、结点与关键字不同:二叉查找树遵循二叉树的原则,每个结点最多只有两个孩子结点,且每个结点只包含一个关键字;而B树的每个结点最多有m个结点,即最多含有m-1个关键字。
2、平衡性:二叉查找树不一定是一棵平衡二叉树,查找过程中查找效率可能随着查找树的结构变化;而B树是一棵多路平衡查找树,通过限制结点的子树和关键字数量,使B树的高度保持相对稳定,从而提高查找效率。B树也正是在保持平衡的前提下能够更高效地处理大量数据,从而非常适合应用在需要高效存储和访问大量数据的场景中。

(二)B树的性质

B树中与二叉查找树相同的性质,二叉查找树各结点值的大小关系是:左子树<根结点<右子树,而B树中关键字的值的大小关系是:子树1<关键字1<子树2<关键字2<子树3…,一棵m阶B树中,除了根结点外所有结点中关键字个数为:⌈m/2⌉-1 ≤ n ≤ m-1。例如,一棵5阶B树中,除了根结点外所有结点中关键字的个数为2 ≤ n ≤ 4,即关键字个数最少为2,最多为4。
在这里插入图片描述
1、m阶B树中,根结点至多有m棵子树,若B树的根结点不是终端结点,则该B树至少有两棵子树。
2、B树中结点内关键字均以升序或降序排列。
3、B树是一棵多路平衡查找树,所有结点的平衡因子均为0。
4、m阶B树中,若根结点没有关键字,则B树无子树,B树为空;若有关键字,由于子树个数等于关键字个数加1,所以子树一定大于或等于两棵。
5、m阶B树中,根结点最少含1个关键字,而除根结点外,每个非叶子结点至少有⌈m/2⌉棵子树,且至少有⌈m/2⌉-1个关键字;由于最少情况下,根结点至少有一个关键字,所以B树中所有结点包括的关键字个数至少为(n-1)(⌈m/2⌉-1)+1个。
6、结点的孩子结点的个数等于该结点关键字的个数加1,即具有n个关键字的m阶B树,应有n+1个叶结点。另外,B树中所有的叶子结点均在一层上,且不带任何信息,这一点与二分查找判定树中查找失败的结点类似,实际上这些叶子结点不存在,代表查找失败的情况,如下:
在这里插入图片描述

(三)B树的高度

在求B树的高度时,不计入叶子结点,若设m阶B树中包括n(n≥1)个关键字,其高度为h,可得到B树的最小高度和最大高度范围区间:logm(n+1) ≤ h ≤ log⌈m/2⌉[(n+1)/2]+1。

⌈ ⌉表示向上取整,取比自己大的最小整数,⌊ ⌋表示向下取整,取比自己小的最大整数。

(四)B树的查找

B树的查找类似二叉查找,首先在B树中查找结点,然后在结点所包含的关键字K1,…,Kn中查找给定的关键字,可通过顺序查找二分查找进行查找,若找到等于给定值的关键字,则查找成功;否则,继续查找,直至找到或指针为空时,此时查找失败,即查找到B树的叶子结点时失败。

(五)B树的插入

B树的插入操作不仅需要找到要插入的位置(定位),而且需判断插入后是否会导致不满足B树的定义,由于B树中查找成功结点的关键字个数在 ⌈m/2⌉-1 ≤ n ≤ m-1间,如下:
1、第一种情况:若插入后结点的关键字个数小于m,则直接插入。
在这里插入图片描述
2、第二种情况:若插入后结点的关键字个数大于m-1,则需要进行调整,从关键字中间位置⌈m/2⌉处将关键字分为两部分,左半部分放在原结点中,右半部分放在新的相邻右边结点中,中间关键字元素⌈m/2⌉上移到原结点的父结点中,另外,若父结点的空间也不够,则继续按照以上方式进行调整。
在这里插入图片描述

(六)B树的删除

B树的删除分两种情况,如下:
1、第一种情况
若要删除的关键字在终端结点中时:
(1)若要删除的关键字所在结点的关键字个数大于或等于⌈m/2⌉时,即关键字删除后结点仍满足相应的关键字个数,则可直接删去。
(2)若要删除的关键字当前所在结点的关键字个数等于⌈m/2⌉-1时,且左/右兄弟很充裕时,即其关键字个数大于或等于⌈m/2⌉时,需要进行调整(向兄弟借),用当前结点的前驱/后继、前驱的前驱/后继的后继代替,从而满足B树的定义。
在这里插入图片描述
(3)若要删除的关键字当前所在结点的关键字个数等于⌈m/2⌉-1时,且左/右兄弟不是很充裕时,即其关键字个数只等于⌈m/2⌉-1时,则将关键字删除后需要进行合并,即与当前结点的兄弟结点以及双亲结点中的关键字合并。
在这里插入图片描述
2、第二种情况
若要删除的关键字不在终端结点中时,用该关键字的直接前驱或直接后继代替,转换成第一种情况,再进行删除。
在这里插入图片描述
在这里插入图片描述

二、B+树

(一)B+树的概念

B+树可以由分块查找推广,所以也称为多级分块查找,即m阶B+树,它是B树的变形,与B树相同,B树和B+树都是平衡的多叉树,都用在文件索引结构和数据库索引中,但B+树更加适用。B树的结点包含关键字对应记录的存储地址,且B树中的叶子结点不带信息,而B+树的叶子结点带信息,而其中其他的非叶子结点只是作索引作用。

(二)B+树的性质

B+树中,n个关键字对应n棵子树,即每个关键字对应一棵子树,且子树的个数与结点的关键字个数相等,每个分支结点至少有 ⌈m/2⌉棵子树。
在这里插入图片描述
B树与B+树中结点的关键字个数对比如下表:

名称B树B+树
根结点关键字个数1 ≤ n ≤ m-12 ≤ n ≤ m
非根结点关键字个数⌈m/2⌉-1 ≤ n ≤ m-1⌈m/2⌉ ≤ n ≤ m

(三)B+树的查找

B树支持随机查找,而B+树支持顺序查找和随机查找。

B树不支持顺序查找的原因是查找时可能查找到树中的任何一层,所以其查找速度和稳定性没有B+树高。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/597762.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【linux】线程同步+基于BlockingQueue的生产者消费者模型

线程同步基于BlockingQueue的生产者消费者模型 1.线程同步2.生产者消费者模型3.基于BlockingQueue的生产者消费者模型 喜欢的点赞&#xff0c;收藏&#xff0c;关注一下把&#xff01; 1.线程同步 在线程互斥写了一份抢票的代码&#xff0c;我们发现虽然加锁解决了抢到负数票的…

Java重修第二天—学习”方法“

通过学习本篇文章可以掌握如下知识 1、方法的定义 2、方法在计算机中的执行流程。 3、方法使用时常见问题 4、Java中方法的参数传递机制 5、方法重载 1 方法是什么 方法是一种语法结构&#xff0c;它可以把一段代码实现的某种功能封装起来&#xff0c;以便重复利用。 方…

第二百四十五

我们在上一章回中介绍了"修改页面导航中遇到的问题"沉浸式状态样相关的内容&#xff0c;本章回中将介绍如何修改Avatar的大小.闲话休提&#xff0c;让我们一起Talk Flutter吧。 1. 概念介绍 我们在正常使用CirCleAvatar组件时可以通过该组件的radius属性来修改它的…

目标检测-One Stage-YOLO v3

文章目录 前言一、YOLO v3的网络结构和流程二、YOLO v3的创新点总结 前言 根据前文目标检测-One Stage-YOLOv2可以看出YOLOv2的速度和精度都有相当程度的提升&#xff0c;但是精度仍较低&#xff0c;YOLO v3基于一些先进的结构和思想对YOLO v2做了一些改进。 提示&#xff1a;…

突破技术边界:R与jsonlite库探秘www.snapchat.com的数据之旅

概述 Snapchat是一款流行的社交媒体应用&#xff0c;它允许用户发送和接收带有滤镜和贴纸的照片和视频&#xff0c;以及创建和观看故事和发现内容。Snapchat的数据是非常有价值的&#xff0c;因为它可以反映用户的行为、偏好和趋势。然而&#xff0c;Snapchat的数据并不容易获…

【LMM 009】MiniGPT-4:使用 Vicuna 增强视觉语言理解能力的多模态大模型

论文描述&#xff1a;MiniGPT-4: Enhancing Vision-Language Understanding with Advanced Large Language Models 论文作者&#xff1a;Deyao Zhu∗ Jun Chen∗ Xiaoqian Shen Xiang Li Mohamed Elhoseiny 作者单位&#xff1a;King Abdullah University of Science and Techn…

亚信安慧AntDB数据库:企业核心业务系统数据库升级改造的可靠之选

在近期召开的“2023年国有企业应用场景发布会”上&#xff0c;亚信安慧公司的核心数据库产品AntDB闪耀登场&#xff0c;技术总监北陌先生针对企业核心业务系统数据库升级改造的关键议题发表了深度分享。他从研发、工程实施和运维管理三个维度细致剖析了当前企业在进行数据库升级…

Python - 深夜数据结构与算法之 DP - 进阶

目录 一.引言 二.经典算法实战 1.House-Robber [198] 2.House-Robber-2 [213] 3.Best-Sell-Time [121] 4.Best-Sell-Time-2 [122] 5.Best-Sell-Time-3 [123] 6.Best-Sell-Time-4 [188] 7.Best-Sell-Time-Coldown [309] 8. Best-Sell-Time-Fee [714] 三.总结 一.引言…

【React系列】父子组件通信—props属性传值

本文来自#React系列教程&#xff1a;https://mp.weixin.qq.com/mp/appmsgalbum?__bizMzg5MDAzNzkwNA&actiongetalbum&album_id1566025152667107329) 一. 认识组件的嵌套 组件之间存在嵌套关系&#xff1a; 在之前的案例中&#xff0c;我们只是创建了一个组件App&…

基于粒子群算法的参数拟合,寻优算法优化测试函数

目录 摘要 测试函数shubert 粒子群算法的原理 粒子群算法的主要参数 粒子群算法原理 粒子群算法参数拟合 代码 结果分析 展望 基于粒子群算法的参数拟合(代码完整,数据齐全)资源-CSDN文库 https://download.csdn.net/download/abc991835105/88698417 摘要 寻优算法,测试…

后端开发——JDBC的学习(三)

本篇继续对JDBC进行总结&#xff1a; ①通过Service层与Dao层实现转账的练习&#xff1b; ②重点&#xff1a;由于每次使用连接就手动创建连接&#xff0c;用完后就销毁&#xff0c;这样会导致资源浪费&#xff0c;因此引入连接池&#xff0c;练习连接池的使用&#xff1b; …

x-cmd pkg | tig - git 文本模式界面

目录 简介首次用户功能特点类似工具与竞品进一步探索 简介 tig 由 Jonas Fonseca 于 2006 年使用 C 语言创建的 git 交互式文本命令行工具。旨在开启交互模式快速浏览 git 存储库的信息以及 git 命令的运行。 首次用户 使用 x tig 即可自动下载并使用 在终端运行 eval "…

微服务之间互相调用出现的错误

场景&#xff1a; 微服务A调用微服务B的接口&#xff0c;微服务B的接口请求方式是get类型&#xff0c;传递的参数是JSON格式。 错误&#xff1a; 1、postman&#xff1a;springframework.http.converter.HttpMessageNotReadableException: JSON parse error: Cannot deserial…

Gin 框架介绍与快速入门

Gin 框架介绍与快速入门 文章目录 Gin 框架介绍与快速入门一、Gin框架介绍1. 快速和轻量级2. 路由和中间件3. JSON解析4. 支持插件5. Gin相关文档 二、基本使用1.安装2.导入3.第一个Gin 应用 三、应用举例四、Gin 入门核心1.gin.Engine2.gin.Context 一、Gin框架介绍 Gin是一个…

VitePress搭建Vite官方中文文档首页

✨专栏介绍 在当今数字化时代&#xff0c;Web应用程序已经成为了人们生活和工作中不可或缺的一部分。而要构建出令人印象深刻且功能强大的Web应用程序&#xff0c;就需要掌握一系列前端技术。前端技术涵盖了HTML、CSS和JavaScript等核心技术&#xff0c;以及各种框架、库和工具…

FinGPT——金融领域开源大模型

文章目录 背景论文摘要相关工作大型语言模型&#xff08;LLMs&#xff09;和ChatGPT金融领域的LLMs为什么需要开源的金融LLMs&#xff1f; 以数据为中心的方法用于FinLLMs金融数据和独特特性应对处理金融数据的挑战 FINGPT 概述&#xff1a;FINLLM 的开源框架数据来源面向金融N…

【常用排序算法】冒泡排序

冒泡排序 冒泡排序基本思想&#xff1a;N 个数的数组&#xff0c;经过N-1轮排序。 升序 大的值下沉&#xff0c;小的值上浮。降序 小的值下沉&#xff0c;小的字上浮 import java.util.Arrays; public class BubbleSort {public static void main(String[] args) {int[] values…

Git 对项目更新的时候提示错误 repository not owned by current user

遇到 Git 提示的错误信息为&#xff1a;repository not owned by current user 上图显示的是错误的信息。 问题和解决 出现上面错误信息的原因是当前文件夹的权限和 Git 的执行权限不一直导致的。 我们的问题是我们希望在网盘上使用 Git 更新克隆后的代码&#xff0c;但登录…

React Hook 原理,及如何使用Hook

一、 Hook使用规则 只在最顶层使用Hook 不要在循环&#xff0c;条件或嵌套函数中调用Hook&#xff1b; 只在组件函数和自定义hook中调用Hook Q1 &#xff1a; 为什么 hook 不能 在循环&#xff0c;条件或嵌套函数中调用Hook &#xff1f; A1&#xff1a; 因为这跟React的…

使用Kafka与Spark Streaming进行流数据集成

在当今的大数据时代&#xff0c;实时数据处理和分析已经变得至关重要。为了实现实时数据集成和分析&#xff0c;组合使用Apache Kafka和Apache Spark Streaming是一种常见的做法。本文将深入探讨如何使用Kafka与Spark Streaming进行流数据集成&#xff0c;以及如何构建强大的实…