查找算法详解

1、查找的基本概念

查找也即检索

文件:由记录组成的集合,即含有大量数据的元素线性组合而成。
记录:由若干数据项组成的数据元素,这些数据项也常称作记录中的数据域,用以表示某个状态的物理意义。
关键字:用以区分文件中记录的数据项的值。若此关键字可以惟一地标识一个记录,则称此关键字为主关键字。也就是说,对于不同的记录,其对应的主关键字的值均不相同。若数据元素只有一个数据项,其关键字即为该数据元素的值。

查找是指根据给定的某个值,确定关键字值,查询确定关键字值与给定值相等的记录在文件中的位置。它是程序设计中一项重要的基本技术。查找的结果有两种情况:若在文件中找到了待查找的记录,则称查找成功,这时可以得到该记录在文件中的位置,或者得到该记录中其他的信息;若在文件中没有找到所需要的记录,则称查找不成功或查找失败,这时,相应的查找算法给出查找失败的信息,同时也得到记录插入文件的位置。

查找可分为静态查找和动态查找两种,在查找过程中不修改查找表的长度和表中内容的方法称作静态查找,反之称作动态查找

2、查找算法的评价指标

平均查找长度(ASL): 在查找的过程中,一次查找的长度是指需要比较的关键字次数,而平均查找长度则是所有查找过程中进行关键字的比较次数的平均值。

  • n:记录的个数
  • pi:查找第i个记录的概率 ( 通常认为pi =1/n )
  • ci:找到第i个记录所需的比较次数

3、静态查找表

3.1 顺序查找

1)应用范围

顺序表或线性链表表示的静态查找表

2)顺序表的表示

typedef struct { //查找表的数据结构ElemType *R; //元素存储空间基址int length; //表的长度
}SSTable;

3)性能分析

  • 查找成功时的平均查找长度(设表中各记录查找概率相等):ASL=(1+2+ … +n)/n =(n+1)/2
  • 查找不成功时的平均查找长度:ASL =n+1

4)特点

  • 算法简单,对表结构无任何要求(顺序和链式)。
  • n很大时,平均查找长度较大,查找效率较低
  • 改进措施:非等概率查找时,可按照查找概率进行排序
3.2 折半查找

1)算法思想:

设表长为n,low、high和mid分别指向待查元素所在区间的上界、下界和中点,k为给定值:

  • 初始时,令low=1, high=n, mid=(low+high)/2;

  • 让k与mid指向的记录比较:若k = R[mid].key,查找成功若k < R[mid].key,则high=mid-1若k > R[mid].key,则low=mid+1;

  • 重复上述操作,直至low>high时,查找失败。

2)折半查找的性能分析:

  • 查找过程:每次将待查记录所在区间缩小一半,比顺序查找效率高,时间复杂度O(log2 n)
  • 适用条件:采用顺序存储结构的有序表,不宜用于链式结构
3.3 分块查找(块间有序,块内无序)

分块有序,即分成若干子表,要求每个子表中的数值都比后一块中数值小(但子表内部未必有序)。 然后将各子表中的最大关键字构成一个索引表,表中还要包含每个子表的起始地址(即头指针)。

1)分块查找过程:

  • 对索引表使用折半查找法(因为索引表是有序表)
  • 确定了待查关键字所在的子表后,在子表内采用顺序查找法(因为各子表内部是无序表)

2)分块查找优缺点:

  • 优点:插入和删除比较容易,无需进行大量移动。
  • 缺点:要增加一个索引表的存储空间并对初始索引表进行排序运算。
  • 适用情况:若线性表既要快速查找又经常动态变化,则可采用分块查找

3)分块查找的性能分析

分块查找的平均长度为索引查找和块内查找的平均长度值和。设索引查找和块内查找的平均长度分别为 L1,L2,则分块查找的平均查找长度为

4、B树和B+树

B树是一种多路平衡查找树,它的每一个结点最多包含 m 个孩子,m 被称为 B 树的阶。

B树主要应用于文件系统以及部分数据库索引,比如 MongoDB。

而大部分关系型数据库,比如 Mysql,则使用 B+ 树作为索引。

一个m阶的B树具有如下几个特征:

  • 树中每个结点至多有 m 棵子树,即至多含有 m-1 个关键字
  • 若根节点不是终端结点,则至少有两颗子树。
  • 除根节点外的所有非叶结点至少有⌈m/2⌉棵子树,即至少有⌈m/2⌉ - 1 个关键字
  • 所有的叶子结点都位于同一层,且不带信息。
  • 每个节点中的元素从小到大排列

B树的高度

若 n ≥ 1,则对任意一棵包含 n 个关键字、高度为 h 、阶数为 m 的 B 树。

h ≥ logm(n+1),h ≤ log⌈m/2⌉((n+1)/2)+1。

一个m阶的B+树具有如下特征:

  • 每个分支最多有 m 棵子树。
  • 非叶根节点至少有两颗子树,其他每个分支结点至少有 ⌈m/2⌉ 棵子树
  • 结点子树个数与关键字个数相等
  • 所有分支结点中仅包含它的各个子结点(即下一级的索引块)中关键字的最大值及指向其子结点的指针。
  • 所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接。
  • 在 B+ 树中,叶结点包含了全部关键字,即在非叶结点中出现的关键字也会出现在叶结点中;而在 B 树中,叶结点包含的关键字和其他结点包含的关键字是不重复的。

B+树的优势:

  • 单一节点存储更多的元素,使得查询的IO次数更少。
  • 所有查询都要查找到叶子节点,查询性能稳定。
  • 所有叶子节点形成有序链表,便于范围查询。

5、哈希表的查找

1)基本思想:记录的存储位置与关键字之间存在对应关系

优点:查找速度极快,为O(1),查找效率与元素个数n无关。

装填因子

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483437.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高文院士:中国在AI领域有哪些长板和短板

10月25日&#xff0c;在第四届世界声博会暨2021科大讯飞全球1024开发者节上&#xff0c;中国工程院院士高文通过线上方式发表演讲来源&#xff1a;笑看国际风云、央广网、集微网、中国科学报10月25日&#xff0c;第四届世界声博会暨2021科大讯飞全球1024开发者节在安徽合肥开幕…

SpringBoot学习笔记(16)----SpringBoot整合Swagger2

Swagger 是一个规范和完整的框架&#xff0c;用于生成&#xff0c;描述&#xff0c;调用和可视化RESTful风格的web服务 http://swagger.io Springfox的前身是swagger-springmvc,是一个开源的API doc框架&#xff0c;可以将我们的Controller接口的方法以文档的形式展现&#xff…

Jeff Dean亲自揭秘谷歌下一代AI架构:通用、稀疏且高效,网友不买帐:毫无新意...

来源&#xff1a;机器之心在这波 AI 浪潮中&#xff0c;人工智能技术经过十几年的爆发式发展&#xff0c;已经在各个领域有着极为广泛的应用&#xff0c;如医疗、科学研究、汽车等。但是随着技术发展的缓慢&#xff0c;以深度学习为代表的人工智能技术瓶颈开始凸显。今年 8 月份…

排序算法笔记(Java)

package datastructure;import java.util.Arrays; import java.util.Scanner;public class Sort {static int len; //声明全局变量&#xff0c;用于记录arr的长度public static void main(String[] args) {Scanner sc new Scanner(System.in);String str sc.nextLine();Strin…

计算机网络——时延、时延带宽积、RTT和利用率

1.什么是时延 \qquad数据&#xff08;报文/分组/比特流&#xff09;从网络的一端传送到网络另外一端所需的时间。也叫延迟或者迟延&#xff0c;单位是s 2.时延的种类 2.1 发送时延&#xff08;传输时延&#xff09; \qquad从发送分组的第一个比特算起&#xff0c;到该分组的最…

强人工智能与泛心论

来源&#xff1a;哲社院后台原载于《科学经济社会》2021年第39卷第3期第52~59页作者简介&#xff1a;陈敬坤&#xff0c;1981年1月生。哲学博士&#xff0c;山西大学哲学社会学学院副教授&#xff0c;曾赴比利时布鲁塞尔自由大学、美国匹兹堡大学等作学术访问。研究领域主要为心…

第一章 Linux是什么

Linux是核心与系统调用接口两层中间的操作系统不同硬件的功能函数并不相同&#xff0c;IBM的Power CPU与Inter的x86架构不同&#xff0c;所以同一套操作系统是不能在不同的硬件平台上面运行的。也就是说&#xff0c;每种操作系统都是在他专门的硬件机器上面运行的。不过&#x…

计算机网络——分层结构,协议,接口和服务

1.为什么要分层&#xff1f; \qquad当有两台主机&#xff0c;A向B通过网络发送文件&#xff0c;在发送文件前需要完成这么几件事情&#xff1a;1&#xff09;A必须将数据通信的通路进行激活&#xff1b;2&#xff09;要告诉网络如何识别目的主机B&#xff1b;3&#xff09;A要查…

官宣!全球首富马斯克:创办这所“新大学”!

埃隆马斯克&#xff08;Elon Musk&#xff09;是特斯拉和SpaceX的创始人兼首席执行官。来源&#xff1a;青塔编辑&#xff1a;nhyilin美国《福布斯》杂志10月26日称&#xff0c;得益于特斯拉股价大涨&#xff0c;特斯拉CEO埃隆马斯克的财富跃升至近3000亿美元&#xff0c;不仅是…

“传统”遥感遇上AI,会产生怎样的效果?

来源&#xff1a;微信公众号人民网责编&#xff1a;翟巧红编辑&#xff1a;张素玲&#xff1b;作者&#xff1a;龚健雅 中国科学院院士、武汉大学教授&#xff1b;新一轮科技革命和产业变革的大幕早已掀开。作为全球科技竞争的制高点&#xff0c;人工智能已经成为世界主要国家推…

记录一次双系统安装

条件 1、U盘 2、UltraISO软件 官网 3、ISO镜像 ubuntu官网 压缩卷&#xff0c;获得空闲空间安装ubuntu 1、点击winx&#xff0c;进入磁盘管理&#xff0c;选择一个空间够大的硬盘进行分区 2、选择你要压缩的卷&#xff0c;比如D盘&#xff0c;右击&#xff0c;压缩卷&#xff0…

操作系统 —— 内存管理

目录一、思维导图二、内存的基础知识2.1 什么是内存&#xff1f;2.2 存储单元2.3 逻辑地址和物理地址2.4 编译、链接、装入2.4.1 编译2.4.2 链接链接的三种方式 :2.4.3 装入装入的三种方式:三、内存保护四、内存空间的扩充4.1 覆盖与交换4.1.1 覆盖技术4.1.2 交换技术4.2 虚拟内…

【前沿技术】10年内,19个关键技术将改变世界

来源&#xff1a;智能研究院据国外媒体报道&#xff0c;从无人驾驶汽车到机器人工人&#xff0c;在我们熟悉所有这一切之前&#xff0c;未来正迎面走来。根据世界经济论坛全球议程理事会关于《未来软件与社会》的一份报告&#xff0c;到2025年前&#xff0c;很多新兴技术将会达…

计算机网络——TCP/IP参考模型和五层参考模型

1.OSI参考模型和TCP/IP参考模型的对比 \qquad相同点&#xff1a;1)都分层&#xff1b;2&#xff09;都是基于独立的协议栈的概念 &#xff1b;3&#xff09;可以实现异构网络的互联 \qquad不同点&#xff1a;1&#xff09;OSI定义了三点&#xff1a;服务&#xff0c;协议和接口…

Github+docsify打造在线文档网站

写在前面 搭建这个在线文档的目的是方便自己对学习笔记的查看&#xff0c;比较喜欢 docsify 的主题风格&#xff0c;所以没有用 Github Pages 直接给的主题&#xff0c;自己根据官方文档进行了配置&#xff0c;目前已经成功上线。 1 效果图 可直接访问&#xff1a;https://x…

计算机网络——物理层基本概念

1.物理层的任务 \qquad将各种计算机的传输媒体进行物理连接&#xff0c;为设备间的数据传输做好准备。由此&#xff0c;我们需要确定传输媒体的接口特性。 2.传输媒体的接口特性 2.1 机械特性 \qquad定义物理连接的特性&#xff0c;比如连接规格&#xff0c;接口形状&#xf…

《Cell》新发现!“第二大脑”的反击

图像:巨噬细胞(绿色)包围肠道神经元(红色)。资料来源:洛克菲勒大学黏膜免疫学实验室来源&#xff1a;生物通一个简单的胃病就能造成很大的伤害。有1亿个神经元散布在胃肠道中——就在火线上——它们可能被肠道感染消灭&#xff0c;可能导致长期的胃肠道疾病。但肠道感染也有好处…

操作系统 —— 文件管理

目录1. 文件的简介1.1. 文件的属性1.2. 文件的分类1.2.1. 无结构文件&#xff08;流式文件&#xff09;1.2.2. 有结构文件&#xff08;记录式文件&#xff09;1.3 操作系统应向上提供哪些功能2. 文件的逻辑结构2.1 逻辑结构 vs 物理结构2.2 有结构文件的逻辑结构2.2.1 顺序文件…

vue-todolist

http://todolist.cn/ App.vue <template><div><div>大家好&#xff0c;我叫技术高超</div><div>大家好&#xff0c;我叫{{name}}</div><input type"text" v-model"name"><hr><input type"text&qu…

重磅!监管再升级!微信、淘宝、抖音或将纳入“超级平台”监管

来源&#xff1a;网易新闻&#xff1a;中国证券报编辑&#xff1a;郑雅烁对于互联网巨头监管&#xff0c;又有新举措。10月29日&#xff0c;国家市场监督管理总局公布了《互联网平台分类分级指南&#xff08;征求意见稿&#xff09;》《互联网平台落实主体责任指南&#xff08;…