DSA数据结构与算法 6

查找技术(Searching Techniques)


查找简介

在计算机科学中,“查找”指的是在某个集合或序列中寻找特定元素的过程。这个过程可以是成功的,也可以是失败的:

  • 若目标元素存在于集合中,我们称之为“查找成功”,并返回它在集合中的位置;
  • 若元素不存在,则称为“查找失败”。

查找是数据处理中的基本操作之一,几乎出现在所有软件系统的核心逻辑中。比如搜索联系人、检索图书、匹配登录密码等,背后都离不开查找算法。

而不同的查找算法之间最大的差异,通常体现在“查找的效率”上。这个效率,很大程度上依赖于数据本身的“排列方式”——是否已排序。因此,我们在选择查找方法时,必须考虑数据的特征。


本章将介绍两种最基础的查找技术:

1. 线性查找(Linear Search)

又名“顺序查找”,是最直观的查找方式。算法从第一个元素开始,依次与目标值进行比较,直到找到为止,或遍历完所有元素。

这种方法的优势是实现简单,不要求数据有序;缺点是效率较低,特别是在数据量大的时候。

一个类比:想象你正在翻找一个装满扑克牌的盒子,想找一张红桃 7。如果这些牌是杂乱无章地放着的,你只能一张张翻阅,直到找到为止——这就是线性查找的过程。

def linear_search(arr, target):steps = []  # 每一步的状态for i in range(len(arr)):status = {'array': arr.copy(),'index': i,'found': arr[i] == target}steps.append(status)if arr[i] == target:break  # 找到目标值就提前退出return steps

请添加图片描述

二分查找(Binary Search)

二分查找是一种高效的查找方法,但它有一个前提条件:待查找的列表必须是有序的。也就是说,在使用二分查找之前,我们要确保数据已经按照升序或降序排列好,否则该算法将无法正常工作。


✦ 二分查找的核心思想:分而治之(Divide and Conquer)

具体过程如下:

  1. 将数组从中间分成两部分;
  2. 将目标值与中间元素进行比较:
    • 如果相等,则查找成功,返回该位置;
    • 如果目标值小于中间元素,说明目标在左半部分;
    • 如果目标值大于中间元素,说明目标在右半部分;
  3. 仅在可能存在目标值的一半继续查找;
  4. 重复上述步骤,直到找到目标或范围为空为止。

这种方法的效率极高:每次查找操作都将问题规模减半,时间复杂度为 O ( log ⁡ 2 n ) O(\log_2 n) O(log2n),远优于线性查找的 O ( n ) O(n) O(n),尤其在数据量较大时优势更加明显。


def binary_search(arr, target):steps = []low = 0high = len(arr) - 1while low <= high:mid = (low + high) // 2step = {'array': arr.copy(),'low': low,'high': high,'mid': mid,'found': arr[mid] == target}steps.append(step)if arr[mid] == target:breakelif arr[mid] < target:low = mid + 1else:high = mid - 1return steps

请添加图片描述


插值查找(Interpolation Search)

  • 适用条件: 数据必须是有序且分布均匀
  • 核心思想: 预测目标值可能出现的位置,而不是死板地取中间值

m i d = l o w + ( t a r g e t − a r r [ l o w ] ) ⋅ ( h i g h − l o w ) a r r [ h i g h ] − a r r [ l o w ] mid = low + \frac{(target - arr[low]) \cdot (high - low)}{arr[high] - arr[low]} mid=low+arr[high]arr[low](targetarr[low])(highlow)

  • 时间复杂度:
    • 最好: O ( log ⁡ log ⁡ n ) O(\log \log n) O(loglogn)
    • 最坏: O ( n ) O(n) O(n)(分布极度不均)

请添加图片描述


跳跃查找(Jump Search)

  • 适用条件: 有序数组
  • 核心思想: 以固定步长(如 n \sqrt{n} n )跳跃前进,找到目标所在区间后回退线性查找
  • 时间复杂度: O ( n ) O(\sqrt{n}) O(n )

请添加图片描述


哈希查找(Hash Search)

  • 适用条件: 查找速度要求极高,数据量大,结构可以牺牲顺序
  • 核心思想: 使用哈希函数将关键字映射到数组中的某个索引位置
  • 优势: 插入和查找时间复杂度通常为 O ( 1 ) O(1) O(1)
  • 挑战: 哈希冲突(如链地址法、开放定址法)

请添加图片描述


二叉搜索树(Binary Search Tree, BST)

  • 结构性质: 左子树 < 根 < 右子树
  • 时间复杂度:
    • 平均: O ( log ⁡ n ) O(\log n) O(logn)
    • 最坏: O ( n ) O(n) O(n)(退化成链表)

请添加图片描述


平衡二叉搜索树(AVL 树、红黑树等)

  • 特性: 自动保持“树的高度”平衡,防止性能退化
  • 优势: 所有操作最坏时间复杂度为 O ( log ⁡ n ) O(\log n) O(logn)
  • 适用: 高频插入+查找操作,如操作系统调度、缓存结构

请添加图片描述


B 树 / B+ 树

  • 用途: 用于数据库、文件系统等对磁盘IO优化要求极高的场景
  • 特点:
    • 多路搜索,不是二叉结构
    • 每个节点包含多个关键字
  • 优势: 能减少磁盘访问次数,支持批量范围查找

请添加图片描述


深度优先搜索(DFS)与广度优先搜索(BFS)

  • 应用场景: 图结构查找、路径规划、社交网络分析等
  • 特点:
    • DFS:适合探索所有路径(回溯)
    • BFS:适合找最短路径或分层结构

指数查找(Exponential Search)

  • 应用场景: 无法直接知道数据规模,如“无限数组”
  • 过程:
    1. 快速扩大查找范围(1, 2, 4, 8…)
    2. 找到目标值所在的范围后使用二分查找
  • 时间复杂度: O ( log ⁡ i ) O(\log i) O(logi),其中 i i i 为目标位置

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/77477.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FastAPI:现代高性能Python Web框架的技术解析与实践指南

一、FastAPI的诞生背景与技术定位 在数字化转型的浪潮中,API(应用程序接口)作为连接服务与数据的核心枢纽,其性能与开发效率直接影响业务迭代速度。传统Python框架如Django和Flask虽功能丰富,但在高并发场景下面临性能瓶颈,且缺乏对异步编程的原生支持。FastAPI应运而生…

VuePress 使用教程:从入门到精通

VuePress 使用教程&#xff1a;从入门到精通 VuePress 是一个以 Vue 驱动的静态网站生成器&#xff0c;它为技术文档和技术博客的编写提供了优雅而高效的解决方案。无论你是个人开发者、团队负责人还是开源项目维护者&#xff0c;VuePress 都能帮助你轻松地创建和管理你的文档…

1.Vue自动化工具安装(Vue-cli)

目录 1.node.js 安装&#xff1a; 2 npm 安装 3 安装Vue-cli 4总结&#xff1a; 一般情况下&#xff0c;单文件组件&#xff0c;我们运行在 自动化工具vue-CLI中&#xff0c;可以帮我们编译单文件组件。所以我们在学习时一般需要在系统中先搭建vue-CLI工具 下面就是一些我…

IP数据报

IP数据报组成 IP数据报&#xff08;IP Datagram&#xff09;是网络中传输数据的基本单位。 IP数据报头部 版本&#xff08;Version&#xff09; 4bit 告诉我们使用的是哪种IP协议。IPv4版本是“4”&#xff0c;IPv6版本是“6”。 头部长度&#xff08;IHL&#xff0c;Intern…

Leetcode 2158. 每天绘制新区域的数量【Plus题】

1.题目基本信息 1.1.题目描述 有一幅细长的画&#xff0c;可以用数轴来表示。 给你一个长度为 n 、下标从 0 开始的二维整数数组 paint &#xff0c;其中 paint[i] [starti, endi] 表示在第 i 天你需要绘制 starti 和 endi 之间的区域。 多次绘制同一区域会导致不均匀&…

Git Flow

Git Flow深度解析&#xff1a;企业级分支管理实战指南 前言 在持续交付时代&#xff0c;分支策略决定团队协作效率。Git Flow作为经典的分支管理模型&#xff0c;被Apache、Spring等知名项目采用。2023年JetBrains开发者调查报告显示&#xff0c;Git Flow仍是中大型项目最常用…

[Swift]pod install成功后运行项目报错问题error: Sandbox: bash(84760) deny(1)

操作&#xff1a; platform :ios, 14.0target ZKMKAPP do# Comment the next line if you dont want to use dynamic frameworksuse_frameworks!# Pods for ZKMKAPPpod Moyaend pod install成功后运行报错 报错&#xff1a; error: Sandbox: bash(84760) deny(1) file-writ…

[管理与领导-129]:向上管理-组织架构、股权架构、业务架构、流程架构,看每个人在组织中的位置和重要性

目录 一、股权架构&#xff1a;反映所有权与控制权 二、组织架构&#xff1a;定义角色与汇报关系 三、业务架构&#xff1a;定义业务单元与价值链 四、流程架构&#xff1a;规范业务运作与协作 五、综合分析&#xff1a;个人在组织中的综合影响力 六、案例&#xff1a;某…

小红书爬虫,小红书api,小红书数据挖掘

背景&#xff1a; 小红书&#xff08;Xiaohongshu&#xff09;是一款结合社交、购物和内容分享的移动应用&#xff0c;近年来在中国以及全球范围内拥有大量的用户群体。小红书上的内容包括用户的消费体验、生活方式、旅行分享、时尚搭配等。通过这些内容&#xff0c;用户可以了…

玩转Docker | 使用Docker部署tududi任务管理工具

玩转Docker | 使用Docker部署tududi任务管理工具 前言一、tududi介绍Tududi简介核心功能特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署tududi服务下载镜像创建容器创建容器检查容器状态检查服务端口安全设置四、访问tududi服务访问tududi首页登录tu…

大屏设计与汇报:政务服务可视化实践

大屏设计与汇报:政务服务可视化实践 引言 在政务服务数字化转型浪潮中,大屏设计成为展现业务能力与数据价值的关键手段。本文围绕政务大屏设计,从设计要点、业务逻辑到汇报技巧展开深入探讨,为相关从业者提供全面参考。 一、大屏设计核心要点 (一)多维度考量 设计大…

字节(抖音)golang后端

Golang知道哪些并发模式&#xff0c;你觉得哪个更好&#xff0c;为什么 在使用channel的时候有哪些需要考虑和注意的地方 进程和线程的区别 线程里有哪些字段 TCP和UDP的区别&#xff0c;各自的优劣势 TCP 更适合需要可靠性、顺序和连接管理的场景&#xff0c;如文件传输和网页…

Python语法系列博客 · 第6期[特殊字符] 文件读写与文本处理基础

上一期小练习解答&#xff08;第5期回顾&#xff09; ✅ 练习1&#xff1a;字符串反转模块 string_tools.py # string_tools.py def reverse_string(s):return s[::-1]调用&#xff1a; import string_tools print(string_tools.reverse_string("Hello")) # 输出…

Unity运行时查看日志插件 (IngameDebugConsole)

Unity运行时查看日志插件 (IngameDebugConsole) 文章目录 Unity运行时查看日志插件 (IngameDebugConsole)一、介绍二、使用步骤1.导入插件2.开始使用 结束 一、介绍 In-game Debug Console插件可以在打包发布以后&#xff0c;程序运行时方便的看到控制台信息&#xff0c;在一些…

spark-SQL核心编程课后总结

通用加载与保存方式 加载数据&#xff1a;Spark-SQL的 spark.read.load 是通用加载方法&#xff0c;借助 format 指定数据格式&#xff0c;如 csv 、 jdbc 、 json 等&#xff1b; load 用于指定数据路径&#xff1b; option 在 jdbc 格式时传入数据库连接参数。此外&#xff0…

蔡浩宇的AIGC游戏革命:从《原神》到《Whispers》的技术跨越

目录 引言&#xff1a;游戏行业的AI革命前夜 一、《Whispers》的技术突破与市场挑战 1.1 多模态AI技术的集成应用 1.2 与传统游戏的差异化体验 1.3 面临的商业化难题 二、从《原神》到《Whispers》的技术演进 2.1 《原神》成功的时代因素分析 2.2 蔡浩宇的技术路线转变 …

Spring Boot中定时任务Cron表达式的终极指南

Spring Boot中定时任务Cron表达式的终极指南 一、Cron表达式基础二、Spring Boot中定时任务的实现三、Cron表达式高级用法四、调试与验证技巧五、常见问题与解决方案六、最佳实践总结 定时任务是后端开发中实现周期性业务逻辑的核心技术之一。在Spring Boot生态中&#xff0c;结…

国产SMT贴片机自主技术突破解析

内容概要 随着电子信息产业对精密制造需求的持续升级&#xff0c;国产SMT贴片机的技术突破已成为装备自主化进程的关键节点。本文聚焦设备研发的三大核心领域&#xff1a;高动态运动控制系统通过线性电机与数字信号处理技术的融合&#xff0c;将重复定位精度提升至5μm级别&am…

uni-app 安卓10以上上传原图解决方案

在Android 10及以上版本中&#xff0c;由于系统对文件访问的限制&#xff0c;使用chooseImage并勾选原图上传后&#xff0c;返回的是图片的外部存储路径&#xff0c;如&#xff1a;file:///storage/emulated/0/DCIM/Camera/。这种外部存储路径&#xff0c;无法直接转换成所需要…

迭代器模式:统一不同数据结构的遍历方式

迭代器模式&#xff1a;统一不同数据结构的遍历方式 一、模式核心&#xff1a;分离数据遍历与数据表示 在开发中&#xff0c;我们经常需要遍历不同的数据结构&#xff0c;如数组、链表、树等。若在客户端代码中直接编写遍历逻辑&#xff0c;不仅会导致代码冗余&#xff0c;而…