「数据结构」哈希表1:基本概念

🎇个人主页:Ice_Sugar_7
🎇所属专栏:Java数据结构
🎇欢迎点赞收藏加关注哦!

基本概念

  • 🍉哈希表
  • 🍉哈希冲突
    • 🍌负载因子调节
    • 🍌解决哈希冲突
      • 🥝1. 闭散列法
      • 🥝2. 开散列法(哈希桶)

🍉哈希表

哈希表是一种数据结构,它使用哈希函数将键映射到数组中的一个位置(即将元素的存储位置和它的key之间建立映射关系)

  • 在存储一个键值对时,哈希函数根据key计算出一个索引(哈希地址),然后将键值对存储在对应的索引位置上

举个例子:

数据集合{1,7,6,4,5,9}
哈希函数设置为:hash(key) = key % capacity(capacity为存储元素底层空间的大小)

那我们可以推出每个元素存储的位置为
在这里插入图片描述

  • 在搜索元素时,对元素的key进行同样的计算,把求得的函数值当做元素的存储位置,在哈希表中取这个位置的元素进行比较,若key相等,则搜索成功

因为通过哈希函数计算得到的索引可以直接指向元素所在的位置,所以在理想情况下,查找、插入和删除操作的时间复杂度可以达到O(1)


🍉哈希冲突

不同的关键字通过相同的哈希函数计算出相同的哈希地址,该种现象称为哈希冲突

造成哈希冲突的原因之一是:哈希函数设计不够合理
我们在设计哈希函数时,应遵循:

  1. 哈希函数的定义域需要包括所有待存储的关键码
  2. 计算出来的哈希地址能均匀分布在整个空间中
  3. 哈希函数应该比较简单

🍌负载因子调节

哈希表载荷因子定义为 α = 填入表中的元素个数 / 哈希表长度
α越大,表明填入表中的元素越多,发生冲突的可能性越大
当α超过一定阈值时,会触发哈希表的扩容操作

在Java中,HashMap默认负载因子是0.75,0.75是一个被认为在时间和空间效率上做了平衡的经验值,它既保证了空间的有效利用,又尽量减少了冲突的发生,是一个相对较优的选择。

负载因子和冲突率的关系粗略演示:
在这里插入图片描述

我们可以通过降低负载因子来降低冲突率,因为哈希表中已有的关键字个数是不可变的,那么我们能调整的就只有哈希表中的数组的大小
注意:哈希表扩容后,需要重新计算里面的关键字的哈希地址

🍌解决哈希冲突

解决哈希冲突两种常见的方法是:闭散列开散列

🥝1. 闭散列法

也叫开放定址法,发生哈希冲突时,如果哈希表未被装满,说明在哈希表中必然还有空位置,那么可以把key存放到冲突位置的“下一个”空位置中
那怎么找空位置呢?

  • 线性探测
    从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止
    比如对于刚才上面的例子:
    在这里插入图片描述
    如果要插入44,那它会和4产生冲突,采用线性探测解决冲突的话,那就会插入到下标为8这个空位置在这里插入图片描述

线性探测的缺陷是产生冲突的数据堆积在一块,这与其找下一个空位置有关系,因为找空位置的方式就是挨着往后逐个去找。如果表中只填入4,而接下来要填入44,14,24,34一系列数字的话:
在这里插入图片描述
采用二次探测可以避免这个问题

  • 二次探测
    二次探测通过下面的公式算出要插入哪个空位置
    在这里插入图片描述

比如对于上面的例子,使用二次探测解决冲突后得到:
在这里插入图片描述

🥝2. 开散列法(哈希桶)

又叫链地址法、开链法
先用哈希函数算出每个关键码的哈希地址,具有相同地址的关键码归于同一子集合,每个子集合称为一个,各个桶中的元素通过一个单链表链接起来,各链表的头结点存储在哈希表中
在这里插入图片描述
从这个图可以看出:开散列中每个桶放的都是发生哈希冲突的元素

  • 在一些哈希表的实现中,当哈希桶中的链表长度超过一定阈值时,可能会将链表转换为红黑树。因为当链表长度较长时,查找、插入和删除操作的时间复杂度会变得较高,而红黑树的时间复杂度相对较低,将链表转换为红黑树可以提高哈希表的性能
  • 在JDK 8中的HashMap实现中,当链表长度超过8个元素时,会将链表转换为红黑树

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/680841.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

34 使用 LNMP 架构部署动态网站环境

源码包程序 LNMP 动态网站部署架构 LNMP 动态网站部署架构是一套由 Linux Nginx MySQL PHP 组成的动态网站系统 解决方案。 1. 准备工作 在使用源码包安装服务程序之前,首先要让安装主机具备编译程序源码的环境。这需要 具备 C 语言、C语言、Perl 语言的编译器&…

域名解析大概过程笔记

不同情况下处理方式有所不同: 输入域名访问: 浏览器首先会检查本地缓存,看是否有对应域名的解析记录。如果本地缓存没有,浏览器会查找操作系统的 hosts 文件,看是否有对应的 IP 地址。如果 hosts 文件中没有&#xff0…

【QT+QGIS跨平台编译】之三十七:【Shapelib+Qt跨平台编译】(一套代码、一套框架,跨平台编译)

文章目录 一、Shapelib介绍二、Shapelib下载三、文件分析四、pro文件五、编译实践一、Shapelib介绍 Shapelib是一个开源的C库,用于读取、写入和操作ESRI Shapefile格式的地理矢量数据。 ESRI Shapefile是一种常见的地理信息系统(GIS)文件格式,用于存储地理矢量数据,包括…

【Linux系统学习】2.Linux基础命令

Linux基础命令 Linux的目录结构 Linux命令入门 目录切换相关命令(cd/pwd) 相对路径、绝对路径和特殊路径符 创建目录命令(mkdir) 文件操作命令part1(touch、cat、more) 文件操作命令part2(cp、mv、rm) 查找命令(which、find) grep、wc和管道符…

AI绘画作品的展示和变现-2

4.7 制作红包封面 中国的节日和传统文化元素仍然可以成为创作者们的创作灵感,创造出更多的变现机会。比如元宵节,可以制作大型元宵图案,进行引流并卖出元宵。 而春分、谷雨等节气也可以成为创作的灵感来源,创作出与之相关的图案&…

高中时期,三次下棋惨败经历

我不是很聪明,也不是太笨。爱好也比较多,下棋就是。高中时期学习还挺好,有时就会试试。同学水平都差不多,也没发现明显差异。 第一次发现水平差。有一次元旦,下棋娱乐,有一位下得比我好,当然不…

双场板功率GaN HEMT电容模型以精确模拟开关行为

标题:Capacitance Modeling in Dual Field-Plate Power GaN HEMT for Accurate Switching Behavior(TED.16年) 摘要 本文提出了一种基于表面电位的紧凑模型,用于模拟具有栅极和源极场板(FP)结构的AlGaN/G…

更新至2022年,各省人口高质量城镇化指标体系构建原始数据(13个指标)

更新至2022年,各省人口高质量城镇化指标体系构建原始数据 1、时间:更新至2022年,具体每个指标时间见下文 2、来源:整理自国家统计局、统计年鉴 3、范围:31省市 4、指标: 2008-2022年每十万人口高等学校…

vue3 腾讯tdesign 后台管理框架的使用

1.介绍 TDesign 是具有包容性的设计体系,它强调为业务提供产品、服务等过程中,追求以人为本、人人受益的包容性,要求搭建过程中,了解业务底层,理解业务场景的多样性,并在繁杂的业务场景中寻找共性和特性&a…

下个目标,突破 10w+

转眼间,2023 年已经过去了,今天是大年初四,还有十来天就马上除夕了,迈入新的一年。 回顾 2023 年,如果让我给自己打分,我算是 7.5 分吧。 在这一年了,工作上表现平平,并没有什么突…

Ubuntu Desktop - Screenshot (截图工具)

Ubuntu Desktop - Screenshot [截图工具] 1. Search your computer -> Screenshot -> Lock to Launcher2. gnome-screenshot3. System Settings -> Keyboard -> ShortcutsReferences 1. Search your computer -> Screenshot -> Lock to Launcher 2. gnome-s…

网络渗透测试:Wireshark抓取qq图片

Wireshark Wireshark Downloadhttps://www.wireshark.org/download.html 简介 WireShark是非常流行的网络封包分析工具,可以截取各种网络数据包,并显示数据包详细信息。常用于开发测试过程中各种问题定位。本文主要内容包括: 1、Wireshar…

【Vitis】Vitis HLS简介

Vitis HLS简介 Vitis™HLS是一种高层次综合工具,支持将C、C和OpenCL™函数硬连线到器件逻辑互连结构和RAM/DSP块上。 Vitis HLS可在Vitis应用加速开发流程中实现硬件内核,并使用C/C语言代码在VivadoDesign Suite中为赛灵思器件设计开发RTL IP。 【Vitis…

智慧医院系统架构整体设计与实现

随着信息技术的不断发展,智慧医院系统作为医疗行业的重要应用,正在逐渐成为医院管理和服务的重要工具。本文将介绍智慧医院系统的整体架构设计原则和关键组件,以及如何实现一个安全、高效和可扩展的智慧医疗服务平台。 内容: 1.…

MQTT的学习与应用

文章目录 一、什么是MQTT二、MQTT协议特点三、MQTT应用领域四、安装Mosquitto五、如何学习 MQTT 一、什么是MQTT MQTT(Message Queuing Telemetry Transport)是一种轻量级的消息传输协议,设计用于在低带宽、不稳定的网络环境中进行高效的通信…

leetcode - 169. Majority Element

Description Given an array nums of size n, return the majority element. The majority element is the element that appears more than ⌊n / 2⌋ times. You may assume that the majority element always exists in the array. Example 1: Input: nums [3,2,3] Out…

springboot集成Sa-Token及Redis的redisson客户端

文章目录 什么是Sa-Token?为什么集成Redis的redisson客户端?如何集成?maven依赖application.yml配置过滤器配置验证参考什么是Sa-Token? Sa-Token 是一个轻量级 Java 权限认证框架,主要解决:登录认证、权限认证、单点登录、OAuth2.0、分布式Session会话、微服务网关鉴权…

幻兽帕鲁服务器的配置怎么选择?根据玩家数量的服务器套餐配置推荐

幻兽帕鲁服务器的配置怎么选择?根据玩家数量的服务器套餐配置推荐如下: 服务器套餐配置推荐 1、入门配置(推荐2~4人联机畅玩):4核8G 2、通用配置(推荐4~8人联机畅玩)&…

Codeforces Round 729 (Div. 2)B. Plus and Multiply(构造、数学)

题面 链接 B. Plus and Multiply 题意 给定 n , a , b n,a,b n,a,b 可以进行的操作 ∗ a *a ∗a b b b 最开始的数是1 问能否经过上面的两种操作将1变为n 题解 这题的关键是能不能想出来这个集合里面…

Java StringBuilder源码剖析+面试题整理

在String中提到,如果字符串修改操作比较频繁,应该采用StringBuilder和StringBuffer类,这两个类的方法基本是完全一样的,它们的实现代码也几乎一样,唯一的不同就在于StringBuffer类是线程安全的,而StringBui…