【数据结构】哈希表(Hash Table)

文章目录

  • 一:哈希表(Hash Table)
    • 1.1 简介
    • 1.2 可以将算法思想分为两个部分
    • 1.3 相关术语
    • 1.4 性质
  • 二:哈希冲突
    • 2.1 什么是哈希冲突
    • 2.2 为何要避免哈希冲突
    • 2.3 如何避免哈希冲突
    • 2.4 如何减少哈希冲突
      • 2.4.1 直接地址法
      • 2.4.1 除留余数法
  • 三:代码实现

一:哈希表(Hash Table)

1.1 简介

哈希表(Hash Table),又名做散列表,是根据关键字和值直接进行访问的数据结构。也就是说,它通过关键字 key 和一个映射函数 Hash计算出对应的值value,然后把键值对映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做哈希函数,用于存放记录的数组叫做哈希表。 哈希表的关键思想是使用哈希函数,将键 key 和值 value 映射到对应表的某个区块中。

1.2 可以将算法思想分为两个部分

向哈希表中插入一个关键码值:通过哈希函数解析关键字,并将对应值存放到该区块中。

  • 比如:0138 通过哈希函数 Hash(key) = 0138 // 100 = 0,得出应将 0138 分配到0 所在的区块中。

在哈希表中搜索一个关键码值:通过哈希函数解析关键字,并在特定的区块搜索该关键字对应的值。

  • 比如:查找 2321,通过哈希函数,得出 2321 应该在 2 所对应的区块中。然后我们从 2 对应的区块中继续搜索,并在 2 对应的区块中成功找到了 2321。
  • 比如:查找 3214,通过哈希函数,得出 3214 应该在 3 所对应的区块中。然后我们从 3 对应的区块中继续搜索,但并没有找到对应值,则说明 3214 不在哈希表中。

在这里插入图片描述
在这里插入图片描述

1.3 相关术语

  • 哈希函数:在记录的关键字与记录的存储地址之间建立的一种对应关系。
  • 冲突: 若关键字不同而函数值相同,则称这两个关键字为“同义词”,并称这种现象为冲突。
  • 哈希查找:利用哈希函数进行查找的过程。
  • 装填因子:记表中添入记录数为m,表长度为n,则装填因子为α = m n \frac{m}{n} nm

1.4 性质

  • 哈希表实际上是以空间换取时间,它的查找的时间效率一般比其它方法高,但消耗空间资源
  • 冲突一般不可避免,发生冲突的次数与表的装填程度呈正相关
  • 哈希函数相同的情况下,处理冲突的方法不同,所得哈希表的平均查找长度也不同
  • 线性探测再散列处理冲突容易造成记录的“二次聚集”,即使得本不是同义词的关键字又产生新的冲突
  • 对开放定址处理冲突的哈希表而言,表长必须≥记录数
  • 链地址处理冲突的哈希表不要求表长必须≥记录数,它的平均查找长度主要取决于哈希函数本身

二:哈希冲突

2.1 什么是哈希冲突

对于两个元素,e1!=e2,但Hash(e1)=Hash(e2),就会产生哈希冲突,简单点说,就是两个不同的元素经过哈希函数的计算,计算除了相同的存储地址,这样的情况成为哈希冲突。

2.2 为何要避免哈希冲突

哈希表需要尽量将元素均匀的放入到每个存储位置中去,但是如果两个元素的关键码值相等,那么就会放到同一个元素中,如果这种情况很多,就会出现一个存储位置出现很多元素的情况。这样不利于查找。

2.3 如何避免哈希冲突

理论上如果哈希桶的数量多余要存储的位置,那么哈希冲突是可以避免的,但是实际中,我们认为要存储的元素是很多的,无穷的,哈希桶的数量是有限的,创建一个哈希桶也是需要耗费资源的,因此,实际中哈希冲突是不可避免的,因此,可以设计一些方法尽可能减少哈希冲突。

2.4 如何减少哈希冲突

设计良好的哈希函数可以减少或者避免哈希冲突

下面只介绍两种常用哈希函数设计的方法:

2.4.1 直接地址法

取关键字的某个线性函数值作为哈希地址。比如:H(key)=a*key+b (a,b)都是常数

优点:直接地址法优点是哈希函数简单,不同的关键字不会产生冲突,,但是关键字集合往往是比哈希地址的结合大,因此,该方法会需要很多哈希桶,而且关键字集合往往离散,所有产生的哈希表会造成空间的巨大浪费,实际中不适用。

2.4.1 除留余数法

以一个略小于哈希地址集合个数的质数p,让关键字的关键码取它的余数作为哈希地址:H(key)=key%p,(p是质数,p<=m,m是集合地址个数)

三:代码实现

package com.sysg.dataStructuresAndAlgorithms.hashtable;import java.util.Scanner;public class HashTableDemo {public static void main(String[] args) {//创建一个哈希表HashTable hashTable = new HashTable(7);//写一个简单的菜单String key = "";Scanner scanner = new Scanner(System.in);while (true) {System.out.println("add:添加雇员");System.out.println("list:显示雇员");System.out.println("find:查找雇员");System.out.println("exit:退出系统");key = scanner.next();switch (key) {case "add":System.out.println("输入id");int id = scanner.nextInt();System.out.println("输入名字");String name = scanner.next();Emp emp = new Emp(id, name);hashTable.add(emp);break;case "list":hashTable.list();break;case "find":System.out.println("请输入需要查找的id");id = scanner.nextInt();hashTable.findEmpById(id);break;case "exit":scanner.close();System.exit(0);break;default:break;}}}
}/*** 创建HashTable,管理多条链表*/
class HashTable {/*** 链表*/private final EmpLinkedList[] empLinkedLists;/*** 表示共有多少条链表*/private final int size;public HashTable(int size) {this.size = size;//初始化empLinkedListsempLinkedLists = new EmpLinkedList[size];//初始化每一条每一条链表for (int i = 0; i < size; i++) {empLinkedLists[i] = new EmpLinkedList();}}/*** 添加雇员** @param emp 员工信息*/public void add(Emp emp) {//根据员工的id查到员工应该属于那条链表int empLinkedListNum = hashFunction(emp.id);//将emp添加到对应的链表当中empLinkedLists[empLinkedListNum].add(emp);}/*** 遍历哈希表当中的所有linkedList*/public void list() {for (int i = 0; i < size; i++) {empLinkedLists[i].list(i);}}/*** 根据id查找雇员** @param id 雇员的id*/public void findEmpById(int id) {int empLinkedListNum = hashFunction(id);//将emp添加到对应的链表当中Emp emp = empLinkedLists[empLinkedListNum].findEmpById(id);if (emp != null) {//说明找到了System.out.printf("在第%d条链表找到雇员,id=%d\n", (empLinkedListNum + 1), id);} else {System.out.println("在哈希表中没有找到该雇员信息");}}/*** 散列函数,取模法** @param id 员工id* @return 取模后的值*/public int hashFunction(int id) {return id % size;}}/*** 表示一个雇员*/
class Emp {/*** 雇员id*/public int id;/*** 雇员姓名*/public String name;/*** 下一个雇员的信息* next默认为null*/public Emp next;/*** 构造器** @param id   雇员id* @param name 雇员姓名*/public Emp(int id, String name) {super();this.id = id;this.name = name;}
}/*** 表示雇员链表*/
class EmpLinkedList {/*** 头指针,先执行第一个emp,因此我们这个链表的head是直接指向第一个head* head默认为null*/public Emp head;/*** 添加雇员到链表* 1.添加雇员时id是自增涨的,即id的分配就是从小到大* 2.因此我们直接将该雇员添加到链表的最后即可*/public void add(Emp emp) {//如果是添加第一个雇员if (head == null) {head = emp;return;}//如果不是第一个雇员,就使用一个辅助指针,帮助定位到最后Emp currentEmp = head;while (currentEmp.next != null) {//说明到最后一个节点了//向后移currentEmp = currentEmp.next;}//退出时,直接将emp加入到当前链表中currentEmp.next = emp;}/*** 遍历链表的雇员信息*/public void list(int number) {//如果链表的头节点为null,则说明当前链表是空的if (head == null) {System.out.println("第" + number + "链表为空");return;}Emp currentEmp = head;while (true) {System.out.printf("第" + (number + 1) + "条链表雇员的id=%d name=%s\t", currentEmp.id, currentEmp.name);//如果currentEmp.next == null,说明到最后一个节点了if (currentEmp.next == null) {break;}currentEmp = currentEmp.next;}}/*** 根据id查找雇员,如果没有找到就返回null** @param id 雇员的id* @return 雇员信息*/public Emp findEmpById(int id) {//判断链表是否为空if (head == null) {System.out.println("链表为空");return null;}Emp currentEmp = head;//找到了while (currentEmp.id != id) {//退出if (currentEmp.next == null) {//遍历完整个链表没找到currentEmp = null;break;}currentEmp = currentEmp.next;}return currentEmp;}}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/740472.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

工具篇--分布式定时任务springBoot 整合 elasticjob使用(3)

文章目录 前言一、Springboot 整合&#xff1a;1.1 引入jar&#xff1a;1.2 配置zookeeper 注册中心&#xff1a;1.3 定义job 业务类&#xff1a;1.4 job 注册到zookeeper&#xff1a;1.5 项目启动&#xff1a;1.5.1 zookeeper 注册中心实例&#xff1a;1.5.2 任务执行日志输出…

Ubuntu 14.04:PaddleOCR基于PaddleServing的在线服务化部署(失败)

一、 二、安装 注&#xff1a; 安装 PaddleOCR 2.3 。 因为 PaddleOCR 2.4 的 推荐环境 PaddlePaddle > 2.1.2。 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.4/doc/doc_ch/environment.md 安装前的环境准备 在使用Paddle Serving之前&#xff0c;需要完…

数据结构和算法:复杂度分析

算法效率评估 时间效率&#xff1a;算法运行速度的快慢。 空间效率&#xff1a;算法占用内存空间的大小。 效率评估方法主要分为两种&#xff1a;实际测试、理论估算 实际测试问题&#xff1a; 1.难以排除测试环境的干扰因素。 硬件配置会影响算法的性能。需要在各种机器上进…

Web 常用的 扩展开发框架

当谈到提升浏览器功能和用户体验时&#xff0c;浏览器扩展成了一股强大的力量&#xff0c;备受用户青睐。在众多的Web扩展开发框架中&#xff0c;WXT和Plasmo凭借其丰富的工具和特性&#xff0c;以及简化的开发流程&#xff0c;成为开发者们的首选。在本文中&#xff0c;我们将…

数据分析-Pandas如何画自相关图

数据分析-Pandas如何画自相关图 数据分析和处理中&#xff0c;难免会遇到各种数据&#xff0c;那么数据呈现怎样的规律呢&#xff1f;不管金融数据&#xff0c;风控数据&#xff0c;营销数据等等&#xff0c;莫不如此。如何通过图示展示数据的规律&#xff1f; 数据表&#x…

C#,文字排版的折行问题(Word-wrap problem)的算法与源代码

1、英文的折行问题 给定一个单词序列&#xff0c;以及一行中可以输入的字符数限制&#xff08;线宽&#xff09;。 在给定的顺序中放置换行符&#xff0c;以便打印整齐。 假设每个单词的长度小于线宽。 像MS word这样的文字处理程序负责放置换行符。 这个想法是要有平衡的线条。…

专业140+总分430+西南交通大学924信号与系统考研经验电子信息与通信工程,真题,大纲,参考书

今年报考西南交通大学&#xff0c;考研分数专业课924信号与系统140&#xff0c;总分430&#xff0c;各门分数都还是比较均衡&#xff0c;经过一年的复习&#xff0c;有得有失&#xff0c;总结一下自己的复习经历&#xff0c;希望给大家有点帮助&#xff0c;在复习中做的更好&am…

钉钉平台“智”领宠物界,开启萌宠智能新时代!

在当前数字化转型的浪潮中&#xff0c;钉钉用便捷的数字化解决方案推动了宠物业界的智能升级。一家宠物用品公司采用无雀科技数字化管理系统&#xff0c;与钉钉平台结合&#xff0c;解决了小型企业普遍存在的财务管理不清晰、业务流程不规范、客户信息核对繁琐等痛点问题。 针对…

AHU 汇编 实验六

一、实验名称&#xff1a;实验6 输入一个16进制数&#xff0c;把它转换为10进制数输出 实验目的&#xff1a; 培养汇编中设计子程序的能力 实验过程&#xff1a; 源代码&#xff1a; data segmentbuff1 db Please input a number(H):$buff2 db 30,?,30 dup(?),13,10buff3 …

多维时序 | Matlab实现VMD-CNN-LSTM变分模态分解结合卷积神经网络结合长短期记忆神经网络多变量时间序列预测

多维时序 | Matlab实现VMD-CNN-LSTM变分模态分解结合卷积神经网络结合长短期记忆神经网络多变量时间序列预测 目录 多维时序 | Matlab实现VMD-CNN-LSTM变分模态分解结合卷积神经网络结合长短期记忆神经网络多变量时间序列预测预测效果基本介绍程序设计参考资料 预测效果 基本介…

鸿蒙Harmony应用开发—ArkTS声明式开发(基础手势:Stepper)

步骤导航器组件&#xff0c;适用于引导用户按照步骤完成任务的导航场景。 说明&#xff1a; 该组件从API Version 8开始支持。后续版本如有新增内容&#xff0c;则采用上角标单独标记该内容的起始版本。 子组件 仅能包含子组件StepperItem。 接口 Stepper(value?: { index?…

微信小程序小白易入门基础教程1

微信小程序 基本结构 页面配置 页面配置 app.json 中的部分配置&#xff0c;也支持对单个页面进行配置&#xff0c;可以在页面对应的 .json 文件来对本页面的表现进行配置。 页面中配置项在当前页面会覆盖 app.json 中相同的配置项&#xff08;样式相关的配置项属于 app.js…

鸿蒙Harmony应用开发—ArkTS声明式开发(基础手势:RichText)

富文本组件&#xff0c;解析并显示HTML格式文本。 说明&#xff1a; 该组件从API Version 8开始支持。后续版本如有新增内容&#xff0c;则采用上角标单独标记该内容的起始版本。该组件无法根据内容自适应设置宽高属性&#xff0c;需要开发者设置显示布局。 子组件 不包含子组…

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的石头剪刀布手势识别系统详解(深度学习模型+UI界面代码+训练数据集)

摘要&#xff1a;本篇博客深入探讨了使用深度学习技术开发石头剪刀布手势识别系统的过程&#xff0c;并分享了完整代码。该系统利用先进的YOLOv8、YOLOv7、YOLOv6、YOLOv5算法&#xff0c;并对这几个版本进行性能对比&#xff0c;如mAP、F1 Score等关键指标。文章详细阐述了YOL…

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的远距离停车位检测系统(深度学习代码+UI界面+训练数据集)

摘要&#xff1a;开发远距离停车位检测系统对于提高停车效率具有关键作用。本篇博客详细介绍了如何运用深度学习构建一个远距离停车位检测系统&#xff0c;并提供了完整的实现代码。该系统基于强大的YOLOv8算法&#xff0c;并对比了YOLOv7、YOLOv6、YOLOv5&#xff0c;展示了不…

TS271IDT运算放大器芯片中文资料PDF数据手册引脚图图片参数价格功能

产品描述&#xff1a; TS271 是一款低成本、低功耗的单通道运算放大器&#xff0c;设计用于采用单电源或双电源供电。该运算放大器采用意法半导体硅栅CMOS工艺&#xff0c;具有出色的消耗-速度比。该放大器非常适合低功耗应用。 电源可通过引脚 8 和 4 之间连接的电阻器进行外…

2024年【高压电工】考试及高压电工考试总结

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 高压电工考试考前必练&#xff01;安全生产模拟考试一点通每个月更新高压电工考试总结题目及答案&#xff01;多做几遍&#xff0c;其实通过高压电工模拟试题很简单。 1、【单选题】 为了保证频率偏差不超过规定值,必…

基于Springboot的预报名管理系统(有报告)。Javaee项目,springboot项目。

演示视频&#xff1a; 基于Springboot的预报名管理系统&#xff08;有报告&#xff09;。Javaee项目&#xff0c;springboot项目。 项目介绍&#xff1a; 采用M&#xff08;model&#xff09;V&#xff08;view&#xff09;C&#xff08;controller&#xff09;三层体系结构&a…

用miniconda建立PyTorch、Keras、TensorFlow三个环境

一、配置清华镜像conda源 由于网络问题&#xff0c;直接使用conda默认的源下载包可能会非常慢。为了解决这个问题&#xff0c;可以配置国内镜像源来加速包的下载。清华大学TUNA协会提供了一个常用的conda镜像源。下面是如何配置清华镜像源的步骤&#xff1a; 1. 配置清华conda…

发布DDD脚手架到Maven仓库,IntelliJ IDEA 配置一下即可使用

作者&#xff1a;小傅哥 博客&#xff1a;https://bugstack.cn 项目&#xff1a;https://gaga.plus 沉淀、分享、成长&#xff0c;让自己和他人都能有所收获&#xff01;&#x1f604; 大家好&#xff0c;我是技术UP主&#xff0c;小傅哥。 这篇文章将帮助粉丝伙伴们更高效地利…