【C++进阶学习】第九弹——哈希的原理与实现——开放寻址法的讲解

前言:

在前面,我们已经学习了很多存储机构,包括线性存储、树性存储等,并学习了多种拓展结构,效率也越来越高,但是是否有一种存储结构可以在大部分问题中都一次找到目标值呢?哈希可能能实现

目录

一、哈希的概念

二、哈希冲突

三、哈希冲突解决

3.1 开放寻址法

节点结构

插入操作

查找操作

删除操作

打印操作

3.2 链地址法

四、测试代码(开放寻址法)

五、总结


一、哈希的概念

哈希就是一种特殊的存储结构,通过特定的函数,使得数据的存储位置与它的关键码之间建立一种一一映射的关系,这样在查找数据时就可以直接通过关键值来快速查找

通过这种方法:

当我们向其中插入数据时,就可以利用此特定函数插入到关键码对应的位置下

当我们搜索数据时,通过关键码,进行相应的处理就可以找到要找的数据

这种方法就叫做哈希,特定的函数就是哈希函数,这种方法所建立的结构就叫做哈希函表

我们来看这样一个例子:

对于这样一个数组{1,5,3,17,19,0},按照上述规则我们首先要先找一个合适的哈希函数,

这里我们哈希函数可以设为:hashi(key)=key%capacity;capacity为存储空间底层空间总的大小

现在我们根据上面这个例子来思考这样一个问题,如果有这样一个数据,比如13,通过上面的哈希函数计算得我们应该把它放在关键码为3的位置上,但是此时这个位置上已经有数据了,我们应该如何解决呢?这样的问题就叫做哈希冲突

二、哈希冲突

哈希冲突指的是在使用哈希表进行数据存储和查找时,不同的关键字通过哈希函数计算得到了相同的哈希值。

哈希函数是将关键字映射到哈希表中的某个位置的函数。由于哈希表的存储空间是有限的,而可能的关键字数量是无限的,所以不同的关键字有可能被映射到相同的位置,这就产生了哈希冲突。

哈希冲突会影响哈希表的性能,比如增加查找、插入和删除操作的时间复杂度。

常见的解决哈希冲突的方法有(这两种方法会在后面详细讲解):

  1. 开放寻址法:当发生冲突时,通过一定的探查方式在哈希表中寻找其他空闲的位置来存储冲突的元素。
  2. 链地址法:在哈希表的每个位置上建立一个链表,将所有哈希值相同的元素都存储在这个链表中。

三、哈希冲突解决

解决哈希冲突常见的两种方法主要是:开放寻址法和链地址法

3.1 开放寻址法

开放定址法是解决哈希冲突的一种方法,其基本思想是当发生冲突时,通过某种系统的方法在哈希表中寻找下一个空槽位,并将冲突的关键码存储在这个槽位中。下面我们先来看一下开放寻址法的重点:

  1. 探测序列:开放定址法中,探测序列决定了当发生冲突时如何查找下一个槽位。常见的探测序列方法有:

    • 线性探测:当冲突发生时,顺序检查表中的下一个槽位,直到找到空槽位。
    • 二次探测:探测序列为 1, 4, 9, 16, ...,即探测位置是 i^2 的倍数,其中 i 是从0开始的整数。
    • 伪随机探测:使用伪随机数生成器来确定探测序列。
  2. 删除操作:在开放定址法中,删除元素比较复杂,因为不能简单地将槽位置为空,否则会影响后续的查找操作。通常,删除一个元素时,将其标记为已删除,但在查找时跳过已删除的元素。

  3. 装填因子:装填因子是哈希表中已存储元素个数与哈希表大小的比值。开放定址法中,装填因子不宜过高,否则冲突概率增加,查找效率下降。(因为这个原因,所以需要扩容)

节点结构

因为我们并不知道插入要操作何种类型的数据,可能是整形,浮点型或string的,所以我们可以选择将它们全转化为整形来处理,这里就需要我们借助仿函数和模板特化来实现

	template<class K>       
struct HashFunc         //仿函数,这里的功能是将其他类型转化为整形
{size_t operator()(const K& key){return (size_t)key;}
};
template<>     //特化
struct HashFunc<string>    //string类的不可以直接转化为整形,所以需要特殊处理
{size_t operator()(const string& key){size_t hash = 0;for (auto e : key){hash *= 31;hash += e;}return hash;}
};enum Status{EMPTY,     //此位置为空EXIST,     //此位置不为空DELETE     //此位置数据已被删除};template<class K, class V>     //因为不能确定我们要处理什么类型的数据,所以我们采用类模板的形式struct HashData{pair<K, V> _kv;   Status _s;        //此位置的状态};template<class K, class V, class Hash = HashFunc<K>>class HashTable{public:HashTable()     //初始化HashTable{_tables.resize(10);}private:vector<HashData<K, V>> _tables;size_t _n = 0;        //存储个数};

插入操作

开放寻址法的关键就在于数据的插入,在这里我们重点讲解一下线性探测的思想

这就是线性探测的思路,同时我们还要在装填因子足够大的时候进行扩容,比如上面这个例子,此时10个位置中已经填入7个因子,我们就可以进行按2倍扩容:

代码实现如下:

		//插入bool Insert(const pair<K, V>& kv){if (Find(kv.first))return false;//负载因子0.7就扩容if (_n * 10 / _tables.size() == 7){size_t newSize = _tables.size() * 2;HashTable<K, V, Hash> newHT;newHT._tables.resize(newSize);for (size_t i = 0; i < _tables.size(); i++){if (_tables[i]._s == EXIST){newHT.Insert(_tables[i]._kv);}}_tables.swap(newHT._tables);    //直接交换就可以得到扩容后的结果}Hash hf;//线性探测size_t hashi = hf(kv.first) % _tables.size();  //这里涉及到模板的特化,后面会讲while (_tables[hashi]._s == EXIST)    //当此位置不为空时,就往后找{                                     //当为空或已删除时都是可以放入数据的hashi++;hashi %= _tables.size();        //这里进行这个操作的目的是防止hashi大于_tables.size()}_tables[hashi]._kv = kv;     //找到后将这个位置值改为插入值_tables[hashi]._s = EXIST;   //状态改为存在_n++;return true;}

查找操作

上面的插入操作中,我们首先就先用查找操作看是否已经有这个数据,因为哈希是不允许存在重复数据的,这里我们就来看一下这个查找操作

		//查找HashData<K, V>* Find(const K& key){Hash hf;      //仿函数size_t hashi = hf(key) % _tables.size();   //所有计算都要用仿函数将key转换为整形while (_tables[hashi]._s == EXIST)      //从不为空的位置开始找{if (_tables[hashi]._s != EMPTY&& _tables[hashi]._kv.first == key)return &_tables[hashi];hashi++;hashi %= _tables.size();}return NULL;}

删除操作

我们删除一个数据时,并不能简单的找到这个数据就进行删除,这样会对我们后序很多操作带来不少麻烦,比如我们把4删除了,再找44就会很不容易,这也就是我们前面在定义节点结构是要定义状态的原因,我们删除一个操作后可以把它的状态更改,这样我们在进行其他操作的时候就可以直到这个位置上的值已被删除

		//删除bool Erase(const K& key){HashData<K, V>* ret = Find(key);if (ret){ret->_s = DELETE;_n--;return 0;}elsereturn true;}

打印操作

		//打印void Print(){for (size_t i = 0; i < _tables.size(); i++){if (_tables[i]._s == EXIST)     //当这个位置有数据时,打印出有效数据cout << "[" << i << "]->" << _tables[i]._kv.first << ":"<< _tables[i]._kv.second << endl;else if (_tables[i]._s == EMPTY)printf("[%d]->EMPTY\n", i);elseprintf("[%d]->DELETE\n", i);}}

3.2 链地址法

链地址法有些东西与上面的代码有些冲突,不好测试,我们放在下一篇讲

四、测试代码(开放寻址法)

我们给出几个测试用例检验一下上面的开放寻址法是否有误:

测试一:

		void TestHT1(){HashTable<int, int> j;int a[] = { 4,14,24,34,5,7,1 };for (auto e : a){j.Insert(make_pair(e, e));}j.Insert(make_pair(3, 3));j.Print();j.Insert(make_pair(3, 3));     //这里有一个隐藏的bugif (j.Find(3))cout << "3存在" << endl;}

运行结果:

测试二:

	void TestHT2()    //测试string{string arr[] = { "香蕉","甜瓜","苹果","香蕉","苹果","苹果" };HashTable<string, int> ht;for (auto e : arr){auto ret = ht.Find(e);if (ret)ret->_kv.second++;else{ht.Insert(make_pair(e, 1));}}ht.Print();}

运行结果:

五、总结

以上就是用开放寻址法来创建一个哈希表的完整代码,由于排版原因,整体看起来可能有些乱,有不懂的地方欢迎与我私信交流!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/51635.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Maven已经导入Junit包,但是还是无法使用注解

Maven已经导入Junit包&#xff0c;但是还是无法使用注解 背景&#xff1a; 导入了Junit的依赖 <dependency><groupId>junit</groupId><artifactId>junit</artifactId><version>4.12</version><scope>test</scope></d…

【初阶数据结构题目】2.移除元素

文章目录 顺序表算法题代码&#xff1a; 顺序表算法题 点击链接做题 移除元素 思路&#xff1a;定义两个变量指向数组第一个位置&#xff0c;判断nums[src]是否等于val 相等&#xff0c;src不相等&#xff0c;nums[dst] nums[src],src,dst 代码&#xff1a; int removeElem…

如何使用CANoe自带的TCP/IP Stack验证TCP的零窗口探测机制

如果想利用CANoe自带的TCP/IP协议栈验证TCP的零窗口探测机制,就必须添加一个网络节点并配置独立的CANoe TCP/IP协议栈,作为验证对象。而与它进行TCP通信的对端也是一个网络节点,但不要配置TCP/IP协议栈,而是使用CAPL代码在底层组装TCP报文模拟TCP通信过程。这样可以尽量减少…

轻松入门Linux—CentOS,直接拿捏 —/— <1>

一、什么是Linux Linux是一个开源的操作系统&#xff0c;目前是市面上占有率极高的服务器操作系统&#xff0c;目前其分支有很多。是一个基于 POSIX 和 UNIX 的多用户、多任务、支持多线程和多 CPU 的操作系统 Linux能运行主要的UNIX工具软件、应用程序和网络协议 Linux支持 32…

基于Drone实现CI/CD【0到1架构系列】

CI/CD是持续性集成和持续性部署&#xff0c;简单来讲就是自动化构建和自动化部署。目前有很多集成方案&#xff0c;也有很多组装方案&#xff0c;只要能实现自动化构建出制品&#xff0c;再自动部署到生产环境就行。 目前很多源代码都集成了CI/CD功能&#xff0c;drone也是目前…

还在用JVM跑你的Java代码吗?太慢了,试试Oracle的GraalVM吧

前言 对于Java开发者们来说&#xff0c;几乎每天都在和JVM打交道&#xff0c;然而JVM即将过时了。那些对新技术保持敏锐洞察力的开发者&#xff0c;可能已经在生产环境中部署GraalVM生成的二进制程序了&#xff0c;小伙伴们&#xff0c;你们已经用起来了吗&#xff1f; Graal…

【初阶数据结构题目】3.删除有序数组中的重复项

文章目录 顺序表算法题代码&#xff1a; 顺序表算法题 点击链接做题 删除有序数组中的重复项 思路&#xff1a;定义两个指针变量。dst指向数组第一个位置&#xff0c;src指向数组第二个位置。判断nums[dst]是否等于nums[src] 相等&#xff0c;src不相等&#xff0c;dst,nums[…

Windows 11 桌面模拟

Windows 11 桌面模拟 文章目录 Windows 11 桌面模拟代码结构HTML结构CSS样式JavaScript功能 源码效果图 代码结构 HTML结构 <html>: HTML文档的根元素。<head>: 包含文档的元数据&#xff0c;如标题和样式。<base>: 指定相对URL的基准。<title>: 指定…

力扣刷题160 相交链表

题目 力扣题目地址&#xff0c;点此可直接跳转 给你两个单链表的头节点 headA 和 headB &#xff0c;请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点&#xff0c;返回 null 。 图示两个链表在节点 c1 开始相交&#xff1a; 来源&#xff1a;力扣&…

60、redis安装和部署

一、关系型数据库与非关系型数据库 1.1、关系型数据库 关系型数据库是一个结构化的数据库&#xff0c;创建在关系模型&#xff08;二维表格模型&#xff09;基础上一般面向于记录。SQL语句&#xff08;标准数据查询语言&#xff09;就是一种基于关系型数据库的语言&#xff0…

pycharm 新建Python项目 使用anaconda环境

1.pycharm 新建完Python项目 2.文件-设置-具体项目-Python解释器-添加解释器-Conda执行文件选择你自己anaconda安装目录下Scripts\conda.exe -加载环境-选择现有的Conda环境或者新建一个环境

将gitee 上的nvim 配置 从gitee 上下载下来,并配置虚拟机

首先是下载 gitee 上的配置。 然后是 配置 tmux 然后是配置nvim . 1 在init.lua 文件中注释掉所有的与第三方插件有关的内容。 2 在packer 的文件中 &#xff0c; 注释掉所有的与 第三方插件有关的代码。 3 首先要保证 packer 能够正确的安装。 4 然后开始 安装 所有的插件…

自动化立体库各种故障解除方案

导语 大家好&#xff0c;我是社长&#xff0c;老K。专注分享智能制造和智能仓储物流等内容。 完整版文件和更多学习资料&#xff0c;请球友到知识星球【智能仓储物流技术研习社】自行下载 堆垛机故障解除方案核心内容&#xff1a; 故障代码与可能原因&#xff1a; F01&#xff…

SpringDataJPA(三):多表操作,复杂查询

一、Specifications动态查询 有时我们在查询某个实体的时候&#xff0c;给定的条件是不固定的&#xff0c;这时就需要动态构建相应的查询语句&#xff0c;在Spring Data JPA中可以通过JpaSpecificationExecutor接口查询。相比JPQL,其优势是类型安全,更加的面向对象。 import …

五大AI测试开源框架及使用方法介绍

AI测试框架是一套系统的测试工具和方法&#xff0c;包括测试的规范和基础代码&#xff0c;涵盖了一系列的测试思想和方法。这些框架可以帮助开发者和测试人员对AI模型进行测试&#xff0c;确保AI模型在真实世界的应用中能够达到预期的效果。接下来的内容&#xff0c;我们将介绍…

可视化目标检测算法推理部署(一)Gradio的UI设计

引言 在先前RT-DETR模型的学习过程中&#xff0c;博主自己使用Flask框架搭建了一个用于模型推理的小案例&#xff1a; FlaskRT-DETR模型推理 在这个过程中&#xff0c;博主需要学习Flask、HTML等相关内容&#xff0c;并且博主做出的页面还很丑&#xff0c;那么&#xff0c;是…

大模型微调:参数高效微调(PEFT)方法总结

PEFT (Parameter-Efficient Fine-Tuning) 参数高效微调是一种针对大模型微调的技术&#xff0c;旨在减少微调过程中需要调整的参数量&#xff0c;同时保持或提高模型的性能。 以LORA、Adapter Tuning 和 Prompt Tuning 为主的PEFT方法总结如下 LORA 论文题目&#xff1a;LORA:…

[Linux安全运维] MySQL 数据库安全配置

MySQL 安全配置 1 .1 MySQL备份 1 .1 .1 命令 1.数据库备份 mysqldump -uroot -p123456 bbs > /tmp/bbs.sql2.删除数据库 drop database bbs;3.创建数据库 create database bbs character set utf8;4.导入备份 mysql -uroot -p123456 bbs < /tmp/bbs.sql5.sql 语句…

java计算器,输入公式和对应变量的值

目标&#xff1a;最近想写个东西&#xff0c;本质就是一个计算器&#xff0c;我们可以输入公式&#xff08;例如&#xff1a;ab&#xff09;&#xff0c;然后把公式的值&#xff08;a:10,b:20&#xff09;也输入进去。最后得到结果。核心&#xff1a;这个想法核心部分就是给一个…