本文旨在讲解哈希表的封装,我们以哈希桶的结构来进行封装unorderedmap/set。要想实现封装哈希表,我们首先得先将哈希表的结构给搭建出来,然后再根据哈希桶的结构进一步封装unorderedmap/set!
下面我们先来实现哈希桶的结构,哈希桶的结构其实就是相同映射值的在一个桶内,然后把相同的桶内的元素通过指针链接起来即可,所以我们要先实现哈希表中的结点的结构体!因为其节点类似于链表的结构,所以里面存放的是节点的指针,以及该节点存储的值!
因为我们是用自己的方式来实现哈希表并进一步封装unorderedmap/set,所以我们得用自己的命名空间来包装!下面来看一下该哈希表结点的结构实现!步骤分为两大步:1.实现哈希表。
2.利用已有的哈希表来进行封装!
一、实现哈希表!
对于哈希表么,我们首先也得实现哈希表中的结构的结构体!上面已经讲过,该结构体类型类似于一种链表,所以我们现在就开始实现一下哈希表结点的结构体!
1.哈希表结点的结构
构造函数也是同样的,直接进行值的构造即可!
采用模版,首先一开始都将存储的元素即为pair类型,最后进行封装的时候再进行修改即可!
当哈希表的结点的结构体搭建出来的时候,我们就可以搭建我们得哈希表整体的结构了,对于哈希表而言,我们需要的成员是以哈希结点指针为元素的向量vector,以及有效元素的个数!
下面来看一下哈希表中的成员!
2.哈希表中的成员变量
都是基于模版给出的,可以适用于多种类型!
当表中的成员写完之后,我们首先要都该类进行构造函数和析构函数的编写!
3.构造函数
构造函数,就是完成初始化的动作,我们只需要对我们的vector向量开辟一段空间即可完成构造函数!
4.析构函数
因为成员变量中自定义的指针类型,所以系统默认的析构函数不能完成析构,需要我们手动释放,自己来实现析构函数!实现析构函数,只需要将表中存在的结点释放,然后置空即可!
对于析构函数,我们只需要遍历表,然后将表中存在的元素进行delete掉即可!然后一个桶内的元素清空之后,然后将表进行赋空即可!下面来看一下析构函数的实现!
构造函数以及析构函数实现之后,那么我们就开始实现一些相关操作的函数!
增删查这几个常见的函数!
5.Insert函数
对与Insert函数,我们首先需要关注的是是否需要扩容!当需要扩容的话,我们无需在新建节点了,只需要将结点的指针进行修改即可!我们需要定义一个新的vector,然后用于存储旧表中的元素!我们可以采用头插法来进行对新表的插入,最后将旧表中所有的元素插入完成之后,将旧表置空,然后交换新旧表即可!!因为新表的创建是在局部内,且在栈上进行创建的,所以不用担心有内存泄漏的问题!
下面来看一下Insert函数的实现!
实现了Insert函数之后,我们可以继续实现Find函数,如果找到Find的值时,返回该节点的指针即可,否则返回nullptr;我们要做的是首先要求出对应的映射值,然后在桶内进行遍历,若桶内存在与key值相同的元素,返回该节点的指针即可!下面我们来实现一下Find函数!
6.Find函数
实现了Find函数之后,我们再来实现Erase函数,需要注意的是,我们实现Erase函数的时候,不能复用Find函数来找到该节点,因为要删除一个节点的时候,我们需要其前驱节点以及后继节点才能正确删除,断开联系!需要注意的是,如果找到了要删除的节点,我们需要判断一下是否为头删,头删与中间节点的删除是不一样的!下面来看一下Erase函数的实现!
7.Erase函数!
HashFun的引进及实现!(用于将一个类型转化为整形!)
实现了上述函数之后,我们的哈希表基本大致实现!但是当我们插入字符类型的时候我们就会发现问题所在,因为字符类型无法自动转化为整形!这时就引进了仿函数HashFun,此时我们可以利用HashFun来将各种类型转化为整形!下面我们就来介绍一下如何实现HashFun,对于整形/浮点型等等我们直接进行强转成size_t即可,因为平常我们使用string的类型较多,所以我们对于string类型直接进行模版的特化,专门针对string类型写一个HashFun;HashFun的实现也是基于模版!下面来看一下HashFun的实现!
因为我们后期要一直使用这个仿函数,我们直接将其定义成全局即可!当引进了仿函数时,我们就需要对我们之前的代码进行修改,凡是设计到求余的操作,都要用到这个函数,将key转化为size_t类型!
所以我们直接在Hashtable该类中再加一个模版参数Hash 给他一个缺省参数!修改如下:
再给一个缺省参数即可完成!下面我们还要声明一个这样的函数hf,下面代码凡是设计到求余的操作都要用到这个函数!那么我们就对Insert来进行改造!
其他函数凡是涉及取余都是同样的,这里不再修改其他了,就是将取余套一层hf函数即可;
二、unorderedmap/set封装
至此,我们的哈希桶结构已经完成,那么下一步就开始封装我们自己unorderdmap/set,对于我们自己的unorderedmap/set而言,我们只需要添加自己的命名空间,然后就可以与库中的unorderedmap/set进行区分!
因为基于泛型编程,我们对unorderedmap/set的封装总不能写两份代码的,所以我们要实现一种格式,让二者都能使用我们得哈希桶这个结构来进行对unorderedmap/set的封装。所以我们首先要进行修改的就是我们桶中的数据类型,我们只需要桶中的数据类型进行一种改变,即可使unorderedmap/set都能调用代码,同红黑树的封装一样,我们只需要将红黑树中的第二个模版参数当成数据节点的类型即可!下面是哈希桶中数据节点的类型的改变!以及哈希桶的模版参数的变化!
当我们使用map时,T就是一个pair的类型,当我们使用set的时候,T就是一个K的类型!那么我们应该如何求出我们T的类型,就再次引进了一个仿函数KeyofT。下面来看一下MapkofT/SetkofT的实现!
KeyofT的仿函数实现之后,我们的unorderedmap/set就可以使用一份代码来进行封装了,只不过我们需要在取K的时候套一层KeyofT函数即可!至此我们再将哈希表中的Insert...等函数封装到我们的unorderedmap/set即可完成这些函数的调用!
下面看一下我们的unorderd_map/set的实现。
1.Unorderd_Map
2.Unorderd_Set
至此,我们封装的UnorderedMap/Set也能正常使用!
三、迭代器的封装
下面我们再继续封装我们的迭代器!对于迭代器我们还是像以前那样用节点的指针来构造迭代器,但是当我们重载operator++的时候,我们发现仅仅有节点的指针是不行的,还需要有哈希表中的table向量,以及当前位置的映射值,这里我使用哈希表来给大家讲解一些关于类之间相互依赖的问题!所以我们的迭代器的构造就有节点的指针,哈希表,以及哈希映射值这三者组成!
下面来看一下迭代器实现!
1.迭代器内的成员变量
2.迭代器的构造函数
需要注意的是:当我们对迭代器进行构造时,我们需要用到哈希表,而哈希表也需要用到我们的迭代器,这就造成了相互依赖的过程,这时我们只需要加一个前置声明即可解决我们的问题!即:在迭代器的前面加上对类模版哈希类的声明!需要注意的是:对类模版的前置声明时,也需要加上模版参数!代码如下:
3.重载operator++
迭代器既然已经实现了,那么我们就可以来重载operator++操作!在哈希表中++的操作,首先判断当前桶内是否还有下一节点,如果当前桶内没有节点,继续向下找其他桶,直到找到最后返回空即可!代码如下:
4.重载operator->
重载operator->即返回_node当前节点指向的值的地址!代码如下:
5.重载operator*
重载operator*即返回_node当前节点指向的值!
6.重载operator!=
下面我们再对表内进行迭代器的封装!
四、哈希表内对迭代器的封装!
我们只需要将迭代器在表内进行重定义即可!然后实现begin()和end()函数即可!代码如下:
需要注意的是:对内嵌类型进行typedef时,需要加上typename用于表示是一中类型!
1.begin()函数的实现!
2.end()函数的实现!
注意:因为迭代器中要访问到我们表中的私有成员变量,所以我们要进行友元类的声明!!对于模版友元的声明,我们需要将模版参数也加上去,才能正确进行声明!
此时,普通迭代器已经大致完成,要想实现在我们的unorderedmap/set内实现迭代器,只要再次进行封装即可!
3.Unordered_set对迭代器的封装!
再加上begin,end函数的实现,就可以完成范围for的使用了!
4.Unordered_Map对迭代器的封装!
Unordered_Map中的begin和end与上面Unordered_Set的同理!!
至此我们的迭代器也实现完成,那么我们发现当我们对值进行修改的时候,我们的值还能进行修改,但库中的却不能进行修改,所以我们应该再添加一个const迭代器,来进一步对我们的迭代器进行完善!
五、const迭代器的实现!
下面我们来实现一下const迭代器!
对于const迭代器,我们需要再次引进两个变量Ref,Ptr才能完成const迭代器的实现!
下面来看一下const迭代器的声明!!
然后将begin函数和const函数都添加一个const版本!
1.Unordered_Set中的const迭代器!
然后再对set/map中进行封装即可!对于set而言我们只需将set中的普通迭代器和const迭代器都声明为const迭代器即可!
但是对于set而言当我们仅仅将迭代器全部声明为const时,并不能解决问题,因为我们的this类型是const的类型,而在迭代器的构造中表是普通类型,当const变量给非const变量赋值时,就会导致权限的放大!那么我们只需要将迭代器的构造再写一个const版本试试!
此时构成了重载,但是当再次对旧表进行构造时,因为旧表也是普通对象,此时我们的表是const对象,所以也会导致权限的放大!那么我们再将表进行const声明即可! 这样就解决了set中key值能修改的问题!
2. Unordered_Map中的const迭代器!
对于Map类型,我们只需要对pair中的first不能修改,而second依旧不能修改!我们只需要对pair的first加上const修饰即可!
至此,我们的const迭代器也实现完成!
下面我们就来实现一下operator[]函数!
六、operator[]函数的实现
对于实现operator函数我们的Insert/Find函数的返回值类型也要进行修改!
我们将Insert的返回值类型设置为pair<iterator,bool>类型,这时当我们在UnorderedSet中进行封装时,就会发现问题,迭代器转化的问题!对于红黑树那里,我们只需要将迭代器转化为Node*即可!但是对我们的哈希表中,迭代器有三部分组成,所以不能进行转化!那么我们只好用一个ret类型进行调用Insert的值,然后将ret对迭代器进行构造即可解决问题!
这里是因为我们知道迭代器的底层是什么,所以我们可以进行对pair的构造!!
下面就可以实现operato[],然后就可以实现统计次数!
至此UnorderedMap/Set已经实现!在进行封装的时候,一定要一步一步的来,不要想着一口气将所有的代码实现!否则很难完美的封装!
下面我把源代码发到下面,供大家参考!看完本文希望各位佬留下免费的关注和小心心!
七、源码
1.Hashtable的实现!
#pragma once
//哈希表的实现!
//首先将结点的类型用结构体表示出来!
//然后哈希表主要是有这些结点的类型的向量vector/以及有效元素的个数组成!
#include<string>
#include<vector>
#include<iostream>
using namespace std;//区别于库中的哈希用自己的命名空间来进行实现1template<class K>
struct HashFun
{//仿函数的实现本质上就是对operator的重载 !size_t operator()(const K& key){return size_t(key);}
};//专门针对于string的一个模版特化!
template<>
struct HashFun<string>
{size_t operator()(const string& str){size_t ret = 0;for (auto &ch:str){ret *= 31; //这时基于一种算法来实现的!×什么数都可以,就是为了减少冲突!ret += ch;}return ret;}
};
namespace Hashbucket
{//类似于链表结构 节点内存储值以及下一个节点的指针1//泛型编程,将节点的类型设置为一个T即可!template<class T>struct Hashdata{T _data;Hashdata* _next;//构造函数!Hashdata(const T& data):_data(data),_next(nullptr){}};template<class K, class T, class KeyofT, class Hash = HashFun<K> >class Hashtable;//迭代器的构造!因为要使用到节点,所以放在节点的结构体下面进行声明!template<class K, class T,class Ref,class Ptr, class KeyofT, class Hash=HashFun<K>>struct __Iterator{typedef Hashdata<T> Node;typedef __Iterator<K, T, Ref,Ptr,KeyofT> Self;//迭代器的实现需要节点的指针,哈希表,以及哈希映射值,所以要声明这三个成员!size_t _hashi;Node* _node;const Hashtable<K, T, KeyofT>* _pht;//构造函数__Iterator(Node* node, Hashtable<K, T, KeyofT>* pht, size_t hashi):_hashi(hashi),_pht(pht),_node(node){}__Iterator(Node* node, const Hashtable<K, T, KeyofT>* pht, size_t hashi):_hashi(hashi), _pht(pht), _node(node){}Self& operator++(){//当前桶存在下一个节点!if (_node->_next){_node = _node->_next;return *this;}//当前桶后面没有节点了else{//寻找其他桶,找到不为空的桶返回即可!++_hashi;while (_hashi < _pht->_table.size()){Node* cur = _pht->_table[_hashi];if (cur){_node = cur;break;}++_hashi;}//最后判断_hashi的值,如果与表的大小一样,说明结束了!if (_hashi == _pht->_table.size()){_node = nullptr;}}return *this;}Ptr operator->()//返回当前节点对应的值的地址!{return &_node->_data;}//重载operator!=bool operator!=(const Self&s){return _node != s._node;}Ref operator*()//返回当前节点对应的值{return _node->_data;}};//搭建哈希表的框架!template<class K,class T,class KeyofT,class Hash>class Hashtable{public:template<class K, class T,class Ref,class Ptr, class KeyofT, class Hash >friend struct __Iterator;typedef Hashdata<T> Node;typedef typename __Iterator<K, T,T&,T* ,KeyofT> iterator;typedef typename __Iterator<K, T,const T&,const T*, KeyofT> const_iterator;iterator begin(){//从头遍历表,一旦发现有元素返回迭代器!for (size_t i = 0; i < _table.size(); i++){Node* cur = _table[i];if (cur){return iterator(cur, this, i);}}return end();}iterator end(){//迭代器的最后 用空指针,哈希值用-1表示!return iterator(nullptr, this, -1); }const_iterator begin()const{//从头遍历表,一旦发现有元素返回迭代器!for (size_t i = 0; i < _table.size(); i++){Node* cur = _table[i];if (cur){return const_iterator(cur, this, i);}}return end();}const_iterator end()const {//迭代器的最后 用空指针,哈希值用-1表示!return const_iterator(nullptr, this, -1);}Hash hf;KeyofT kot;//构造函数!Hashtable(){//对向量进行开辟一定的空间即可!_table.resize(10);}//析构函数!~Hashtable(){for (size_t i = 0; i < _table.size(); i++){Node* cur = _table[i];{while (cur){Node* next = cur->_next;delete cur;cur = next;}}_table[i] = nullptr;}}pair<iterator,bool > Insert(const T& data){iterator it = Find(kot(data));if (it != end()){return make_pair(it, false);}if (_n == _table.size()){//需要进行扩容!vector<Node*> newtable;size_t newsize = _table.size() * 2; //默认每次扩容2倍!//开始遍历旧表,当旧表中存在元素的时候,对新表进行头插即可!//这里的头插只需要改变指针的指向,无需真正新建节点!for (size_t i = 0; i < _table.size(); i++){Node* cur = _table[i];size_t hashi = hf(kot(data)) % _table.size(); //求出哈希映射值!while (cur){Node* next = cur->_next; //提前记录下一个节点!因为下面需要修改cur->_next!//对新表进行头插!cur->_next = newtable[hashi];newtable[hashi] = cur;cur = next;}//将旧表中的桶置为空!!_table[hashi] = nullptr;}//最后交换两个向量即可!_table.swap(newtable);}else{//无需扩容 直接进行头插即可!//先求出hashi,即该节点的映射的位置!Node* newnode = new Node(data); //堆中创建一个节点!以kv进行构造!size_t hashi = hf(kot(data)) % _table.size();//对当前位置进行头插即可!newnode->_next = _table[hashi];_table[hashi] = newnode;//有效元素++;++_n;return make_pair(iterator(newnode,this,hashi),true);}}iterator Find(const K& key){size_t hashi = hf(key) % _table.size();Node* cur = _table[hashi];while (cur){if (key == kot(cur->_data)){//找到相等的值!直接返回cur即可!return iterator(cur,this,hashi);}cur = cur->_next;}return iterator(nullptr,this,-1);}bool Erase(const K& key){size_t hashi = hf(key) % _table.size();Node* pre = nullptr;Node* cur = _table[hashi];while (cur){if (cur->_kv.first == key){//找到要删除的节点了!//分两种情况 头删 正常删除1if (pre == nullptr){//头删!_table[hashi] = cur->_next;}else{pre->_next = cur->_next;}delete cur;return true;}pre = cur;cur = cur->_next;}return false;}private:vector<Node*> _table; //存储结点指针的向量!size_t _n=0; //有效元素的个数!默认给0!};//void test1()//{// Hashtable<int, int> ht;// ht.Insert(make_pair(4, 4));// ht.Insert(make_pair(5, 5));// ht.Insert(make_pair(7, 7));// bool ret= ht.Erase(4);// if (ret == true)// {// cout << "删除成功!";// }// std::cout << ret;// int c = 0;//}//void test2()//{// Hashtable<string, string> ht;// ht.Insert(make_pair("string", "字符"));// ht.Insert(make_pair("left", "左边"));// // int c = 0;//}
}
2.UnorderedMap
#pragma once#include"Hash.h"
namespace Zhj
{template<class K, class V, class Hash = HashFun<K>>class Unordered_Map{//创建仿函数struct MapkeyofT{//对于Map而言,K就是返回pair的first即可!const K& operator()(const pair<K, V>& kv){return kv.first;}};public:typedef typename Hashbucket::Hashtable<K, pair< const K, V>, MapkeyofT>::iterator iterator;pair<iterator,bool > insert(const pair<K,V>&kv){return ht1.Insert(kv);}bool Erase(const K& key){return ht1.Erase(key);}iterator begin(){return ht1.begin();}iterator end(){return ht1.end();}/* const_iterator begin(){return ht1.begin();}const_iterator end(){return ht1.end();}*/V& operator[](const K& key){pair<iterator, bool> ret = ht1.Insert(make_pair(key, V()));return ret.first->second;}const V& operator[](const K& key)const{pair<iterator, bool> ret = ht1.Insert(make_pair(key, V()));return ret.first->second;}Hashbucket::Hashtable<K, pair<const K,V>, MapkeyofT> ht1;};//void test2()//{// Unordered_Map<string, string> m1;// m1.insert(make_pair("string", "字符串"));// m1.insert(make_pair("left", "左边"));// for (auto& ch : m1)// {// ch.first += "x";// ch.second += "x";// cout << ch.first << ":" << ch.second << endl;// }// int c = 0;// //}void test2(){string arr[] = { "西瓜", "西瓜","香蕉", "苹果", "苹果", "梨", "梨" };Unordered_Map<string, int> count_map;for (auto& e : arr){count_map[e]++;}for (auto& kv:count_map){cout << kv.first << ":" << kv.second << endl;}cout << endl;}}
3.UnorderedSet
#pragma once
#include"Hash.h"namespace Zhj
{template<class K,class Hash=HashFun<K>>class Unordered_Set{//创建仿函数struct SetkeyofT{//对于Set而言,K就是返回K即可!const K& operator()(const K& k){return k;}};public:Hashbucket::Hashtable<K, K, SetkeyofT> ht1;typedef typename Hashbucket::Hashtable<K, K, SetkeyofT>::const_iterator iterator;typedef typename Hashbucket::Hashtable<K, K, SetkeyofT>::const_iterator const_iterator;pair<const_iterator, bool> insert(const K& key){auto ret = ht1.Insert(key);return pair<const_iterator,bool>(const_iterator(ret.first._node, ret.first._pht, ret.first._hashi),ret.second);}//iterator begin()//{// return ht1.begin();//}//iterator end()//{// return ht1.end();//}const_iterator begin()const{return ht1.begin();}const_iterator end()const {return ht1.end();}};void test(){Unordered_Set<int> s;s.insert(9);s.insert(7);s.insert(6);s.insert(4);for (auto& ch : s){//ch += 50;cout << ch << " ";}int c = 0;cout << endl;}
}