代码随想录二刷 | 哈希表 | 总结篇
- 理论基础
- 哈希表经典题目
- 数组作为哈希表
- set作为哈希表
- map作为哈希表
理论基础
一般来说哈希表都是用来快速判断一个元素是否出现集合里。
对于哈希表,要知道哈希函数和哈希碰撞在哈希表中的作用。
哈希函数是把传入的key映射到符号表的索引上。
哈希碰撞处理有多个key映射到相同索引上时的情景,处理碰撞的普遍方式是拉链法和线性探测法。
接下来是常见的三种哈希结构:
- 数组
- set(集合)
- map(映射)
在C++语言中,set 和 map 都分别提供了三种数据结构,每种数据结构的底层实现和用途都有所不同,在关于哈希表,你该了解这些! (opens new window)中我给出了详细分析,这一知识点很重要!
例如什么时候用std::set,什么时候用std::multiset,什么时候用std::unordered_set,都是很有考究的。
只有对这些数据结构的底层实现很熟悉,才能灵活使用,否则很容易写出效率低下的程序。
哈希表经典题目
数组作为哈希表
一些应用场景就是为数组量身定做的。
在242.有效的字母异位词
中,我们提到了数组就是简单的哈希表,但是数组的大小是受限的!
这道题目包含小写字母,那么使用数组来做哈希最合适不过。
在383.赎金信
中同样要求只有小写字母,那么就给我们浓浓的暗示,用数组!
本题和242.有效的字母异位词
很像,242.有效的字母异位词
是求字符串a 和 字符串b 是否可以相互组成,在383.赎金信
中是求字符串 a 能否组成字符串b,而不用管字符串b 能不能组成字符串a。
上面两道题目用map确实可以,但使用map的空间消耗要比数组大一些,因为map要维护红黑树或者符号表,而且还要做哈希函数的运算。所以数组更加简单直接有效!
set作为哈希表
在349. 两个数组的交集
中我们给出了什么时候用数组就不行了,需要用set。
这道题目没有限制数值的大小,就无法使用数组来做哈希表了。
主要因为如下两点:
-
数组的大小是有限的,受到系统栈空间(不是数据结构的栈)的限制。
如果数组空间够大,但哈希值比较少、特别分散、跨度非常大,使用数组就造成空间的极大浪费。 -
所以此时一样的做映射的话,就可以使用set了。
关于set,C++ 给提供了如下三种可用的数据结构:
- std::set
- std::multiset
- std::unordered_set
std::set
和std::multiset
底层实现都是红黑树,std::unordered_set
的底层实现是哈希, 使用unordered_set
读写效率是最高的,本题并不需要对数据进行排序,而且还不要让数据重复,所以选择unordered_set
。
在202.快乐数
中,我们再次使用了unordered_set
来判断一个数是否重复出现过。
map作为哈希表
来说一说:使用数组和set来做哈希法的局限。
- 数组的大小是受限制的,而且如果元素很少,而哈希值太大会造成内存空间的浪费。
- set是一个集合,里面放的元素只能是一个key,而两数之和这道题目,不仅要判断y是否存在而且还要记录y的下标位置,因为要返回x 和 y的下标。所以set 也不能用。
- map是一种<key, value>的结构,本题可以用key保存数值,用value在保存数值所在的下标。所以使用map最为合适。
C++提供如下三种map:
- std::map
- std::multimap
- std::unordered_map
std::unordered_map
底层实现为哈希,std::map
和std::multimap
的底层实现是红黑树。
同理,std::map
和std::multimap
的key也是有序的(这个问题也经常作为面试题,考察对语言容器底层的理解),1.两数之和
中并不需要key有序,选择std::unordered_map
效率更高!
在454.四数相加
中我们提到了其实需要哈希的地方都能找到map的身影。
本题咋眼一看好像和18. 四数之和
,15.三数之和
差不多,其实差很多!
关键差别是本题为四个独立的数组,只要找到A[i] + B[j] + C[k] + D[l] = 0
就可以,不用考虑重复问题,而18. 四数之和
,15.三数之和
是一个数组(集合)里找到和为0的组合,可就难很多了!
在15.三数之和
中给出了哈希法和双指针两个解法,可以体会到,使用哈希法还是比较麻烦的。
所以18. 四数之和,15.三数之和都推荐使用双指针法.