题目
给定两个数组,编写一个函数来计算它们的交集。
说明: 输出结果中的每个元素一定是唯一的。 我们可以不考虑输出结果的顺序。
提示:
1 <= nums1.length, nums2.length <= 1000
0 <= nums1[i], nums2[i] <= 1000
思路
交集,去重,两个特点天然决定了这道题需要使用哈希表来解决,因为题目给出了两个数组中元素的范围,最大不超过1000,那么看过我上一篇博客的话,大家第一反应一定是使用数组,元素当作索引值,只需要将两个数组每个遍历一遍即可,这里推荐一种哈希数据结构:unordered_set,这个数据结构可以解决很多类似的问题。
注意题目特意说明:输出结果中的每个元素一定是唯一的,也就是说输出的结果的去重的, 同时可以不考虑输出结果的顺序,所以可以将结果集设置为一个unordered_set,c++代码如下:
class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {unordered_set<int> result_set; // 存放结果,之所以用set是为了给结果集去重int hash[1005] = {0}; // 默认数值为0for (int num : nums1) { // nums1中出现的字母在hash数组中做记录hash[num] = 1;}for (int num : nums2) { // nums2中出现话,result记录if (hash[num] == 1) {result_set.insert(num);}}return vector<int>(result_set.begin(), result_set.end());}
};
- 时间复杂度: O(m + n)
- 空间复杂度: O(n)
在此题中大家能看出,如果数组中的数值很少或者很分散,那么建立这个大小为1000的int数组就显得十分浪费,并且此题是告诉了数组数值的范围,那么如果题目没有限制数值大小呢,我们是否有办法解决?
答案是肯定的,此时就要使用另一种结构体了,set ,关于set,C++ 给提供了如下三种可用的数据结构:
- std::set
- std::multiset
- std::unordered_set
std::set和std::multiset底层实现都是红黑树,std::unordered_set的底层实现是哈希表, 使用unordered_set 读写效率是最高的,并不需要对数据进行排序,而且还不要让数据重复,所以选择unordered_set。
思路如图所示:
C++代码如下:
class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {unordered_set<int> result_set; // 存放结果,之所以用set是为了给结果集去重unordered_set<int> nums_set(nums1.begin(), nums1.end());for (int num : nums2) {// 发现nums2的元素 在nums_set里又出现过if (nums_set.find(num) != nums_set.end()) {result_set.insert(num);}}return vector<int>(result_set.begin(), result_set.end());}
};
- 时间复杂度: O(n + m) m 是最后要把 set转成vector
- 空间复杂度: O(n)
这里补充一些关于unordered_set的知识
一些常用的构造案例:
- std::unordered_set<string> things {16}; // 16 buckets
- std::unordered_set<string> words {"one", "two", "three", "four"};// Initializer list
- std::unordered_set<string> some_words {++std::begin(words), std::end (words)}; // Range
- std::unordered_set<string> copy_wrds {words}; // Copy constructor
上述代码则是使用了第三种创建方法
代码中用到的unordered_set的一些常用成员方法:
成员方法 | 功能 |
---|---|
find(key) | 查找值为key的元素,如果找到,则返回一个指向该元素的正向迭代器;如果没找到,则返回一个与end()方法相同的迭代器 |
end() | 返回指向容器中最后一个元素之后位置的迭代器 |
注意点
那有人可能问了,遇到哈希问题我直接都用set不就得了,用什么数组啊。
直接使用set 不仅占用空间比数组大,而且速度要比数组慢,set把数值映射到key上都要做hash计算的。
不要小瞧 这个耗时,在数据量大的情况,差距是很明显的。