set、map、multiset、multimap的介绍及使用
- 一、关联式容器
- 二、键值对
- 键值对概念
- 定义
- 三、set
- set的介绍
- set的使用
- set的模板参数列表
- set的构造
- set的迭代器
- set的容量
- empty
- size
- set的修改操作
- insert
- find && erase
- count
- lower_bound 和 upper_bound
- Multiset的用法
- 四、map
- map的介绍
- map的用法
- map的模板参数
- map迭代器
- map的构造
- map的常见修改操作
- insert
- erase
- find
- count
- map的容量与元素访问 -- operator[]
- 利用map统计出现次数
- 用直接插入法
- 用[]法
- multimap
- multimap介绍
- multimap的使用
- 五、题目
- 前k个高频词
- 题目描述
- 解题思路
- 解题代码
- 两个数组的交集
- 题目描述
- 解题思路
- 解题代码
- 差集思想
一、关联式容器
初期,我们接触了list,vector,deque等容器,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。
关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>结构的键值对,在数据检索时比序列式容器效率更高。
二、键值对
键值对概念
用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息。
定义
SGI-STL中关于键值对pair的定义:
template<class T1, class T2>
struct pair
{typedef T1 first_type;typedef T2 second_type;T1 first;T2 second;pair():first(T1()),second(T2()){}pair(const T1& a, const T2& b):first(a),second(b){}
};
三、set
set的介绍
- set是按照一定次序存储元素的容器
- 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。
- 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
- set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
- set在底层是用二叉搜索树(红黑树)实现的。
1.与map/multimap不同,map/multimap中存储的是真正的键值对<key,value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。
2. set中插入元素时,只需要插入value即可,不需要构造键值对。
3. set中的元素不可以重复(因此可以使用set进行去重)。
4. 使用set的迭代器遍历set中的元素,可以得到有序序列
5. set中的元素默认按照小于来比较
6. set中查找某个元素,时间复杂度为: l o g 2 n log_2 n log2n
7. set中的元素不允许修改(为什么?)
8. set中的底层使用二叉搜索树(红黑树)来实现。
总结:set的本质就是key模型。
set的使用
set支持的操作为增删查,不能修改!
set的模板参数列表
T:set中存放元素的类型,实际在底层存储的是<value, value>的键值对
Compare:仿函数,set容器中默认使用库函数中的less函数来比较,我们如果想实现More函数我们可以自己进行写一个More函数以实现不同的功能。
Alloc:set中元素空间的管理方式,使用STL提供的空间配置器。
set的构造
void testset1()
{set<int> set1;int num[10] = { 1,2,4,3,5,7,6,8,9,10 };// 区间构造set<int> set2(num, num + sizeof(num) / sizeof(num[0]));// 拷贝构造set<int> set3(set2);// 拷贝构造代价太大// for循环打印set2for (auto& e : set2){cout << e << " ";}cout << endl;// for循环打印set3for (auto& e : set3){cout << e << " ";}cout << endl;
}
set的迭代器
如图所示:
void testset2()
{set<int> set1 = { 1,2,1,4,5,3,7,6,5,8,9 };set<int>::iterator it = set1.begin();// 去重+排序while (it != set1.end()){cout << *it << " ";++it;}cout << endl;// 范围forfor (auto& e : set1){cout << e << " ";}cout << endl;
}
我们如果想要将这个排序变成降序该咋办呢?很简单,用一个Greater仿函数即可:
void testset3()
{int a[10] = { 1,3,1,2,4,5,7,6,5,8 };// 这个greater仿函数是set库函数中的函数// 就是进行降序的函数set<int, greater<int>> set1(a, a + sizeof(a) / sizeof(a[0]));// for循环for (auto& e : set1){cout << e << " ";}cout << endl;
}
set的容量
empty
size
set的修改操作
insert
这里我们直接用cplusplus网站上的插入介绍和代码解析:
void testset4()
{std::set<int> myset;std::set<int>::iterator it;std::pair<std::set<int>::iterator, bool> ret;// for循环并单个插入for (int i = 1; i <= 5; ++i)myset.insert(i * 10);// 单个插入ret = myset.insert(20);if (ret.second == false) it = ret.first;// 插入迭代器所代表的值myset.insert(it, 25);myset.insert(it, 24);myset.insert(it, 26);// 插入一段区间int myints[] = { 5,10,15 };myset.insert(myints, myints + 3);std::cout << "myset contains:";for (it = myset.begin(); it != myset.end(); ++it)std::cout << ' ' << *it;std::cout << '\n';
}
find && erase
void testset5()
{std::set<int> myset;std::set<int>::iterator it;for (int i = 1; i < 10; i++) myset.insert(i * 10); // 10 20 30 40 50 60 70 80 90it = myset.begin();++it; // 第二个位置// 删除第二个位置myset.erase(it);// 删除一个数myset.erase(40);// 删除一个迭代器区间it = myset.find(60);myset.erase(it, myset.end());std::cout << "myset contains:";for (it = myset.begin(); it != myset.end(); ++it)std::cout << ' ' << *it;std::cout << '\n';
}
上面是erase,我们下面介绍一下find:
void testset6()
{std::set<int> myset;std::set<int>::iterator it;for (int i = 1; i <= 5; i++) myset.insert(i * 10); // 10 20 30 40 50it = myset.find(20);myset.erase(it); // 删除20这个迭代器的值myset.erase(myset.find(40)); // 删除40这个迭代器的值std::cout << "myset contains:";for (it = myset.begin(); it != myset.end(); ++it)std::cout << ' ' << *it;std::cout << '\n';
}
看似没什么问题,有一个问题,那我们假如说删除了一个并不存在的数值或者是迭代器呢?
所以我们在写完find以后需要判断一下是否是真的找到了,找到了才能删除,找不到就不删除即可。
// 删除一个不存在的迭代器set<int>::iterator pos = myset.find(70);if (pos != myset.end()){myset.erase(pos);}
count
lower_bound 和 upper_bound
void testset9()
{set<int> myset;set<int>::iterator itup, itlow;for (int i = 1; i < 10; ++i){myset.insert(i * 10);}itlow = myset.lower_bound(35);itup = myset.upper_bound(60);cout << "[" << *itlow << "," << *itup << "]" << endl;myset.erase(itlow, itup);for (auto& e : myset){cout << e << " ";}cout << endl;
}
Multiset的用法
multiset的用法和set基本是一致的,唯一一个区别是multiset允许键值对冗余,即使用multiset可以让数字重复。
void testset10()
{// multisetint a[10] = {1,3,2,4,1,2,5,6,7,10};multiset<int> set1(a, a + sizeof(a) / sizeof(a[0]));for (auto& e : set1){cout << e << " ";}cout << endl;
}
还有一个find和erase呢?
find是返回中序中的第一个(在有多个重复值的情况下)。
erase是将所有的想删除的值全部删掉。
四、map
map的介绍
- map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
- 在map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,为其取别名称为pair: typedef pair<const key, T> value_type;
- 在内部,map中的元素总是按照键值key进行比较排序的。
- map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
- map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
- map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。
map的用法
map的模板参数
key: 键值对中key的类型
T: 键值对中value的类型
Compare: 比较器的类型,map中的元素是按照key来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)
Alloc:通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器
map迭代器
void testmap1()
{map<string, string> map1;map1.insert(make_pair("banana", "香蕉"));map1.insert(make_pair("apple", "苹果"));map1.insert(make_pair("orange", "橙子"));map<string, string>::iterator it = map1.begin();while (it != map1.end()){cout << it->first << it->second << endl;++it;}
}
map的构造
void testmap2()
{map<int, int> map1; // 空的构造int a[] = { 1,2,3,4,5,6,7,8,88,9,10 };for (auto& e : a){map1.insert(make_pair(e, e));}map<int, int> map2(map1.begin(), map1.end()); // 迭代器区间构造map<int, int> map3(map2); // 拷贝构造for (auto& e : map3){cout << e.first << "->" << e.second << endl;}
}
map的常见修改操作
insert
void testmap3()
{std::map<char, int> mymap;// 匿名对象mymap.insert(std::pair<char, int>('a', 100));mymap.insert(std::pair<char, int>('z', 200));// 在map中插入一个键值对,迭代器加判断是否插入成功std::pair<std::map<char, int>::iterator, bool> ret;ret = mymap.insert(std::pair<char, int>('z', 500));if (ret.second == false) {std::cout << "element 'z' already existed";std::cout << " with a value of " << ret.first->second << '\n';}// 插入一个迭代器位置加值std::map<char, int>::iterator it = mymap.begin();mymap.insert(it, std::pair<char, int>('b', 300));mymap.insert(it, std::pair<char, int>('c', 400));// 迭代器区间插入,利用begin()到find('c')的位置std::map<char, int> anothermap;anothermap.insert(mymap.begin(), mymap.find('c'));std::cout << "mymap contains:\n";for (it = mymap.begin(); it != mymap.end(); ++it)std::cout << it->first << " => " << it->second << '\n';std::cout << "anothermap contains:\n";for (it = anothermap.begin(); it != anothermap.end(); ++it)std::cout << it->first << " => " << it->second << '\n';
}
还有一种很省力的方法,使用make_pair(匿名对象),因为是make_pair返回的就是pair<T1,T2>(x, y),即自动识别类型。
#include<iostream>
using namespace std;
int main()
{std::map<int, int> map1;map1.insert(make_pair(1, 1));map1.insert(make_pair(2, 2));map1.insert(make_pair(3, 3));for(auto& e : map1){cout << e << " ";}cout << endl;
}
erase
void testmap4()
{std::map<char, int> mymap;std::map<char, int>::iterator it;mymap.insert(make_pair('a', 10));mymap.insert(make_pair('b', 20));mymap.insert(make_pair('c', 30));mymap.insert(make_pair('d', 40));mymap.insert(make_pair('e', 50));mymap.insert(make_pair('f', 60));// 删除b这个位置的整个迭代器it = mymap.find('b');mymap.erase(it);// 删除键值为c的元素mymap.erase('c');// 删除迭代器区间it = mymap.find('e');mymap.erase(it, mymap.end());for (it = mymap.begin(); it != mymap.end(); ++it)std::cout << it->first << " => " << it->second << '\n';
}
find
void testmap5()
{std::map<char, int> mymap;std::map<char, int>::iterator it;mymap.insert(pair<char, int>('a', 50));mymap.insert(make_pair('b', 100));mymap.insert(pair<char, int>('c', 150));mymap.insert(pair<char, int>('d', 200));// 找到b这个键值对it = mymap.find('b');if (it != mymap.end()) // 判断是否找到mymap.erase(it);std::cout << "elements in mymap:" << '\n';std::cout << "a => " << mymap.find('a')->second << '\n';std::cout << "c => " << mymap.find('c')->second << '\n';std::cout << "d => " << mymap.find('d')->second << '\n';
}
count
void testmap6()
{std::map<char, int> mymap;char c;mymap.insert(make_pair('a', 101));mymap.insert(make_pair('b', 202));mymap.insert(make_pair('c', 303));mymap.insert(make_pair('d', 404));for (c = 'a'; c < 'h'; c++){std::cout << c;if (mymap.count(c) > 0) // 数值大于0则输出是个有值的mapstd::cout << " is an element of mymap.\n";elsestd::cout << " is not an element of mymap.\n";}
}
map的容量与元素访问 – operator[]
empty和size都好讲,一个是判空,一个是算里面的数量,而重头戏在operator[]。
[]:有插入、查找和修改的功能。
1、map中有这个key,返回value的引用。
2、map中没有这个key的匹配值,则先构造一个pair(key, T()),先插入这个key值,再将value进行默认构造,最后返回value的引用。‘
[]的底层实现:
底层实现有两个pair的方式:
第一个是像上面所述的当key在map中的时候,返回的pair(key_iterator, false),当key不在map中,返回的是pair(new_key_iterator, true),即返回的是迭代器和bool值。
第二种则是kv模型的pair,是插入的pair的数据。
V& operator[](const K& key)
{pair<iterator, bool> ret = insert(make_pair(key, V());return ret.first->second;
}
利用map统计出现次数
用直接插入法
void test_map()
{string arr[] = { "苹果","香蕉","橙子","苹果","香蕉","橙子","苹果","香蕉","橙子","梨","柠檬" };map<string, int> fruitcount;for (auto& e : arr){map<string, int>::iterator it = fruitcount.find(e);if (it != fruitcount.end()){it->second++;}else{// 刚进入fruitcount.insert(make_pair(e, 1));}}// 遍历map<string, int>::iterator it = fruitcount.begin();while (it != fruitcount.end()){cout << it->first << "=>" << it->second << endl;++it;}cout << endl;
}
用[]法
void test_map1()
{string arr[] = { "苹果","香蕉","橙子","苹果","香蕉","橙子","苹果","香蕉","橙子","梨","柠檬" };map<string, int> fruitcount;for (auto& e : arr){//1、e不在fruitcount中,插入pair(e, int()),然后对返回次数++//2、e在的话,就返回value的引用次数++fruitcount[e]++;}// 遍历map<string, int>::iterator it = fruitcount.begin();while (it != fruitcount.end()){cout << it->first << "=>" << it->second << endl;++it;}cout << endl;
}
multimap
multimap介绍
- Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key, value>,其中多个键值对之间的key是可以重复的。
- 在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内容。key和value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,value_type是组合key和value的键值对:typedef pair<const Key, T> value_type;
- 在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key进行排序的。
- multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
- multimap在底层用二叉搜索树(红黑树)来实现。
multimap的使用
void test_map2()
{multimap<string, string> mdict;mdict.insert(make_pair("sort", "排序"));mdict.insert(make_pair("left", "左边"));mdict.insert(make_pair("left", "右边"));mdict.insert(make_pair("left", "不知道"));// 遍历for (auto& e : mdict){cout << e.first << "=>" << e.second << endl;}cout << endl;
}
五、题目
前k个高频词
题目描述
解题思路
解题代码
class Solution {
public:vector<string> topKFrequent(vector<string>& words, int k) {// 用来记录次序的,本身就是按照字典序进行统计次数的map<std::string, int> countmap;for(const auto& e : words){countmap[e]++;}// 用来排序的multimap<int, string, greater<int>> sortmap;// i - 2 love - 2 leetcode - 1 coding - 1for(auto& e : countmap){sortmap.insert(make_pair(e.second, e.first));}// 开辟一个字符串数组vector<string> v;multimap<int, string, greater<int>>::iterator it = sortmap.begin();for(int i = 0; i < k; i++){v.push_back(it->second);++it;}return v;}
};
两个数组的交集
题目描述
解题思路
解题代码
class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {set<int> s1(nums1.begin(), nums1.end());set<int> s2(nums2.begin(), nums2.end());set<int>::iterator it1 = s1.begin();set<int>::iterator it2 = s2.begin();vector<int> v;while(it1 != s1.end() && it2 != s2.end()){if(*it1 < *it2){++it1;}else if(*it1 > *it2){++it2;}else{v.push_back(*it1);++it2;++it1;}}return v;}
};