【STL】set, map, multiset, multimap的介绍及使用

@TOC

关联式容器

树形结构与哈希结构

键值对

set

set的定义方式

set的使用

multiset

map

map的介绍

map的定义方式

map的插入

insert函数的参数

insert函数的返回值

map的查找

map的删除

map的[ ]运算符重载

map的迭代器遍历

map的其他成员函数

multimap

关联式容器

C++STL包含了序列式容器和关联式容器：

序列式容器里面存储的是元素本身，其底层为线性序列的数据结构。比如：vector，list，deque，forward_list(C++11)等。
关联式容器里面存储的是<key, value>结构的键值对，在数据检索时比序列式容器效率更高。比如：set、map、unordered_set、unordered_map等。

注： C++STL当中的stack、queue和priority_queue属于容器适配器，它们默认使用的基础容器分别是deque、deque和vector。

树形结构与哈希结构

根据应用场景的不同，C++STL总共实现了两种不同结构的关联式容器：树型结构和哈希结构。

关联式容器	容器结构	底层实现
set、map、multiset、multimap	树形结构	平衡搜索树（红黑树）
unordered_set、unordered_map、unordered_multiset、unordered_multimap	哈希结构	哈系数

其中，树型结构容器中的元素是一个有序的序列，而哈希结构容器中的元素是一个无序的序列。

键值对

键值对是用来表示具有一一对应关系的一种结构，该结构中一般只包含两个成员变量key和value，key代表键值，value表示与key对应的信息。

比如我们若是要建立一个英译汉的字典，那么该字典中的英文单词与其对应的中文含义就是一一对应的关系，即通过单词可以找到与其对应的中文含义。

考虑到“键值对”并不是普通类型数据，C++ STL 标准库提供了 pair 类模板，其专门用来将 2 个普通元素 first 和 second（可以是 C++ 基本数据类型、结构体、类自定的类型）创建成一个新元素<first, second>。通过其构成的元素格式不难看出，使用 pair 类模板来创建“键值对”形式的元素，再合适不过。

注意，pair 类模板定义在<utility>头文件中，所以在使用该类模板之前，需引入此头文件。另外值得一提的是，在 C++ 11 标准之前，pair 类模板中提供了以下 3 种构造函数：

#1) 默认构造函数，即创建空的 pair 对象
pair();
#2) 直接使用 2 个元素初始化成 pair 对象
pair (const first_type& a, const second_type& b);
#3) 拷贝（复制）构造函数，即借助另一个 pair 对象，创建新的 pair 对象
template<class U, class V> pair (const pair<U,V>& pr);

在 C++ 11 标准中，在引入右值引用的基础上，pair 类模板中又增添了如下 2 个构造函数：

#4) 移动构造函数
template<class U, class V> pair (pair<U,V>&& pr);
#5) 使用右值引用参数，创建 pair 对象
template<class U, class V> pair (U&& a, V&& b);

下面程序演示了以上几种创建 pair 对象的方法：

#include <iostream>
#include <utility>      // pair
#include <string>       // string
using namespace std;
int main() {// 调用构造函数 1，也就是默认构造函数pair <string, double> pair1;// 调用第 2 种构造函数pair <string, string> pair2("苹果","apple");  // 调用拷贝构造函数pair <string, string> pair3(pair2);//调用移动构造函数pair <string, string> pair4(make_pair("苹果", "apple"));// 调用第 5 种构造函数pair <string, string> pair5(string("苹果"), string("apple"));  cout << "pair1: " << pair1.first << " " << pair1.second << endl;cout << "pair2: "<< pair2.first << " " << pair2.second << endl;cout << "pair3: " << pair3.first << " " << pair3.second << endl;cout << "pair4: " << pair4.first << " " << pair4.second << endl;cout << "pair5: " << pair5.first << " " << pair5.second << endl;return 0;
}

上面程序在创建 pair4 对象时，调用了 make_pair() 函数，它也是 <utility> 头文件提供的，其功能是生成一个 pair 对象。因此，当我们将 make_pair() 函数的返回值（是一个临时对象）作为参数传递给 pair() 构造函数时，其调用的是移动构造函数，而不是拷贝构造函数。

<utility>头文件中除了提供创建 pair 对象的方法之外，还为 pair 对象重载了 <、<=、>、>=、==、!= 这 6 的运算符，其运算规则是：对于进行比较的 2 个 pair 对象，先比较 pair.first 元素的大小，如果相等则继续比较 pair.second 元素的大小。

#include <iostream>
#include <utility>      // pair
#include <string>       // string
using namespace std;int main() {pair <string, int> pair1("苹果", 20);pair <string, int> pair2("梨", 20);pair <string, int> pair3("柚子", 30);//pair1和pair2的key不同，value相同if (pair1 != pair2) {cout << "pair != pair2" << endl;}//pair2和pair3的key相同，value不同if (pair2 != pair3) {cout << "pair2 != pair3" << endl;}return 0;
}

最后需要指出的是，pair类模板还提供有一个 swap() 成员函数，能够互换 2 个 pair 对象的键值对，其操作成功的前提是这 2 个 pair 对象的键和值的类型要相同。例如：

#include <iostream>
#include <utility>      // pair
#include <string>       // string
using namespace std;
int main() {pair <string, int> pair1("pair", 10);                   pair <string, int> pair2("pair2", 20);//交换 pair1 和 pair2 的键值对pair1.swap(pair2);cout << "pair1: " << pair1.first << " " << pair1.second << endl;cout << "pair2: " << pair2.first << " " << pair2.second << endl;return 0;
}

set

set的介绍
set是按照一定次序存储元素的容器，使用set的迭代器遍历set中的元素，可以得到有序序列。

set当中存储元素的value都是唯一的，不可以重复，因此可以使用set进行去重。

与map/multimap不同，map/multimap中存储的是真正的键值对<key, value>，set中只放value，但在底层实际存放的是由<value, value>构成的键值对，因此在set容器中插入元素时，只需要插入value即可，不需要构造键值对。

set中的元素不能被修改，因为set在底层是用二叉搜索树来实现的，若是对二叉搜索树当中某个结点的值进行了修改，那么这棵树将不再是二叉搜索树。

在内部，set中的元素总是按照其内部比较对象所指示的特定严格弱排序准则进行排序。当不传入内部比较对象时，set中的元素默认按照小于来比较。

set容器通过key访问单个元素的速度通常比unordered_set容器慢，但set容器允许根据顺序对元素进行直接迭代。

set在底层是用平衡搜索树（红黑树）实现的，所以在set当中查找某个元素的时间复杂度为log(N)。

set的定义方式

方式一： 构造一个某类型的空容器。

set<int> s1; //构造int类型的空容器

方式二： 拷贝构造某类型set容器的复制品。

set<int> s2(s1); //拷贝构造int类型s1容器的复制品

方式三： 使用迭代器拷贝构造某一段内容。

string str("abcdef");
set<char> s3(str.begin(), str.end()); //构造string对象某段区间的复制品

方式四： 构造一个某类型的空容器，比较方式指定为大于。

set < int, greater<int>> s4; //构造int类型的空容器，比较方式指定为大于

set的使用

set当中常用的成员函数如下：

成员函数	功能
insert	插入指定元素
erase	删除指定元素
find	查找指定元素
size	获取容器中元素的个数
empty	判断容器是否为空
clear	清空容器
swap	交换两个容器中的数据
count	获取容器中指定元素值的元素个数

set当中迭代器相关函数如下：

成员函数	功能
begin	获取容器中第一个元素的正向迭代器
end	获取容器中最后一个元素下一个位置的正向迭代器
rbegin	获取容器中最后一个元素的反向迭代器
rend	获取容器中第一个元素前一个位置的反向迭代器

使用示例：

#include <iostream>
#include <set>
#include <utility>
using namespace std;int main()
{set<int> s;//插入元素（去重）s.insert(1);s.insert(4);s.insert(3);s.insert(3);s.insert(2);s.insert(2);s.insert(3);//遍历容器方式一（范围for）for (auto e : s){cout << e << " ";}cout << endl; //1 2 3 4//删除元素方式一s.erase(3);//删除元素方式二set<int>::iterator pos = s.find(1); //查找值为1的元素if (pos != s.end()){s.erase(pos);}//遍历容器方式二（正向迭代器）set<int>::iterator it = s.begin();while (it != s.end()){cout << *it << " ";it++;}cout << endl; //2 4//容器中值为2的元素个数cout << s.count(2) << endl; //1//容器大小cout << s.size() << endl; //2//清空容器s.clear();//容器判空cout << s.empty() << endl; //1//交换两个容器的数据set<int> tmp{ 11, 22, 33, 44 };s.swap(tmp);//遍历容器方式三（反向迭代器）set<int>::reverse_iterator rit = s.rbegin();while (rit != s.rend()){cout << *rit << " ";rit++;}cout << endl; //44 33 22 11return 0;
}

multiset

multiset容器与set容器的底层实现一样，都是平衡搜索树（红黑树），其次，multiset容器和set容器所提供的成员函数的接口都是基本一致的，这里就不再列举了，multiset容器和set容器的唯一区别就是，multiset允许键值冗余，即multiset容器当中存储的元素是可以重复的。

#include <iostream>
#include <set>
#include <utility>
using namespace std;int main()
{multiset<int> ms;//插入元素（允许重复）ms.insert(1);ms.insert(4);ms.insert(3);ms.insert(3);ms.insert(2);ms.insert(2);ms.insert(3);for (auto e : ms){cout << e << " ";}cout << endl; //1 2 2 3 3 3 4return 0;
}

由于multiset容器允许键值冗余，因此两个容器中成员函数find和count的意义也有所不同：

成员函数find	功能
set对象	返回值为val的元素的迭代器
multiset对象	返回底层搜索树中序的第一个值为val的元素的迭代器

成员函数count	功能
set对象	值为val的元素存在则返回1，不存在则返回0（find成员函数可代替）
multiset对象	返回值为val的元素个数（find成员函数不可代替）

map

map的介绍

map是关联式容器，它按照特定的次序（按照key来比较）存储键值key和值value组成的元素，使用map的迭代器遍历map中的元素，可以得到有序序列。
在map中，键值key通常用于排序和唯一地标识元素，而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同，并且在map的内部，key与value通过成员类型value_type绑定在一起，并取别名为pair。
map容器中元素的键值key不能被修改，但是元素的值value可以被修改，因为map底层的二叉搜索树是根据每个元素的键值key进行构建的，而不是值value。
在内部，map中的元素总是按照键值key进行比较排序的。当不传入内部比较对象时，map中元素的键值key默认按照小于来比较。
map容器通过键值key访问单个元素的速度通常比unordered_map容器慢，但map容器允许根据顺序对元素进行直接迭代。
map容器支持下标访问符，即在[]中放入key，就可以找到与key对应的value。
map在底层是用平衡搜索树（红黑树）实现的，所以在map当中查找某个元素的时间复杂度为log(N)。

map的定义方式

方式一： 指定key和value的类型构造一个空容器。

map<int, double> m1; //构造一个key为int类型，value为double类型的空容器

方式二： 拷贝构造某同类型容器的复制品。

map<int, double> m2(m1); //拷贝构造key为int类型，value为double类型的m1容器的复制品

方式三： 使用迭代器拷贝构造某一段内容。

map<int, double> m3(m2.begin(), m2.end()); //使用迭代器拷贝构造m2容器某段区间的复制品

方式四： 指定key和value的类型构造一个空容器，key比较方式指定为大于。

map<int, double, greater<int>> m4; //构造一个key为int类型，value为double类型的空容器，key比较方式指定为大于

map的插入

map的插入函数的函数原型如下

pair<iterator,bool> insert (const value_type& val);

insert函数的参数

insert函数的参数显示是value_type类型的，实际上value_type就是pair类型的别名：

typedef pair<const Key, T> value_type;

因此，我们向map容器插入元素时，需要用key和value构造一个pair对象，然后再将pair对象作为参数传入insert函数。

方式一： 构造匿名对象插入。

#include <iostream>
#include <string>
#include <map>
#include <utility>
using namespace std;int main()
{map<int, string> m;//方式一：调用pair的构造函数，构造一个匿名对象插入m.insert(pair<int, string>(2, "two"));m.insert(pair<int, string>(1, "one"));m.insert(pair<int, string>(3, "three"));for (auto e : m){cout << "<" << e.first << "," << e.second << ">" << " ";}cout << endl; //<1,one> <2,two> <3,three>return 0;
}

但是这种方式会使得我们的代码变得很长，尤其是没有直接展开命名空间的情况下，因此我们最常用的是方式二。

方式二： 调用make_pair函数模板插入。

在库当中提供以下make_pair函数模板：

template <class T1, class T2>
pair<T1, T2> make_pair(T1 x, T2 y)
{return (pair<T1, T2>(x, y));
}

我们只需向make_pair函数传入key和value，该函数模板会根据传入参数类型进行自动隐式推导，最终构造并返回一个对应的pair对象。

#include <iostream>
#include <string>
#include <utility>
#include <map>
using namespace std;int main()
{map<int, string> m;//方式二：调用函数模板make_pair，构造对象插入m.insert(make_pair(2, "two"));m.insert(make_pair(1, "one"));m.insert(make_pair(3, "three"));for (auto e : m){cout << "<" << e.first << "," << e.second << ">" << " ";}cout << endl; //<1,one> <2,two> <3,three>return 0;
}

insert函数的返回值

insert函数的返回值也是一个pair对象，该pair对象中第一个成员的类型是map的迭代器类型，第二个成员的类型的一个bool类型，具体含义如下：

若待插入元素的键值key在map当中不存在，则insert函数插入成功，并返回插入后元素的迭代器和true。
若待插入元素的键值key在map当中已经存在，则insert函数插入失败，并返回map当中键值为key的元素的迭代器和false。

map的查找

map的查找函数的函数原型如下：

iterator find (const key_type& k);

map的查找函数是根据所给key值在map当中进行查找，若找到了，则返回对应元素的迭代器，若未找到，则返回容器中最后一个元素下一个位置的正向迭代器。

#include <iostream>
#include <string>
#include <utility>
#include <map>
using namespace std;int main()
{map<int, string> m;m.insert(make_pair(2, "two"));m.insert(make_pair(1, "one"));m.insert(make_pair(3, "three"));//获取key值为2的元素的迭代器map<int, string>::iterator pos = m.find(2);if (pos != m.end()){cout << pos->second << endl; //two}return 0;
}

map的删除

map的删除函数的函数原型如下：

//删除函数1
size_type erase (const key_type& k);//删除函数2
void erase(iterator position);

也就是说，我们既可以根据key值删除指定元素，也可以根据迭代器删除指定元素，若是根据key值进行删除，则返回实际删除的元素个数。

#include <iostream>
#include <string>
#include <map>
#include <utility>
using namespace std;int main()
{map<int, string> m;m.insert(make_pair(2, "two"));m.insert(make_pair(1, "one"));m.insert(make_pair(3, "three"));//方式一：根据key值进行删除m.erase(3);//方式二：根据迭代器进行删除map<int, string>::iterator pos = m.find(2);if (pos != m.end()){m.erase(pos);}return 0;
}

map的[ ]运算符重载

map的[ ]运算符重载函数的函数原型如下：

mapped_type& operator[] (const key_type& k);

[ ]运算符重载函数的参数就是一个key值，而这个函数的返回值如下：

(*((this->insert(make_pair(k, mapped_type()))).first)).second

就这样看着不太好理解，我们整理一下，实际上[ ]运算符重载实现的逻辑实际上就是以下三个步骤：

调用insert函数插入键值对。
拿出从insert函数获取到的迭代器。
返回该迭代器位置元素的值value。

对应分解代码如下：

mapped_type& operator[] (const key_type& k)
{//1、调用insert函数插入键值对pair<iterator, bool> ret = insert(make_pair(k, mapped_type()));//2、拿出从insert函数获取到的迭代器iterator it = ret.first;//3、返回该迭代器位置元素的值valuereturn it->second;
}

那么这个函数的价值体现在哪里呢？我们来看看下面这段代码：

#include <iostream>
#include <utility>
#include <string>
#include <map>
using namespace std;int main()
{map<int, string> m;m.insert(make_pair(2, "two"));m.insert(make_pair(1, "one"));m.insert(make_pair(3, "three"));m[2] = "苹果"; //修改key值为2的元素的value为"苹果"m[6] = "柚子"; //插入键值对<6, "柚子">for (auto e : m){cout << "<" << e.first << "," << e.second << ">" << " ";}cout << endl; //<1,one> <2,"苹果"> <3,three> <6,"柚子">return 0;
}

以代码中的m[2] = "苹果"为例说明，通过[ ]运算符重载函数的三个步骤后，不管是调用insert函数插入的也好，是容器当中本来就已经存在的也好，反正无论如何map容器当中都已经有了一个key值为2的元素。而[ ]运算符重载函数的返回值就是这个key值为2的元素的value的引用，因此我们对该函数的返回值做修改，实际上就是对键值为2的元素的value做修改。

总结一下：

如果k不在map中，则先插入键值对<k, V()>，然后返回该键值对中V对象的引用。
如果k已经在map中，则返回键值为k的元素对应的V对象的引用。

map的迭代器遍历

map当中迭代器相关函数如下：

成员函数	功能
begin	获取容器中第一个元素的正向迭代器
end	获取容器中最后一个元素下一个位置的正向迭代器
rbegin	获取容器中最后一个元素的反向迭代器
rend	获取容器中第一个元素前一个位置的反向迭代器

遍历方式一： 用正向迭代器进行遍历。

//用正向迭代器进行遍历map<int, string>::iterator it = m.begin();while (it != m.end()){cout << "<" << it->first << "," << it->second << ">" << " ";it++;}

遍历方式二： 用反向迭代器进行遍历。

//用反向迭代器进行遍历map<int, string>::reverse_iterator rit = m.rbegin();while (rit != m.rend()){cout << "<" << rit->first << "," << rit->second << ">" << " ";rit++;}

遍历方式三： 用范围for进行遍历。

//用范围for进行遍历for (auto e : m){cout << "<" << e.first << "," << e.second << ">" << " ";}

注意： 编译器在编译时会自动将范围for替换为迭代器的形式，因此支持了迭代器实际上就支持了范围for。

map的其他成员函数

除了上述成员函数外，set当中还有如下成员函数

成员函数	功能
size	获取容器中元素的个数
empty	判断容器是否为空
clear	清空容器
swap	交换两个容器中的数据
count	获取容器中指定key值的元素个数

使用方法和set差不多。

multimap

multimap容器与map容器的底层实现一样，也都是平衡搜索树（红黑树），其次，multimap容器和map容器所提供的成员函数的接口都是基本一致的，这里也就不再列举了，multimap容器和map容器的区别与multiset容器和set容器的区别一样，multimap允许键值冗余，即multimap容器当中存储的元素是可以重复的。
由于multimap容器允许键值冗余，因此两个容器中成员函数find和count的意义也有所不同：

成员函数find	功能
map对象	返回值为键值为key的元素的迭代器
multimap对象	返回底层搜索树中序的第一个键值为key的元素的迭代器

成员函数count	功能
map对象	键值为key的元素存在则返回1，不存在则返回0（find成员函数可代替）
multimap对象	返回键值为key的元素个数（find成员函数不可代替）

其次，由于multimap容器允许键值冗余，调用[ ]运算符重载函数时，应该返回键值为key的哪一个元素的value的引用存在歧义，因此在multimap容器当中没有实现[ ]运算符重载函数。