目录
1. 什么是STL
2. STL的版本
3. STL的六大组件
4.STL的缺陷
5.string类
1. 为什么学习string类?
6.string类的常用接口说明(下面我们只讲解最常用的接口)
1.string 常见构造
2.string类的遍历
iterator 迭代器遍历 (主流)通用的遍历方式
反向迭代器
const迭代器
范围for (底层就是迭代器)
7. string类对象的容量操作
8. string类对象的修改操作
9. string类非成员函数
1. 什么是STL
STL(standard template libaray-标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且 是一个包罗数据结构与算法的软件框架。
2. STL的版本
- 原始版本 Alexander Stepanov、Meng Lee 在惠普实验室完成的原始版本,本着开源精神,他们声明允许任何人任意 运用、拷贝、修改、传播、商业使用这些代码,无需付费。唯一的条件就是也需要向原始版本一样做开源使 用。
- HP 版本--所有STL实现版本的始祖。 P. J. 版本 由P. J. Plauger开发,继承自HP版本,被Windows Visual C++采用,不能公开或修改,缺陷:可读性比较低, 符号命名比较怪异。
- RW版本 由Rouge Wage公司开发,继承自HP版本,被C+ + Builder 采用,不能公开或修改,可读性一般。
- SGI版本 由Silicon Graphics Computer Systems,Inc公司开发,继承自HP版 本。被GCC(Linux)采用,可移植性好, 可公开、修改甚至贩卖,从命名风格和编程 风格上看,阅读性非常高。我们后面学习STL要阅读部分源代码, 主要参考的就是这个版本。
3. STL的六大组件
网上有句话说:“不懂STL,不要说你会C++”。STL是C++中的优秀作品,有了它的陪伴,许多底层的数据结构 以及算法都不需要自己重新造轮子,站在前人的肩膀上,健步如飞的快速开发。
4.STL的缺陷
- STL库的更新太慢了。这个得严重吐槽,上一版靠谱是C++98,中间的C++03基本一些修订。C++11出 来已经相隔了13年,STL才进一步更新。
- STL现在都没有支持线程安全。并发环境下需要我们自己加锁。且锁的粒度是比较大的。
- STL极度的追求效率,导致内部比较复杂。比如类型萃取,迭代器萃取。
- STL的使用会有代码膨胀的问题,比如使用vector/vector/vector这样会生成多份代码,当然这是模板语法本身导致的。
5.string类
1. 为什么学习string类?
C语言中的字符串
C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数, 但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。
标准库中的string类
string类(了解)
在学习这类容器的时候我们建议是结合着文档一起:在这里推荐cplusplus
- 1. 字符串是表示字符序列的类
- 2. 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符字符串的设计特性。
- 3. string类是使用char(即作为它的字符类型,使用它的默认char_traits和分配器类型(关于模板的更多信息,请参阅basic_string)。
- 4. string类是basic_string模板类的一个实例,它使用char来实例化basic_string模板类,并用char_traits 和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string)。
- 5. 注意,这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列,这个类的所有成员(如长度或大小)以及它的迭代器,将仍然按照字节(而不是实际编码的字符)来操作。
总结:
- 1. string是表示字符串的字符串类
- 2. 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
- 3. string在底层实际是:basic_string模板类的别名,typedef basic_string string;
- 4. 不能操作多字节或者变长字符的序列。
在使用string类时,必须包含#include头文件以及using namespace std;
6.string类的常用接口说明(下面我们只讲解最常用的接口)
1.string 常见构造
我们能看到光构造函数就有7个
通过文档我们能知道:
1.是我们熟知的默认构造
2.是我们的拷贝构造
3.从pos位置开始取len个长度 一部分开始构造,但是我们能看到后面还有一个npos,通过文档我们知道,如果len这个长度超过从pos位置到结尾的长度,或者len给的是npos这个位置的缺省参数,那么就取到结尾有多少取多少。
我们能看到这个npos是一个静态的常量给的值是-1;为什么?
因为是size_t 是一个无符号整数 是整型的最大值
4.用字符串c-string 字符串结尾是/0进行构造
5.first n 用前n个进行构造
6.n个字符进行初始化
提供多种初始化方式
#include<iostream>
#include<string>
using namespace std;void test_string1()
{string s; //构造空的string类对象 sstring s1("hello world"); //用c类字符串构造string s2(s1); //拷贝构造string s3(s1, 5);string s4(s1, 5,3);//这里能直接打印是因为库里面已经重载了cout << s << endl;cout << s1 << endl;cout << s2 << endl;cout << s3 << endl;cout << s4 << endl;
}int main()
{test_string1();return 0;
}
2.string类的遍历
operator[]:返回pos位置的字符,const string类对象调用
库里面已经对【】进行了重载,所以我们可以用下标加【】的方法进行遍历和修改 我们能看到下面还有一个const 的版本,给const 版本的 防止进行修改
void test_string2()
{string s1("hello world");for (size_t i = 0; i < s1.size(); ++i){cout << s1[i] << " ";}cout << endl;
}
void test_string3()
{string s3("hello world");cout << s3[4] << endl;cout << s3.at(4) << endl;//at和【】一样在使用功能上并无差异 对于越界的检查有所不同
}
iterator 迭代器遍历 (主流)通用的遍历方式
begin+ end :begin获取一个字符的迭代器 + end获取最后一个字符下一个位置(\0)的迭代器
行为像指针,但不一定是指针
string s3(s1);string::iterator it3 = s3.begin(); //可读可写while (it3 != s3.end()){cout << *it3 << " ";++ it3;}cout << endl;
反向迭代器
rbegin + rend :begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器
string::reverse_iterator rit = s1.rbegin(); while (rit != s1.rend()){cout << *rit << " ";++rit;}cout << endl;
const迭代器
const string s2("hello world");string::const_iterator it4 = s2.begin(); //只读while (it4!=s2.end()){cout << *it4 << " ";++it4;}cout << endl;
范围for (底层就是迭代器)
for (auto e : s3){cout << e << "";}cout << endl;
//底层就是迭代器,对迭代器的封装
7. string类对象的容量操作
- size:返回字符串有效字符长度(统一)
- length:返回字符串有效字符长度(合理)
- capacity:返回空间总大小
- empty:检测字符串释放为空串,是返回true,否则返回false
- clear:清空有效字符 空间不会释放
- reserve: 为字符串预留空间** 优势:多次插入有代价 前提:知道多大的空间提前开好 可能会多开 不会缩容 比capacity大才会扩容 改变容量 提高效率
- resize: 将有效字符的个数该成n个,多出的空间用字符c填充 改变数据,扩容
<size 删除
size<n<capacity
插入 capacity<n 扩容+插入
- shrink_to_fit:缩容(c++ 11)
capacity扩容机制
//查看扩容机制
void TestPushBack()
{string s;size_t sz = s.capacity();cout << "capacity changed: " << sz << '\n';cout << "making s grow:\n";for (int i = 0; i < 100; ++i){s.push_back('c');if (sz != s.capacity()){sz = s.capacity();cout << "capacity changed: " << sz << '\n';}}
}
我们能看到第一次是二倍,后续都是1.5扩容,在后面我们会进行讲
相同的代码我们在liunx中能看到是二倍扩容
STL是一种规则 平台下的实现会有一定的差异
缩容
对数据进行缩容:默认缩容到15
注意:
- 1. size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一 致,一般情况下基本都是用size()。
- 2. clear()只是将string中有效字符清空,不改变底层空间大小
- 3. resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用0来填充多出的元素空间,resize(size_t n, char c)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大 小,如果是将元素个数减少,底层空间总大小不变。
- 4. reserve(size_t res_arg=0):为string预留空间,不改变有效元素个数,当reserve的参数小于string的底层空间总大小时,reserver不会改变容量大小。
8. string类对象的修改操作
push_back:在字符串后尾插字符c
append:在字符串后追加一个字符串
operator+= (重点):在字符串后追加字符串str
c_str(重点):返回C格式字符串
find + npos(重点):从字符串pos位置开始往后找字符c,返回该字符在字符串中的位置
rfind:从字符串pos位置开始往前找字符c,返回该字符在字符串中的位置
substr:在str中从pos位置开始,截取n个字符,然后将其返回
assign:将当前字符串覆盖
insert:pos位置之前插入 挪动数据 效率低 少用
erase: 从第pos个位置开始删除n个值 效率低 少用 全缺省 (clear)
replace: 将(下标 几个 替换成什么)设计挪动数据 可以结合find +npos 挪动数据 少用
void test_string5()
{//string s5("tast.txt");string s5("tast.txts.zip");//拿到文件后缀//size_t pos=s5.find('.');size_t pos = s5.rfind('.');if (pos != string::npos){string suffixs = s5.substr(pos);cout << suffixs << endl;}cout << endl;
}
void test_string4()
{
//拿到字符串中的指定数据xxx进行替换string s("hello world xxx");s.insert(0, "xx");cout << s << endl;s.erase(0, 2);cout << s << endl;string s1("hello world xxx");//s1.replace(12,3,"aaa");size_t pos = s1.find('x');while(pos != string::npos){s1.replace(pos, 1, "a");pos = s1.find("x"); }cout << s1 << endl;
}
注意
- 1. 在string尾部追加字符时,s.push_back(c) / s.append(1, c) / s += 'c'三种的实现方式差不多,一般情况下string类的+=操作用的比较多,+=操作不仅可以连接单个字符,还可以连接字符串。
- 2. 对string操作时,如果能够大概预估到放多少字符,可以先通过reserve把空间预留好。
9. string类非成员函数
operator+ 尽量少用,因为传值返回,导致深拷贝效率低
operator>> (重点) 输入运算符重载 ascii比较
operator<< (重点) 输出运算符重载
getline (重点) 获取一行字符串
relational operators (重点) 大小比较
上面的几个接口大家了解一下,string类中还有一些其他的 操作,这里不一一列举,大家在需要用到时不明白了查文档即可。下一篇我们模拟实现string