作者主页: 作者主页
本篇博客专栏:C++
创作时间 :2024年6月30日
前言:
本文主要介绍STL容器之一 ---- string,在学习C++的过程中,我们要将C++视为一个语言联邦(摘录于Effective C++ 条款一)。如何理解这句话呢,我们学习C++,可将其分为四个板块;分别为C、Object-Oriented C++(面向对象的C++)、Template C++(模板)、STL。本文就介绍STL中的string;
一、string是什么?
string是STL文档的容器之一,是一个自定义类型,是一个类,由类模板basic_string实例化出来的一个类;
我们看一下cplusplus上是咋介绍的?
我们简单看一下即可,下面我来为大家做介绍。
二、string的使用:
由于string出现的时间实际是早于STL的,是后来划分进STL库的,所以string开始的设计比较冗余,有许多没有必要的接口(一共106个接口函数);这也是被广大C++程序员吐槽的一个槽点,我们无需将每一个接口都记住,我们需要将核心接口记住并熟练使用,遇见一些默认的接口查看文档即可;
2.1构造函数
在C++98中,string的构造函数一种有如下7种;
int main() {// 1、无参默认构造// string();string s1;// 2、拷贝构造 // string (const string& str);string s2(s1);// 4、通过字符串常量初始化 // string (const char* s);string s4("hello world");// 3、通过字符串子串初始化 // string (const string& str, size_t pos, size_t len = npos);string s3(s4, 5, 5);// 5、通过字符串前n个字符初始化 // string (const char* s, size_t n);string s5("hello wrold", 6);// 6、用n个字符c初始化字符串 // string (size_t n, char c);string s6(10, 'x');// 7、迭代器区间初始化(暂不介绍)return 0; }
其中提一下第三种,pos为子串的位置,len子串的长度,若len大于从子串pos位置开始后面字符总数,则表示初始化到子串结尾即可,比如我们要用 “hello world” 初始化字符串,若pos为6,len为20,则用world初始化字符串s1;len还有一个缺省值npos,其数值为无符号整型的-1,也就是无符号的最大值(无符号无负数);
2.2赋值重载:
赋值重载使string能够用=对string对象重新赋值,string的赋值重载一共有有如下三种;
int main() {string tmp("hello world");string s1;string s2;string s3;// 1、string类进行赋值重载s1 = tmp;// 2、使用字符串常量赋值重载s2 = "hello world";// 3、使用字符赋值重载s3 = 'A';return 0; }
2.3容量相关接口
首先介绍如下六个简单一些的接口;
int main() {string s1("hello world");// string中储存的字符个数(不包括\0)cout << s1.length() << endl;// 与length功能相同cout << s1.size() << endl;// 可以最多储存多少个字符(理论值,实际上并没有那么多)cout << s1.max_size() << endl;// string的当前容量cout << s1.capacity() << endl;// 当前string对象是否为空cout << s1.empty() << endl;// 清空s1中所有字符s1.clear();return 0; }
其中的length与size两种并无相异,由于string出现的较早,当时没有STL其他容器,先出现了length,后来为了统一接口,于其他容器接口保持一致,因此出现了size;
int main() {// reserve 提前开空间(可能会大于指定的大小,因此开空间规则不同)string s1;s1.reserve(100);cout << s1.size() << endl;cout << s1.capacity() << endl;// resize 提前开空间并初始化 缺省值为0string s2;s2.resize(100);cout << s2.size() << endl;cout << s2.capacity() << endl;s2 += "hhhhhh";return 0; }
我们发现reserve仅仅只是修改capacity,而resize不仅会修改capacity,还会修改size,然后用第二个参数取去初始化新增的区间;当指定大小小于原来空间时,reserve什么都不会做,而resize则会则断大于指定大小后面的区域(在后面补零);
总结:reserve仅改变capacity,resize既改变capacity又改变size;当指定大小小于字符串的size时,resize还可以截断(在后面补 \0 )
2.4迭代器
迭代器是STL库中的一个特殊的存在,我们可以通过迭代器对string类中的字符进行增删查改; 在string类中,我们可将其视为指针;string类中的迭代器接口有如下几种;
begin函数返回的是字符串中第一个字符的位置的迭代器,而end函数返回的字符串中最后一个字符的下一个位置的迭代器; 因此遍历一个string类,有一下三种方法;
int main() {string s1("hello world");// 三种遍历方式// 1、通过[]来访问每一个字符for (int i = 0; i < s1.size(); i++){cout << s1[i] << " ";}cout << endl;// 2、通过迭代来来访问每一个字符string::iterator it = s1.begin();while (it != s1.end()){cout << *it << " ";it++;}cout << endl;// 3、通过范围for(其实范围for就是编译器替换成了迭代器遍历的方法)for (auto ch : s1){cout << ch << " ";}cout << endl;return 0; }
rbegin与rend系列为反向迭代器;rbegin返回的是最后一个字符的位置的迭代器,rend返回的是第一个字符的前一个位置的迭代器;
我们可以通过反向迭代器,对其逆向遍历;反向迭代器的类型为 string::reverse_iterator;
int main() { string s1("hello world");string::reverse_iterator rit = s1.rbegin();while (rit != s1.rend()){cout << *rit << " ";rit++;}}
2.5下标访问:
关于元素的访问,也有如下四个接口,最常用的还是方括号;
int main() {// []重载使string可以像字符数组一样访问string s1("hello world");cout << s1[0] << endl;cout << s1[1] << endl;// at 于[] 功能相同,只不过[]的越界是由assert来限制,而at则是抛异常cout << s1.at(0) << endl;cout << s1.at(1) << endl;// front访问string中第一个字符cout << s1.front() << endl;// back访问string中最后一个字符cout << s1.back() << endl;return 0; }
方括号的使用如同数组的方括号使用相同;at与方括号用法相同,只是遇见非法访问时是抛异常解决;
2.6修改
string的修改接口设计得十分冗余;其中我们可以用+=替代append与push_back;实际中,也是+=用得比较多,但是我们还是了解一下相关用法;
+=我们可以加等一个string类,可以加等一个字符,也可以加等一个字符指针;因此有以下用法;
int main() {string tmp("xxxx");string s1("hello world");// += 字符s1 += ' ';// += string类s1 += tmp;// += 字符指针s1 += " hello world";cout << s1 << endl; }
int main() {string tmp("xxxx");string s1;// 尾加字符// void push_back (char c);s1.push_back('c');// 尾加string类 // string& append (const string& str);s1.append(tmp);// 尾加string从subpos位置开始的sublen个字符 //string& append (const string& str, size_t subpos, size_t sublen);s1.append(tmp, 2, 3);// 用字符指针指向的字符串/字符尾加// string& append (const char* s);s1.append("hello world");// 用字符指针指向的字符串的前n个字符尾加// string& append (const char* s, size_t n);s1.append("hello world", 6);// 尾加n个c字符 // string& append (size_t n, char c);s1.append(5, 'x');// 迭代器区间追加// template <class InputIterator>// string& append(InputIterator first, InputIterator last);s1.append(tmp.begin(), tmp.end());cout << s1 << endl;return 0; }
assign为string的赋值函数;是一个扩增版的operator =,用的并不多,主要用法如下;
int main() {string tmp("hello world");string s1;// 使用string类对其赋值// string& assign (const string& str);s1.assign(tmp);cout << s1 << endl;// 使用string类中从subpos位置开始的sublen个串来赋值// string& assign (const string& str, size_t subpos, size_t sublen);s1.assign(tmp, 2, 5);cout << s1 << endl;// 使用字符指针所指向的字符串对其赋值// string& assign (const char* s);s1.assign("hello naiths");cout << s1 << endl;// 使用字符指针所指向的字符串的前n个对其赋值// string& assign (const char* s, size_t n);s1.assign("hello naiths", 7);cout << s1 << endl;// 使用n个c字符对其赋值// string& assign (size_t n, char c);s1.assign(10, 'x');cout << s1 << endl;// 使用迭代器对其赋值// template <class InputIterator>// string& assign(InputIterator first, InputIterator last);s1.assign(tmp.begin(), tmp.end());cout << s1 << endl;return 0; }
int main() {string tmp("hello world");string s1;// 在pos位置插入string类字符串// string& insert (size_t pos, const string& str);s1.insert(0, tmp);cout << s1 << endl;// 在pos位置插入str的子串(subpos位置开始的sublen个字符)// string& insert (size_t pos, const string& str, size_t subpos, size_t sublen);s1.insert(7, tmp, 0, 6);cout << s1 << endl;// 在pos位置插入字符指针指向的字符串// string& insert (size_t pos, constchar* s);s1.insert(2, "xxx");cout << s1 << endl;// 在pos位置插入字符指针指向的字符串的前n个字符// string& insert (size_t pos, const char* s, size_t n);s1.insert(7, "hello naiths", 8);cout << s1 << endl;// 在pos位置插入n个c字符// string& insert (size_t pos, size_t n, char c);s1.insert(0, 5, 'y');cout << s1 << endl;// 指定迭代器的位置插入n个字符c// void insert (iterator p, size_t n, char c);string::iterator it = s1.begin() + 10;s1.insert(it, 10, 'z');cout << s1 << endl;// 指定迭代器的位置插入字符c// iterator insert (iterator p, char c);s1.insert(s1.begin(), 'A');cout << s1 << endl;// 指定p位置插入迭代器区间的字符// template <class InputIterator>// void insert(iterator p, InputIterator first, InputIterator last);s1.insert(s1.begin(), tmp.begin() + 3, tmp.begin() + 8);cout << s1 << endl;// 删除pos位置开始的len个字符// string& erase (size_t pos = 0, size_t len = npos);s1.erase(2, 5);cout << s1 << endl;// 删除迭代器位置的那个字符// iterator erase (iterator p);s1.erase(s1.begin());cout << s1 << endl;// 删除迭代器区间的字符// iterator erase (iterator first, iterator last);s1.erase(s1.begin() + 2, s1.begin() + 5);cout << s1 << endl;return 0; }
三、string底层实现
其实对于上面的这些库里面的函数,我们不需要全去记住,记住一些常用的即可,其他的等到我们要用到的时候去cplusplus网站里面找即可,对于下面我们要自己实现的函数,一定要记住,这些函数用的都是比较多的。
#pragma once
#define _CRT_SECURE_NO_WARNINGS#include<iostream>
#include<assert.h>
using namespace std;namespace bit
{class string{public://string();//不传参的情况string(const string& s);string(const char* str = "");//这里可以之际全缺省~string();const char* c_str() const;size_t size() const;char& operator[](size_t pos);const char& operator[](size_t pos) const;string& operator=(const string& s);//实现一个迭代器typedef char* iterator;iterator begin();iterator end();typedef const char* const_iterator;const_iterator begin() const;const_iterator end() const;void reserve(size_t n);void push_back(char ch);void append(const char* str);string& operator+=(char ch);string& operator+=(const char* str);void insert(size_t pos, char ch);void insert(size_t pos, const char* str);void erase(size_t pos, size_t len=npos);size_t find(char ch, size_t pso = 0);size_t find(const char* str, size_t pos = 0);void swap(string& s);string substr(size_t pos,size_t len);void clear();private:char* _str;size_t _size;size_t _capacity;const static size_t npos;};istream& operator>>(istream& is, string& str);ostream& operator<<(ostream& os, const string& str);}
上面这些就是我们要实现的一些函数的底层是什么样的,当然,我只是基于自己的理解去写这些,比起C++库里面的肯定要low一点,所以我们理解基础的一些思路即可。
下面我们来看一下这些代码,大家看一下,想要更好的理解可以自己去实现一遍。
#include"string.h"namespace bit
{//深拷贝string::string(const string& s){_str = new char[s._capacity + 1];strcpy(_str, s._str);_size = s._size;_capacity = s._capacity;}const size_t string::npos = -1;//不传参的析构//string::string()/*{_str = new char[1] {'\0'};_size = 0;_capacity = 0;}*///构造函数string::string(const char* str)//strlen是运行时计算长度,效率比较低,三个strlen重复计算了//但是如果像下面这样写,还是会出现一些问题,因为初始化列表的初始化是按声明的顺序初始化,这里就会出现问题/*:_str(new char[strlen(str) + 1]),_size(strlen(str)),_capacity(strlen(str))*/: _size(strlen(str)){_capacity = _size;_str = new char[_size + 1];strcpy(_str, str);}//赋值string& string::operator=(const string& s){//避免自己给自己赋值if (this != &s){char* tmp = new char[s._capacity + 1];strcpy(tmp, s._str);//这样写是为了避免前面的空间大小小于后面的那个delete[] _str;_str = tmp;}return *this;}//析构string::~string(){delete[] _str;_size = 0;_capacity = 0;}//打印const char* string::c_str() const//像这种用于打印的函数,可以在后面加上一个const,//加上const意味着不能修改指向的内容和本事的值,这样即使放生权限的缩小依然不会报错{return _str;}size_t string::size() const{return _size;}char& string::operator[](size_t pos)//可读可写{assert(pos < _size);return _str[pos];}const char& string::operator[](size_t pos) const{assert(pos < _size);return _str[pos];}//迭代器string::iterator string::begin(){return _str;}string::iterator string::end(){return _str + _size;}//无法修改的迭代string::const_iterator string::begin() const{return _str;}string::const_iterator string::end() const{return _str + _size;}void string::reserve(size_t n){if (n > _capacity){char* tmp = new char[n + 1];strcpy(tmp, _str);delete[]_str;_str = tmp;_capacity = n;}}void string::push_back(char ch){if (_size == _capacity){size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;reserve(newcapacity);}_str[_size] = ch;_str[++_size] = '\0';}void string::append(const char* str){size_t len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}strcpy(_str + _size, str);_size += len;}string& string::operator+=(char ch){push_back(ch);return *this;}string& string::operator+=(const char* str){append(str);return *this;}void string::insert(size_t pos, const char* str){assert(pos <= _size);size_t len = strlen(str);if (_size + len >= _capacity){reserve(_size + len);}int end = _size;while (end >= pos){_str[end+len] = _str[end];--end;}memcpy(_str + pos, str, len);_size += len;}void string::insert(size_t pos,char ch){if (_size == _capacity){size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;reserve(newcapacity);}size_t end = _size;while (end >= pos){_str[end + 1] = _str[end];--end;}_str[pos] = ch;}void string::erase(size_t pos, size_t len){assert(pos <= _size);//当len大于前面的个数if (len>=_size-pos){_str[pos] = '\0';_size = pos;}else{strcpy(_str + pos, _str + pos + len);_size -= len;}}size_t string::find(char ch, size_t pos){while (pos!=_size){if (ch == _str[pos]){return pos;}++pos;}return npos;}size_t string::find(const char* str, size_t pos){char* p = strstr(_str + pos, str);return p - _str;}void string::swap(string& s){std::swap(_str, s._str);std::swap(_capacity, s._capacity);std::swap(_size, s._size);}string string::substr(size_t pos, size_t len){//len大于后面的剩余字符,有多少取多少if (len > _size - pos){string sub(_str - pos);return sub;}else{string sub;sub.reserve(len);for (size_t i = 0; i < len; i++){sub += _str[pos + i];}return sub;}}void string::clear(){_str[0] = '\0';_size = 0;}istream& operator>>(istream& is, string& str){char ch;is >> ch;while (ch != ' ' && ch != '\n'){str += ch;is >> ch;}return is;}ostream& operator<<(ostream& os, const string& str){for (size_t i = 0; i < str.size(); i++){os << str[i];}return os;}}
最后:
十分感谢你可以耐着性子把它读完和我可以坚持写到这里,送几句话,对你,也对我:
1.一个冷知识:
屏蔽力是一个人最顶级的能力,任何消耗你的人和事,多看一眼都是你的不对。
2.你不用变得很外向,内向挺好的,但需要你发言的时候,一定要勇敢。
正所谓:君子可内敛不可懦弱,面不公可起而论之。
3.成年人的世界,只筛选,不教育。
4.自律不是6点起床,7点准时学习,而是不管别人怎么说怎么看,你也会坚持去做,绝不打乱自己的节奏,是一种自我的恒心。
5.你开始炫耀自己,往往都是灾难的开始,就像老子在《道德经》里写到:光而不耀,静水流深。
最后如果觉得我写的还不错,请不要忘记点赞✌,收藏✌,加关注✌哦(。・ω・。)
愿我们一起加油,奔向更美好的未来,愿我们从懵懵懂懂的一枚菜鸟逐渐成为大佬。加油,为自己点赞!