本篇博客仅仅实现存储字符(串)的string
同时由于C++string库设计的不合理,我仅实现一些最常见的增删查改接口
接下来给出的接口都是基于以下框架:
private:char* _str;//思考如何不用constsize_t _size;size_t _capacity;//这样写可以const static size_t string::npos = -1;//下面这种写法也可以->和上述写法产生矛盾const static size_t string::npos;};//静态变量只能在类外面定义 上述两种定义容易产生矛盾
📚1.string默认构造 | 析构函数 | 拷贝构造 | 赋值重载
//无参默认构造
string():_str(new char[1]), _size(0), _capacity(0)
{_str[0] = '\0';
}
//有参默认构造
string(const char* str="\0")//不能写'\0'//->类型不匹配:_size(strlen(str))
{_capacity = _size;_str = new char[_capacity + 1];strcpy(_str, str);
}
C++string标准库中,无参构造并不是空间为0,直接置为空指针 而是开一个字节,并存放‘\0’
C++中支持无参构造一个对象后,直接在后面插入数据,也从侧面说明了这点
由于C++构造函数不管写不写都会走初始化列表的特性,所以这里也走初始化列表
string中,_capacity和_size都不包含空指针,所以带参构造要多开一个空间,用来存储’\0’
📚2.string类析构函数
~string()
{delete[] _str;_str = nullptr;_size = 0;_capacity = 0;
}
📚3.拷贝构造
string(const string& s)
{_str = new char[s._capacity + 1];strcpy(_str, s._str);_size = s._size;_capacity = s._capacity;
}
📚4.赋值重载
传统写法:
string& operator=(const string& s)
{if (this != &s){char* tmp = new char[s._capacity + 1];strcpy(tmp, s._str);delete[] _str;_str = tmp;_size = s._size;_capacity = s._capacity;}return *this;
}
现代写法:
//法二
void swap(string& s)
{std::swap(_str, s._str);std::swap(_size, s._size);std::swap(_capacity, s._capacity);
}
string& operator=(string tmp)
{swap(tmp);return *this;
}
📚5.iterator迭代器和基于范围的for循环
在C++中,范围for在底层是通过迭代器来实现的 所以只要实现了迭代器,就支持范围for
而迭代器类似于指针,迭代器可以被看作是指针的一种泛化,它提供了类似指针的功能,可以进行解引用操作、指针运算等
以下提供了const迭代器和非const迭代器:
typedef char* iterator;
const typedef char* const_iterator;iterator begin()
{return _str;
}
iterator end()
{return _str + _size;
}const_iterator begin() const
{return _str;
}
const_iterator end() const
{return _str + _size;
}
📚6.运算符重载operator[ ]
这里我们和库中一样,提供以下两个版本
//可读可写
char operator[](size_t pos)
{assert(pos < _size);return _str[pos];
}
//只读
const char operator[](size_t pos)const
{assert(pos < _size);return _str[pos];
}
char& operator[](size_t pos) const
{assert(pos < _size);return _str[pos];
}
bool operator>(const string& s)
{return strcpy(_str, s._str) == 0;
}
bool operator==(const string& s)
{return strcpy(_str, s._str) == 0;
}
bool operator>=(const string& s)
{return *this > s || *this == s;
}
bool operator<(const string& s)
{return !(*this >= s);//return strcpy(_str, s._str) == 0;
}
bool operator!=(const string& s)
{return !(*this == s);
}
这里我用了this指针指向的是private里面的数据 然后和s对象所对应的值作比较 能和strcpy函数联合起来用 能达到同样的效果 这是一个很不错的想法
📚7.容量相关:size | resize | capacity | reserve
size_t size()const
{return _size;
}
size_t capacity()const
{return _capacity;
}
在C++中,我们一般不缩容
所以实现reserve时容量调整到n首先判断目标容量n是否大于当前容量。如果小于就不做处理,否则先开辟n+1个内存空间(多出来的一个用于存储‘\0’),然后将原有数据拷贝到新空间strcpy会将’\0’一并拷贝过去然后释放就空间,并让_str指向新空间,同时更新_capacity
void reserve(size_t n)
{if (n > _capacity){char* tmp = new char[n + 1];strcpy(tmp, _str);delete[] _str;_str = tmp;_capacity = n;}
}
当n<_size时,只需将下标为n的地址处的数据改为’\0’
其他情况,我们直接统一处理。直接复用reserve()函数将_capacity扩到n 然后用将[_size, n)中的数据全部初始化为ch 这里博主给ch一个初始值’\0’,但ch不一定为’\0’,所以要将下标为n处的地址初始化为’\0’
void resize(size_t n, char ch='\0')
{if (n <= _size){_str[n] = '\0';_size = n;}else{reserve(n);while (_size < n){_str[_size] = ch;_size++;}_str[_size] = '\0';}
}
📚8.数据相关:push_back | append | operator+= | insert | erase
尾插:push_back
尾插首先检查扩容,在插入数据
void push_back(char ch)
{//扩容if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}//插入数据_str[_size] = ch;_size++;_str[_size] = '\0';}
append尾部插入字符串
void append(const char* str)
{size_t len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}strcpy(_str + _size, str);//strcat(_str, str);_size += len;
}
operator+=()字符/字符串
operator+=()字符、字符串可以直接复用push_back和append
string& operator+=(char ch)
{push_back(ch);return *this;
}string& operator+=(const char* str)
{append(str);return *this;
}
insert插入字符/字符串
下面给出各位初学者容易犯的错误:
void insert(size_t pos, char ch)
{assert(pos <= _size);//扩容if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}//挪动数据size_t end = _size;while (end >= pos){_str[end+1] = _str[end];end--;}_str[pos] = ch;_size++
}
假设是在头插字符,end理论上和pos(即0)比较完后就减到-1,在下一次循环条件比较时失败,退出循环 但遗憾的是end是size_t类型,始终>=0, 会导致死循环
解决办法如下
从end从最后数据的后一位开始,每次将前一个数据移到当前位置。最后条件判断就转化为end>pos,不会出现死循环这种情况
void insert(size_t pos, char ch)
{assert(pos <= _size);//扩容if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}//挪动数据size_t end = _size+1;while (end > pos){_str[end] = _str[end-1];end--;}//插入数据,更新_size_str[pos] = ch;_size++;
}
insert插入字符串
void insert(size_t pos, const char* str)
{int len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}size_t end = _size+1;while (end > pos){_str[end + len-1] = _str[end-1];end--;}strncpy(_str + pos, str, len);_size += len;
}
erase
erase分两种情况:
从pos开始,要删的数据个数超过的字符串,即将pos后序所有数据全部情况 直接将pos处数据置为’\0’即可
从pos开始,要删的数据个数没有超出的字符串。所以只需要从pos+len位置后的所有数据向前移动从pos位置覆盖原数据即可
void erase(size_t pos, size_t len = npos)
{//len==nppos意思是字串全部删除if (len==npos || pos + len >= _size){//有多少,删多少_str[pos] = '\0';_size = pos;}else{size_t begin = pos + len;while (begin <= _size){_str[begin - len] = _str[begin];begin++;}_size -= len;}
}
📚9.关系操作符重载:< | == | <= | > | >= | !=
bool operator>(const string& s)
{return strcpy(_str, s._str) == 0;
}
bool operator==(const string& s)
{return strcpy(_str, s._str) == 0;
}
bool operator>=(const string& s)
{return *this > s || *this == s;
}
bool operator<(const string& s)
{return !(*this >= s);//return strcpy(_str, s._str) == 0;
}
bool operator!=(const string& s)
{return !(*this == s);
}
📚10.find查找字符 | 字符串 | substr
size_t find(char ch, size_t pos = 0)
{for (size_t i = pos; i < _size; i++){if (_str[i] == ch){return i;}}return npos;
}
size_t find(const char* sub, size_t pos = 0)
{const char* p = strstr(_str + pos, sub);if (p){return p - _str;}else{return npos;}
}
strsub()模拟实现
strsub目标长度可能越界string,也可能还有没有。但不管是那种情况,最后都需要拷贝数据。所以这里我们可以先将len真实长度计算出来,在拷贝数据
string substr(size_t pos, size_t len = npos)const
{string s;size_t end = pos + len;//目标字符越界string,更新lenif (len == npos || end >= _size){len = _size - pos;end = _size;}//拷贝数据s.reserve(len);for (size_t i = pos; i < end; i++){s += _str[i];}return s;
}
📚11.流插入和流提取<< | >>
由于前面我们实现了迭代器,所以最简单的方式就是范围for
ostream& operator<<(ostream& out, const string& s)
{/*for (size_t i = 0; i < s.size(); i++){out << s[i];}*/for (auto ch : s)out << ch;return out;
}
流提取>>
流提取比较特殊。在流提取前需要将原有数据全部清空。同时由于>>无法获取空字符和换行符()(都是作为多个值之间的间隔),直接流提取到ostream对象中,没法结束类似于C语言中scanf, 换行符和空字符仅仅只是起到判断结束的作用,但scanf无法获取到它们
所以这里博主直接调用istream对象中的get()函数类似于C语言中的getchar()函数
class string
{void clear(){_str[0] = '\0';_size = 0;}
private:char* _str;size_t _capacity;size_t _size;
};istream& operator>>(istream& in, string& s){s.clear();char ch;//in >> ch;ch = in.get();while (ch != ' ' && ch != '\n'){s += ch;//in >> ch;ch = in.get();}return in;}
📚12.完整代码
#define _CRT_SECURE_NO_WARNINGS 1
#include<iostream>
#include<vector>
#include<list>
#include<string>
#include<assert.h>
using namespace std;
namespace success
{class string{public:typedef char* iterator;iterator begin(){return _str;}iterator end(){return _str + _size;}string():_str(new char[1]), _size(0), _capacity(0){_str[0] = '\0';}string(const char* str="\0")//不能写'\0'//->类型不匹配:_size(strlen(str)){_capacity = _size;_str = new char[_capacity + 1];strcpy(_str, str);}const char* c_str(){return _str;}string(const string& str):_size(str._size){_capacity = str._capacity;_str = new char[str._capacity + 1];strcpy(_str, str._str);}char& operator[](size_t pos) const{assert(pos < _size);return _str[pos];}size_t size(){return _size;}string& operator=(const string& str){if (this != &str){delete[] _str;_str = new char[str._capacity + 1];_size = str._size;_capacity = str._capacity;strcpy(_str, str._str);}return *this;}~string(){delete[] _str;_str = nullptr;_size = 0;_capacity = 0;}bool operator>(const string& s){return strcpy(_str, s._str) == 0;}bool operator==(const string& s){return strcpy(_str, s._str) == 0;}bool operator>=(const string& s){return *this > s || *this == s;}bool operator<(const string& s){return !(*this >= s);//return strcpy(_str, s._str) == 0;}bool operator!=(const string& s){return !(*this == s);}void resize(size_t n, char ch = '\0');void reserve(size_t n){char* tmp = new char[n + 1];strcpy(tmp, _str);delete[] _str;_str = tmp;_capacity = n;}void push_back(char ch){if (_size + 1 > _capacity){ reserve(_capacity * 2);}_str[_size] = ch;++_size;_str[_size] = '\0';}void append(const char* str){size_t len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}strcpy(_str + _size, str);//strcat(_str, str);_size += len;}void insert(size_t pos, char ch){assert(pos <= _size);if (_size + 1 > _capacity){reserve(2 * _capacity);}size_t end = _size;while (end >= pos){_str[end + 1] = _str[end];--end;}_str[pos] = ch;++_size;}void insert(size_t pos, const char* str){int len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}size_t end = _size+1;while (end > pos){_str[end + len-1] = _str[end-1];end--;}strncpy(_str + pos, str, len);_size += len;}void erase(size_t pos, size_t len = npos){//len==nppos意思是字串全部删除if (len==npos || pos + len >= _size){//有多少,删多少_str[pos] = '\0';_size = pos;}else{size_t begin = pos + len;while (begin <= _size){_str[begin - len] = _str[begin];begin++;}_size -= len;}}private:char* _str;//思考如何不用constsize_t _size;size_t _capacity;//这样写可以const static size_t string::npos = -1;//下面这种写法也可以->和上述写法产生矛盾const static size_t string::npos;};//静态变量只能在类外面定义 上述两种定义容易产生矛盾void test_string1(){string s1("hello bit");string s2("hello bit.");cout << s1.c_str() << endl;cout << s2.c_str() << endl;s2[0]++;cout << s2.c_str() << endl;}void test_string2() {string s3 = ("hello bit");string s4("hello bit.");cout << s3.c_str() << endl;cout << s4.c_str() << endl;string s5(s3);cout << s5.c_str() << endl;s3[0]++;s4 = s3;cout << s3.c_str() << endl;cout << s5.c_str() << endl;}void test_string3(){string s1 = "hello bit";string::iterator it = s1.begin();while (it != s1.end()){cout << *it << " ";++it;}cout << endl;}
}
#include"string.h"
#include<Windows.h>
#include<iostream>
using namespace std;
int main()
{try{success::test_string2();}catch (const exception& e){cout << e.what() << endl;}success::test_string1();success::test_string2();success::test_string3();//string a = "hello world";//string b = a;//在用一个表达式中 构造+拷贝构造//->编译器优化成一次构造//a.c_str() == b.c_str()比较的是存储字符串位置的地址//if (a.c_str() == b.c_str())//{// cout << "true" << endl;//}//else cout << "false" << endl;//案1//string c = b;//c = "";//if (a.c_str() == b.c_str()) //{// cout << "true" << endl;//}//else cout << "false" << endl;//a = "";//if (a.c_str() == b.c_str())//{// cout << "true" << endl;//}//else cout << "false" << endl;、//string str("Hello Bit.");//str.reserve(111);//str.resize(5);//str.reserve(50);//cout << str.size() << ":" << str.capacity() << endl;//str.reserve(111); //调整容量为111//str.resize(5); //调整元素个数为5//str.reserve(50); //调整容量为50,由于调整的容量小于已有空间容量,故容量不会减小//所以size = 5 capacity = 111//string strText = "How are you?";//string strSeparator = " ";//string strResult;//int size_pos = 0;//int size_prev_pos = 0;//while ((size_pos = strText.find_first_of(strSeparator, size_pos)) != string::npos)//{// strResult = strText.substr(size_prev_pos, size_pos - size_prev_pos);// cout << strResult << " ";// size_prev_pos = ++size_pos;//}//if (size_prev_pos != strText.size())//{// strResult = strText.substr(size_prev_pos, size_pos - size_prev_pos);// cout << strResult << " ";//}//cout << endl;system("pause");return 0;
}
// 为了和标准库区分,此处使用String
class String
{
public:
/*String()
:_str(new char[1])
{*_str = '\0';}
*/
//String(const char* str = "\0") 错误示范
//String(const char* str = nullptr) 错误示范
String(const char* str = "")
{
// 构造String类对象时,如果传递nullptr指针,可以认为程序非
if (nullptr == str)
{
assert(false);
return;
}
_str = new char[strlen(str) + 1];
strcpy(_str, str);
}
~String()
{
if (_str)
{
delete[] _str;
_str = nullptr;
}
}
private:
char* _str;
};
// 测试
void TestString()
{
String s1("hello bit!!!");
String s2(s1);
}
说明:上述String类没有显式定义其拷贝构造函数与赋值运算符重载,此时编译器会合成默认的,当用s1构造s2时,编译器会调用默认的拷贝构造。最终导致的问题是,s1、s2共用同一块内存空间,在释放时同一块空间被释放多次而引起程序崩溃,这种拷贝方式,称为浅拷贝
浅拷贝
浅拷贝:也称位拷贝,编译器只是将对象中的值拷贝过来。如果对象中管理资源,最后就会导致多个对象共享同一份资源,当一个对象销毁时就会将该资源释放掉,而此时另一些对象不知道该资源已经被释放,以为还有效,所以当继续对资源进项操作时,就会发生发生了访问违规
深拷贝
如果一个类中涉及到资源的管理,其拷贝构造函数、赋值运算符重载以及析构函数必须要显式给出。一般情况都是按照深拷贝方式提供
传统版写法的String类
class String
{
public:
String(const char* str = "")
{
// 构造String类对象时,如果传递nullptr指针,可以认为程序非
if (nullptr == str)
{
assert(false);
return;
}
_str = new char[strlen(str) + 1];
strcpy(_str, str);
}
String(const String& s)
: _str(new char[strlen(s._str) + 1])
{
strcpy(_str, s._str);
}
String& operator=(const String& s)
{
if (this != &s)
{
char* pStr = new char[strlen(s._str) + 1];
strcpy(pStr, s._str);
delete[] _str;
_str = pStr;
}
return *this;
}
~String()
{
if (_str)
{
delete[] _str;
_str = nullptr;
}
}
private:
char* _str;
};
现代版写法的String类
class String
{
public:
String(const char* str = "")
{
if (nullptr == str)
{
assert(false);
return;
}
_str = new char[strlen(str) + 1];
strcpy(_str, str);
}
String(const String& s)
: _str(nullptr)
{
String strTmp(s._str);
swap(_str, strTmp._str);
}
// 对比下和上面的赋值那个实现比较好?
String& operator=(String s)
{
swap(_str, s._str);
return *this;
}
/*
String& operator=(const String& s)
{
if(this != &s)
{
String strTmp(s);
swap(_str, strTmp._str);
}
return *this;
}
*/
~String()
{
if (_str)
{
delete[] _str;
_str = nullptr;
}
}
private:
char* _str;
};
写时拷贝就是一种拖延症,是在浅拷贝的基础之上增加了引用计数的方式来实现的
引用计数:用来记录资源使用者的个数。在构造时,将资源的计数给成1,每增加一个对象使用该资源,就给计数增加1,当某个对象被销毁时,先给该计数减1,然后再检查是否需要释放资源,如果计数为1,说明该对象时资源的最后一个使用者,将该资源释放;否则就不能释放,因为还有其他对象在使用该资源