C++STL的string模拟实现

文章目录

  • 前言
  • string的成员变量
  • 成员函数
    • 构造函数
    • 拷贝构造
    • 赋值重载
  • 模拟实现string各种接口
    • print
    • 迭代器
      • 普通迭代器
      • const迭代器
    • string比较大小
    • push_back
    • insert 和 erase
      • insert
      • erase
    • reserve和resize
      • reserve
      • resize
    • swap
    • find
    • cout和cin
      • cout
      • cin

前言

今天要讲string的底层实现,通过自己来实现string,我们对string的理解才能更加的深刻。
我们对string其实既熟悉又陌生,熟悉sting其实就是字符串,陌生是在于管理字符串这样一个类。

string的成员变量

namespace but
{class string{private:char* _str;size_t _capaicty;size_t _size;};
}

我们为了避免自己定义的string于库里面的傻傻分不清,这里我们自己用了一个命名空间把自己写的string封装起来。

成员函数

构造函数

namespace but
{class string{public:string():_str(nullptr),_capaicty(0),_size(0){}string(const char* str):_str(str),_capaicty(strlen(str)),_size(strlen(str))//容量不包括'\0'{}private:const char* _str;//加上const,防止写构造函数时,权限放大编译不通过size_t _capaicty;size_t _size;};
}

简简单单写了上面的构造函数,其实这里面存在两个问题,下面我们通过一些使用来看一下。
第一个问题。

写个c_str,思考一下为什么程序会崩?

const char* c_str()
{return _str;
}
string s1;
string s2("hello world");
cout << s1.c_str() << endl;//上述代码都是写在类里面
cout << s2.c_str() << endl;

流插入是自动识别类型,它识别出const char*, 然后去解引用,然后遇到‘\0’结束,这样空指针的问题就暴露出来了。

继续看第二个问题

const char& operator[](size_t pos)//按照之前写的构造函数,必须加上const
{assert(pos < _size);return _str[pos];
}

这里面有个很坑的问题,我们是呆会是要修改pos位置的字符,并且如果空间不够还需要扩容,比如+=;那这里就变得非常矛盾。

这是什么原因呢?

string s2("hello world")

s2在常量区无法修改,扩容也无法扩。

如何解决这两个问题呢?
其实根源还是在于初始化列表,我们大多数情况下都是推荐把所有成员变量直接放到初始化列表初始化,这里比较特殊。
其次,我们要想修改pos位置的字符,还想扩容,在初始化的时候空间就不能直接赋值过去,最好new出来。

那经过修改之后,我们的代码

namespace but
{class string{public:string():_str(new char[1]),//要解决第一个问题,这里就不能是空_capacity(0),_size(0){_str[0] = '\0';}string(const char* str):_capacity(strlen(str)){_size = _capacity;//没有必要重复用strlen,strlen是o(N)的接口_str = new char[_capacity + 1];//扩容的时候应该+1,包括\0strcpy(_str, str);}~string(){delete[] _str;_str = nullptr;_capacity =_size= 0;}const char* c_str(){return _str;}char& operator[](size_t pos){assert(pos < _size);return _str[pos];}private:char* _str;//加上const,防止写构造函数时,权限放大编译不通过size_t _capacity;size_t _size;};void test_string1(){string s1;string s2("hello world");cout << s1.c_str() << endl;cout << s2.c_str() << endl;s2[0]++;cout << s2.c_str() << endl;}
}

至此,把上面的问题都解决了。
在这里插入图片描述

拷贝构造还可以继续优化一下,优化成只有一个全缺省的构造函数。

//string(const char* str = nullptr)  //不可以,等下strlen解引用会崩
//string(const char* str = '\0')//不可以,类型不匹配
//string(const char* str = "\0")//可以
string(const char* str = "")//可以:_size(strlen(str))
{_capaicty = _size == 0 ? 3 : _size;_str = new char[_capaicty + 1];strcpy(_str, str);
}

拷贝构造

void test_string2()
{string s2("hello world");string s3(s2);cout << s2.c_str() << endl;cout << s3.c_str() << endl;
}

我们之前说过拷贝构造是默认成员函数,我们不写,编译器会自动生成一个,对自定义类型不做处理,对内置类型做值拷贝或浅拷贝。那我们看一下自动生成的拷贝构造。
在这里插入图片描述
这个是经典的值拷贝或浅拷贝问题,我们之前也讲过,接下来既然有一个具体的场景,就用调试带大家看一下。
在这里插入图片描述
看两个地址完全一摸一样。

这样会带来两个问题。
1.一个修改影响另外一个。
2.同一块空间会析构两次。

那我们需要自己写一个深拷贝的拷贝构造,怎么写呢?

//拷贝构造也有初始化列表
string(const string& s):_size(s._size), _capaicty(s._capaicty){_str = new char[s._capaicty + 1];strcpy(_str, s._str);}

赋值重载

赋值重载和拷贝构造也一摸一样,我们不写的话,编译器自动生成的会出问题。
写成这样,那就考虑的太不全面了

string& operator=(const string& s)
{_size = s._size;_capacity = s._capacity;_str = new char[s._capacity + 1];strcpy(_str, s._str);return *this;
}

我们知道拷贝构造是一块已经存在的空间给另一块还没存在的空间。
而赋值重载是两块都已经存在的空间,所以赋值重载还需要从空间的角度去分析问题。

从空间大小考虑,总共有三种情况
在这里插入图片描述

但是存在一个问题,如果s3空间特别大,s1又非常小,把s1直接赋值过去,s3就会浪费很多空间,所以比较好的方式就是再开一块空间。
我们库里面的string实现不会这么麻烦,直接把旧的空间释放掉,开一块一样大的空间。

还要处理自己给自己赋值,以免造成不必要的麻烦。

string& operator=(const string& s){if (this != &s){//这种写法稍微不好一点//抛异常的时候会把s1给破坏掉/*delete[] _str;_str = new char[s._capaicty + 1];strcpy(_str, s._str);_size = s._size;_capaicty = s._capaicty;*/char* tmp = new char[s._capaicty + 1];strcpy(tmp, s._str);delete[] _str;_str = tmp;_size = s._size;_capaicty = s._capaicty;}

模拟实现string各种接口

print

这里为什么报错?
在这里插入图片描述

这也涉及到我们之前讲过的。** cosnt成员变量不能调用非const成员函数,这样会权限放大。**

在这里插入图片描述
紧接着这里报错又怎么解决?
这说明我们需要两个【】,一个是给const对象调用的,不允许修改。
一个是给普通对象调用的,可以修改。它们构成函数重载,因为它们函数名相同参数不一样。
虽然普通对象也可以调用const成员函数,但是编译器非常聪明,他会调用最匹配的哪个。

迭代器

遍历的方式我们还可以用迭代器,这里我们再写一个迭代器

普通迭代器

在这里插入图片描述
要实现一个迭代器其实不难。

我们支持了迭代器,其实也就支持了范围for

for (auto ch : s1)
{cout << ch << " ";
}

const迭代器

const迭代器能不能修改?
可以修改,只是指向的内容不能修改。

string::const_iterator it = s1.begin();
while (it != s1.end())
{//*it = 'x';//不能修改,只能读不能改++it;
}
cout << endl;

反向迭代器这里先不讲,后面再讲,要用一个适配器来实现。

string比较大小

怎样比较大小?
比较ascll值,一个一个比。

// 不修改成员变量数据的函数,最好都加上constbool operator>(const string& s) const{return strcmp(_str, s._str) > 0;}bool operator==(const string& s) const{return strcmp(_str, s._str) == 0;}bool operator>=(const string& s) const{//return *this > s || *this == s;return *this > s || s == *this;}bool operator<(const string& s) const{return !(*this >= s);}bool operator<=(const string& s) const{return !(*this > s);}bool operator!=(const string& s) const{return !(*this == s);}

push_back

空间不够扩容的时候不能用realloc,那就和c++交叉了,容易出问题。

void push_back(char ch)
{if (_size + 1 > _capaicty){reserve(_capaicty * 2);}_str[_size] = ch;++_size;_str[_size] = '\0';
}void append(const char* str)
{size_t len = strlen(str);if (_size+len > _capaicty){reserve(_size + len);}strcpy(_str + _size, str);//strcat(_str, str);//为什么不用strcat?strcat很挫自己要去找\0,\0就在size位置,能不用就不用_size += len;
}

在这里插入图片描述

我们喜欢使用的还是+=,直接复用push_back;

string& operator+=(char ch)
{push_back(ch);return *this;
}string& operator+=(const char* str)
{append(str);return *this;
}

凡是你的扩容,析构上代码崩了,一般都是内存问题。

insert 和 erase

问个小小的问题,静态成员变量能不能给缺省值?
不能,因为缺省值是给初始化列表用的。静态列表不是在初始列表初始化的。
它属于整个类,不是属于某个对象。

insert

插入字符
insert有个巨坑给大家看一下下面的代码?
在这里插入图片描述

在这里插入图片描述
程序运行结果。

调试的时候发现这样,扯淡了。
在这里插入图片描述
因为end的类型是size_t;

void insert(size_t pos, char ch)
{assert(pos <= _size);if (_size + 1 > _capacity){reserve(2 * _capacity);}//int end=_size;//这样也不行,会发生类型转换,一般有符号转化为无符号。//改pos也不好,pos的类型一般规定都是size_tsize_t end = _size;//while(end>=pos(int))//强转也不推荐//while (end >= pos)//{//	_str[end + 1] = _str[end];//	--end;//}size_t end = _size + 1;while (end > pos){_str[end] = _str[end-1];--end;}_str[pos] = ch;++_size;
}

我们最好的解决思路,巧妙的避开了小于0;
在这里插入图片描述
在这里插入图片描述

插入字符串

一定要画图,不然很容易出错。

string& insert(size_t pos, const char* str)
{assert(pos <= _size);size_t len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}// 挪动数据size_t end = _size + len;while (end > pos + len - 1)//强烈不建议用大于等于{_str[end] = _str[end - len];--end;}//这个比较简单,完美避开了循环结束条件的难题/*size_t end = _size;for (size_t i = 0; i < _size + 1; ++i){_str[end + len] = _str[end];--end;}*/// 拷贝插入strncpy(_str + pos, str, len);_size += len;return *this;}

erase

erase比较简单,从pos位置删除数据就可以了。

我们浅浅分析一下所有的情况
在这里插入图片描述

erase也是不考虑缩容的。

string& erase(size_t pos, size_t len = npos)
{assert(pos < _size);if (len == npos || pos + len >= _size){_str[pos] = '\0';_size = pos;}else{strcpy(_str + pos, _str + pos + len);//不需要考虑覆盖的问题,所以可以直接用strcpy_size -= len;}return *this;}

白盒测试,把三种情况都验证一遍
在这里插入图片描述

reserve和resize

reserve

看一下我们之前写的扩容有什么问题?
在这里插入图片描述

它是没有考虑缩容的。继续看这样子就报错了。
在这里插入图片描述
为什么报错呢?
strcp的时候越界了。

简单修改一下代码就变成这样了。

void reserve(size_t n)
{if (n > _capacity){char* tmp = new char[n + 1];strcpy(tmp, _str);delete[] _str;_str = tmp;_capacity = n;}
}

resize

resize缩容吗?
不缩容。缩荣的代价还是很大的,首先是异地缩,先开另一块空间,然后把数据拷贝过去,接着把之前的空间释放掉。
待会插入数据空间不够又要扩容,这样就很麻烦。

接下来实现resize,我们得分情况讨论,以及明白resize功能上的一些细节。
在这里插入图片描述

void resize(size_t n, char ch = '\0')
{if (n < _size){// 删除数据--保留前n个_size = n;_str[_size] = '\0';}else if (n > _size){if (n > _capacity){reserve(n);}//如果调用系统的接口,我们可以用memsetsize_t i = _size;while (i < n){_str[i] = ch;++i;}_size = n;_str[_size] = '\0';}
}

swap

我们实现 一下swap,其实就知道库里面的swap和类里面的效率差距有多大

//swap(s1, s2);
//s1.swap(s2);
void swap(string & s)
{std::swap(_str, s._str);std::swap(_capacity, s._capacity);std::swap(_size, s._size);
}

find

size_t find(char ch, size_t pos = 0){assert(pos < _size);for (size_t i = pos; i < _size; ++i){if (_str[i] == ch){return i;}}return npos;}size_t find(const char* str, size_t pos = 0){assert(pos < _size);char* p = strstr(_str + pos, str);if (p == nullptr){return npos;}else{return p - _str;}}

cout和cin

现在我有一个问题,cout和cin必须实现成友元函数?这句话对不对
不对,我们可以写一些函数来访问私有成员变量。

cout

首先,我们实现cout, 它不是成员函数。

能不能直接这样搞?
在这里插入图片描述
我们之前说过c_str()和cout是有区别的,它们最大的区别就是c_str()打印时是遇到\0终止,cout是根据size来打印的。

ostream& operator<<(ostream& out, const string& s)
{for (auto ch : s){out << ch;}return out;
}

cin

在这里插入图片描述
这样为什么不行?
调试一下就知道了,空格和换行不会进入缓冲区。为什么?
它会认为你输入的时候多个字符之间的间隔。

我们可以改成这样
在这里插入图片描述
仔细看一下上面的代码,功能是完善了但还有什么弊端。
在这里插入图片描述

在这里插入图片描述
这是没有把之前的数据清理掉。

还有一个问题有个流插入的数据比较长,那它会影响效率,那有没有什么方法能解决这个问题?
开小了不够,开多了浪费。这里有一个参考方式。
相当于换成字符串,可以这样理解。

istream& operator>>(istream& in, string& s)
{s.clear();char ch = in.get();char buff[128];size_t i = 0;while (ch != ' ' && ch != '\n'){buff[i++] = ch;if (i == 127){buff[127] = '\0';s += buff;i = 0;}ch = in.get();}//防止还有数据没有+=进去if (i != 0){buff[i] = '\0';s += buff;}return in;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/207674.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

总线(什么是南北桥?您都用过哪些总线?)

什么是总线&#xff1f; 计算机系统中的总线&#xff08;Bus&#xff09;是指计算机设备和设备之间传输信息的公共数据通道&#xff0c;是连接计算机硬件系统内多种设备的通信线路&#xff0c;它的一个重要特征是由总线上的所有设备共享&#xff0c;因此可以将计算机系统内的多…

python基于轻量级GhostNet模型开发构建23种常见中草药图像识别系统

轻量级识别模型在我们前面的博文中已经有过很多实践了&#xff0c;感兴趣的话可以自行移步阅读&#xff1a; 《移动端轻量级模型开发谁更胜一筹&#xff0c;efficientnet、mobilenetv2、mobilenetv3、ghostnet、mnasnet、shufflenetv2驾驶危险行为识别模型对比开发测试》 《基…

Vue 核心 数据监听 computed | watch

Vue 核心 数据监听 computed | watch 一、今日学习目标 1.指令补充 指令修饰符v-bind对样式增强的操作v-model应用于其他表单元素 2.computed计算属性 基础语法计算属性vs方法计算属性的完整写法成绩案例 3.watch侦听器 基础写法完整写法 4.综合案例 &#xff08;演示&…

selenium 解决 id定位、class定位中,属性值带空格的解决办法

一、前置说明 selenium遇到下面这种元素&#xff1a; <th id"demo id" class"value1 value2 value3 ">1、虽然id一般不会有空格&#xff0c;但是前端错误的这种写法(如下图)&#xff0c;会造成使用id定位不到元素&#xff0c;如&#xff1a; find…

IOday6作业

1>使用有名管道&#xff0c;完成两个进程的相互通信 //create.c #include<myhead.h>int main(int argc, const char *argv[]) {if((mkfifo("myfifo1",0664)) -1){perror("mkfifo");return -1;}if((mkfifo("myfifo2",0664)) -1){perror…

MYSQL练题笔记-高级查询和连接-这系列最后一题以及下个系列(子查询)的第一题

今天做了下面两题&#xff0c;到第三题的时候想了下但是没有太多的思路&#xff0c;然后看题解的时候实在是觉得自己不会&#xff0c;打算明天看吧。 1.按分类统计薪水相关的表和题目如下 我是想着简化问题&#xff0c;先找出薪水低于30000的员工&#xff0c;然后找这些员工的上…

JAVA 锁

乐观锁 乐观锁是一种乐观思想&#xff0c;即认为读多写少&#xff0c;遇到并发写的可能性低&#xff0c;每次去拿数据的时候都认为别人不会修改&#xff0c;所以不会上锁&#xff0c;但是在更新的时候会判断一下在此期间别人有没有去更新这个数据&#xff0c;采取在写时先读出…

Sam Altman当选“TIME时代周刊”2023年度最佳CEO!还有梅西、Taylor Swift当选...

TIME时代周刊昨日在官网公布了2023年最佳CEO—— Sam Altman当选! 此外&#xff0c;Taylor Swift当选年度最佳人物&#xff0c;梅西当选年度最佳运动员。 Sam Altman的当选可谓是实至名归&#xff01;没有谁能比火爆全球的ChatGPT背后&#xff0c;OpenAI的CEO更“成功”了。 …

ssh安装及问题解决

ssh安装及遇到的问题 ssh分为客户端 openssh-client 和服务器 openssh-server&#xff0c;可以利用以下命令确认是否安装&#xff1a; dpkg -l | grep ssh我用ubantu安装的&#xff0c;所以默认安装了客户端 安装客户端和服务器端的命令分别为&#xff1a; sudo apt-get ins…

金融量化交易:使用Python实现遗传算法

大家好&#xff0c;遗传算法是一种受自然选择过程启发的进化算法&#xff0c;用于寻找优化和搜索问题的近似解决方案。本文将使用Python来实现一个用于优化简单交易策略的遗传算法。 1.遗传算法简介 遗传算法是一类基于自然选择和遗传学原理的优化算法&#xff0c;其特别适用…

MySQL 教程 2.1

MySQL 插入数据 MySQL 表中使用 INSERT INTO 语句来插入数据。 你可以通过 mysql> 命令提示窗口中向数据表中插入数据&#xff0c;或者通过PHP脚本来插入数据。 语法 以下为向MySQL数据表插入数据通用的 INSERT INTO SQL语法&#xff1a; INSERT INTO table_name (colu…

使用Pytorch实现Grad-CAM并绘制热力图

这篇是我对哔哩哔哩up主 霹雳吧啦Wz 的视频的文字版学习笔记 感谢他对知识的分享 看一下这个main cnn.py的文件 那这里我为了方便 就直接从官方的torch vision这个库当中导入一些我们常用的model 比如说我这里的例子是采用的mobile net v3 large这个模型 然后这里我将pretrain设…

微信小程序 纯css画仪表盘

刚看到设计稿的时候第一时间想到的就是用canvas来做这个仪表盘&#xff0c;虽然本人的画布用的不是很好但还可以写一写&#x1f600;。话不多说直接上代码。最后有纯css方法 <!--wxml--> <canvas canvas-id"circle" class"circle" >// js dat…

MySQL 忘记root密码后重置密码操作

在忘记 MySQL 密码的情况下&#xff0c;可以通过 --skip-grant-tables 关闭服务器的认证&#xff0c;然后重置 root 的密码&#xff0c;具体操作步骤如下。 步骤 1)&#xff1a;关闭正在运行的 MySQL 服务。打开 cmd 进入 MySQL 的 bin 目录。 步骤 2)&#xff1a;输入mysqld -…

【Docker】容器数据持久化及容器互联

容器数据持久化及容器互联 一、Docker容器的数据管理1.1、什么是数据卷1.2、数据卷特点1.3、数据卷使用 二、Docker的数据卷容器2.1、什么是数据卷容器2.2、挂载数据卷容器方法 三、Docker数据卷的备份和还原3.1、数据备份方法3.2、数据还原方法 四、Docker容器互联4.1、docker…

xcode ——Instrumets(网络连接调试)使用

环境&#xff1a; instruments 使用只能在真机调试时使用&#xff0c;且真机系统必须ios15 点击debug 按钮——Network——Profile in Instruments 然后就可以看到如下面板 展开运行的项目&#xff0c;点击session下的域名&#xff0c;下方回出现该域名下的网络请求。点击Deve…

管理类联考——数学——真题篇——按题型分类——充分性判断题——秒杀

题型结构 问题求解&#xff1a;通过计算求解&#xff0c;从五个选项中选出一个正确答案。条件充分性判断&#xff1a;问所给的条件&#xff08;1&#xff09;&#xff08;2&#xff09;能否推出题设的结论&#xff0c;共有五个选项&#xff0c;从中选出正确的一个。&#xff0…

LCR 090. 打家劫舍 II(leetcode)动态规划

文章目录 前言一、题目分析二、算法原理1.状态表示2.状态转移方程3.初始化4.填表顺序5.返回值是什么 三、代码实现总结 前言 在本文章中&#xff0c;我们将要详细介绍一下LeetcodeLCR 090. 打家劫舍 II。采用动态规划解决&#xff0c;这是一道经典的多状态dp问题 一、题目分析…

人工智能从 DeepMind 到 ChatGPT ,从 2012 - 2024

本心、输入输出、结果 文章目录 人工智能从 DeepMind 到 ChatGPT &#xff0c;从 2012 - 2024前言2010年&#xff1a;DeepMind诞生2012&#xff5e;2013年&#xff1a;谷歌重视AI发展&#xff0c;“拿下”Hinton2013&#xff5e;2014年&#xff1a;谷歌收购DeepMind2013年&…

stm32一种步进电机查表法驱动

文章目录 一、定时器基础频率二、驱动原理三、关键代码 对于stm32芯片来说&#xff0c;步进电机的驱动由于要在中断中不断计算下一次脉冲的时间而极其消耗算力&#xff0c;使用计算的方法对于芯片的算法消耗更高&#xff0c;特别是在f1这种算力比较低的芯片上&#xff0c;这时候…