C/C++ string模拟实现

1.模拟准备

1.1因为是模拟string,防止与库发生冲突,所以需要命名空间namespace隔离一下,我们来看一下基本内容

namespace yx
{class string{private://char _buff[16];  lunix下小于16字节就存buff里char* _str;size_t _size;size_t _capacity;};
}

1.2我们这里声明和定义分离,分为string.h和string.cpp

最简单的是:把声明和定义都往命名空间里包就可以

        

2.模拟实现

2.1遇到一个类,先来写构造和析构

构造和析构

我们来看一下下面代码对不对

namespace yx
{ string::string(const char* str):_str(str){}
}

既然这么问了,那肯定是不对的,

因为你初始化string的时候,可能为常量字符串初始化的,它是不可以作为初始化对象的,当你扩容、修改就没法改了

yx::string s1("hello world");

应该这样玩:

namespace yx
{ string::string(const char* str):_str(new char[strlen(str) + 1]){}
}

我和你开一样的空间

完整写法👇 

string::string(const char* str):_str(new char[strlen(str) + 1]), _size(strlen(str)), _capacity(strlen(str))
{strcpy(_str, str);
}

但还是有点问题的,strlen的效率还是有点底的,它和sizeof不一样,sizeof是在编译时运行,根据存储规则,内存对齐规则来算,strlen是运行时算的,三个strlen就重复运算了。

我们可以把size放在初始化列表,把其他的放在函数体初始化

string::string(const char* str): _size(strlen(str))
{_str = new char[_size + 1];_capacity = _size;strcpy(_str, str);
}

这是比较传统的写法,我们来看一下同样手法

tring::string(const string& s)
{string tmp(s._str);std::swap(tmp._str, _str);std::swap(tmp._size, _size);std::swap(tmp._capacity, _capacity);
}

创建一个临时变量tmp,s1给给tmp,然后把s2指向tmp,tmp指向s2的位置.

c_str

const char* c_str() const;
const char* string::c_str() const
{return _str;
}

加const是为了让const或非const成员都能访问到,c_str()的类型为const char*,相当于常量字符串,遇到\0就会停止

无参string

我们可不可以这样写呢?

string::string()
{_str = nullptr;_size = 0;_capacity = 0;
}

看起来可以,但实际不可以,这里的delete和free是不会出问题的,因为delete是可以空指针的

我们看例子,后定义的先析构,程序崩溃了,为什么呢?

c_str ,类型为const char* 不会按指针打印,是常量字符串,就会解引用找到\0才停止。

但库里不会崩溃

为什么?

因为这个地方不是没有空间,库里面开了一个空间

所以初始化要改为

string::string()
{_str = new char[1] {'\0'};_size = 0;_capacity = 0;
}

new一个空间,而实践中不会这样写,无参的和带参的是可以和成一个的,就是全缺省

如下👇,冒号里的\0是可以不写的 默认就是\0 , 给的是字符串

namespace yx
{class string{public://string(); //无参构造  string(const char* str = "\0");~string();const char* c_str() const;//加上const,const成员和非const成员都可以调用private://char _buff[16];  lunix下小于16字节就存buff里char* _str;size_t _size;size_t _capacity;};
}

遍历:运算符重载[] 和 size()

char& string::operator[](size_t pos)
{assert(pos < _size);return _str[pos];
}
size_t string::size() const
{return _size;
}

测试:可读可写

迭代器:begin 和 end

实现方式有两种,自定义类型的和简单点的,我们这里使用简单的

typedef char* iterator;iterator begin();
iterator end();
string::iterator string::begin()
{return _str;
}
string::iterator string::end()
{return _str + _size;
}

为什么这样写?

注:

        这里必须用typedef,为什么?迭代器体现的是一种封装

        这里的typedef相当于把char*用iterator封装起来,而且这里的迭代器一定是char*吗,在lunix下是char*吗,不同平台是不同的。

把不同类型,不同平台的类型都封装成Iterator,隐藏的底层的细节。它是一个像指针的东西。iterator的原生类型是不确定的,给了一种简单通用访问容器的方式。

无论哪个容器都重命名为iterator,各个类域也不会发生冲突。

const迭代器

定义及实现

const_iterator begin() const;
const_iterator end() const;
string::const_iterator string::begin() const
{return _str;
}

这里可以直接返回_str,_str类型为char*,begin为const char* ,相当于权限缩小。

string::const_iterator string::end() const
{return _str + _size;
}

这里也是权限缩小,下面我们测试一下

测试成功,而且是不能给常量赋值的,如下👇

如果我们用方括号加size来遍历呢?

这里会报错,为啥?因为s3是常量,所以还需要重载一个const修饰的operator[]

const char& operator[](size_t pos) const;​
const char& string::operator[](size_t pos) const
{assert(pos < _size);return _str[pos];
}

测试通过。

push_back()  、 append()  和 reserve()

完成了string的基本功能,下面我们来进行string的插入。

push_back()是尾插一个字符,append()插入一个字符串,这里我们会遇到一个问题,push_back()尾插扩容一倍或两倍,不会太大;append()是插入一个字符串,有可能需要扩容,但扩容多少呢?插入字符串长短不定,万一非常长,你扩容二倍?显然扩容多少倍是不确定的。这里我们引入reserve().

reserve()请求保留空间,一般不会缩容,如果空间比capacity大了就会扩容

void string::reserve(size_t n)
{if (n > _capacity){char* tmp = new char[n + 1];//为什么预留一个空间? 因为\0是不算在里面的strcpy(tmp,_str);delete[] _str;//释放旧空间_str = tmp;//指向新空间_capacity = n;}
}

push_back()

​
void string::push_back(char ch)//插入字符
{if (_size == _capacity)//如果size 等于 容量大小才会扩容{size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;reserve(newcapacity);//传给reserve,如果比当前capacity大,就扩容}_str[_size] = ch;//_size是最后一个字符的下一个位置_str[_size + 1] = '\0';++_size;
}​

满足扩容条件才扩容,_size是最后一个字符的下一个位置,也就是\0的位置,所以需要把\0也处理一下。

append()

我们来看一下下面代码正确否?

void string::append(const char* str)//插入字符串
{size_t len = strlen(str);if (_size + len > _capacity){reserve(_size + len);//现在有_size个,我们需要插入长度为len的字符串}strcat(_str, str);_size += len;
}

使用了strcat(),直接在原字符串后面追加,我们测试一下

测试没问题。但是我们用strcat的时候要谨慎一些,他会从头开始找\0,效率低,这里我们采用strcpy(),从指定位置开始拷贝,带\0

void string::append(const char* str)//插入字符串
{size_t len = strlen(str);if (_size + len > _capacity){reserve(_size + len);//现在有_size个,我们需要插入长度为len的字符串}strcpy(_str + _size, str);_size += len;
}

同样测试通过,但效率很高

直接从\0位置开始插入

 

operator+=

说到尾插字符串,那必须得提到+=运算符重载,这里提供俩个版本

这里引用返回,返回对象本身,出了作用域对象还存在。

string& operator+=(char ch);//+=是需要返回值的,用引用返回减少拷贝
string& operator+=(const char ch);

这里我们直接调用push_bakc和append

string& string::operator+=(char ch)
{push_back(ch);return *this;
}
string& string::operator+=(const char* str)
{append(str);return *this;
}

测试

inset() 和 erase()

size_t insert(size_t pos,char ch); //pos位插入字符
size_t insert(size_t pos,const char* ch);//插入字符串
void erase(size_t pos, size_t len = npos);//pos开始删除len个字符
private://char _buff[16];  lunix下小于16字节就存buff里char* _str;size_t _size;size_t _capacity;const static size_t npos;

对于npos,静态成员如何初始化在类里面声明,在类外定义。

类里的静态成员遍历,相当于全局变量,如果在string.h里定义,在预处理以后,string

.h会在string.cpp和test.cpp里展开,展开两份,俩文件最后生成.o文件,再一链接就出问题了,

声明和定义分离的时候把定义放在.cpp,声明放在.h。

insert()插入一个字符

size_t string::insert(size_t pos, char ch)
{if (_size == _capacity)//空间不够,就扩容{size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;reserve(newcapacity);}size_t end = _size;while (end >= pos){_str[end + 1] = _str[end];--end;}_str[pos] = ch;++_size;
}

测试

如果我们在0出插入一个字符呢?

显然报错了,为什么?

因为edn >= 0 继续交换,把0之前的哪个未知值也交换进去了,

当end >= pos = 0 时,已将交换完了,但又进入循环了,为什么?因为当操作符两边的操作数类型不同的时候,会发生隐式类型转化,当有符号遇到无符号,有符号转换为无符号,end变为非常大的数,end依据大于pos。那有什么方法来修改呢?

我们是否可以把pos改为int类型呢?答案是不建议,因为我们要与库里的类型一样。

直接把pos强制转为int,运行测试提供。

void string::insert(size_t pos, char ch)
{if (_size == _capacity)//空间不够,就扩容{size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;reserve(newcapacity);}size_t end = _size;while (end >= (int)pos){_str[end + 1] = _str[end];--end;}_str[pos] = ch;//把字符放进去++_size;
}

那么我们可以不强转可以修改吗?可以

这里最根本的问题点在于end >= pos,只要是无符号遇到>=绝对是坑,无符号最小就是0,无法停止,非常扯淡。

这里我们去掉= ,把end的位置变为_size + 1,把前一个往后挪。

代码修改为:

void string::insert(size_t pos, char ch)
{if (_size == _capacity)//空间不够,就扩容{size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;reserve(newcapacity);}size_t end = _size + 1;while (end > pos){_str[end] = _str[end - 1];--end;}_str[pos] = ch;//把字符放进去++_size;
}

测试通过

insert()插入一个字符串

void insert(size_t pos,const char* str);//插入字符串

首先pos不能越界,检查是否需要扩容,

把xxx拷贝进去,不能用strcpy,它携带了\0,我们可以用strncpy或memcpy,这里我们采用memcpy

代码:

void string::insert(size_t pos, const char* str)
{ assert(pos <= _size);size_t len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}int end = _size;while (end >= pos){_str[end + len] = _str[end];--end;}memcpy(_str + pos, str, len);_size += len;}

测试通过

这是我们在0出插入,还是会遇到之前的问题

我们只需要把pos强制类型转化为int即可。

如果我们不想用这种方式,我们把=去掉,把前一个往后挪,

到pos + len依旧需要挪动,可以写成end>=pos+len

void string::insert(size_t pos, const char* str)
{ assert(pos <= _size);size_t len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}/*int end = _size;while (end >=(int) pos){_str[end + len] = _str[end];--end;}*/size_t end = _size + len;//len插入字符串长度while (end > pos + len - 1){_str[end] = _str[end - len];--end;}memcpy(_str + pos, str, len);_size += len;}

erase()

void erase(size_t pos, size_t len = npos);//pos开始删除len个字符

代码:第一种情况,删除的长度大于pos后的长度,直接全部删除;第二种情况,直接把不删除的字符覆盖在要删除的字符上。

void string::erase(size_t pos = 0, size_t len = npos)
{assert(pos < _size);if (len == npos || len >= _size - pos)//删除的字符大于pos后的字符{_str[pos] = '\0';_size = pos;}else{strcpy(_str + pos, _str + pos + len);_size -= len; }}

find()

查找一个字符

size_t string::find(char ch, size_t pos = 0)
{for (size_t i = 0; i < _size; i++){if (_str[i] == ch){return i;}}return npos;
}

查找一个子串


size_t string::find(const char* sub, size_t pos = 0)//从pos位置开始查找
{const char* p = strstr(_str + pos, sub);//在_str 种匹配sub子串,,返回对应位置指针return p - _str;//指针相减获取下标
}

测试通过

运算符重载 = 

看下面代码,s1赋值拷贝给s2,s3赋值给s1,下面程序有没有问题呢?

void test5()
{yx::string s1("hello world");yx::string s2(s1);cout << s1.c_str() << endl;cout << s2.c_str() << endl;yx::string s3("yyyy");s1 = s3; // s3赋值给s1cout << s1.c_str() << endl;cout << s3.c_str() << endl;
}

当然是有问题的,当我们没有运算符重载=时,编译器会默认提供一个版本,会执行浅拷贝,当 s2 被创建为 s1 的副本时,s2 实际上可能仅仅是指向 s1 所指向的字符串常量的另一个指针。这意味着,如果改变 s2 所指向的内容,s1 的内容也会随之改变。所以需要我们实现深拷贝版本。

修正:

string& string::operator=(const string& s)
{if (this != &s){char* tmp = new char[s._capacity + 1];strcpy(tmp, s._str);delete[] _str;_str = tmp;_size = s._size;_capacity = s._capacity;}
}

重新开一个空间tmp,把需要拷贝的字符串拷贝进去,然后释放旧空间,把new的空间给给原空间

而且为了避免自己给自己赋值,需要再套一个判断 this != &s

优化写法:

s1 = s3,s是s3的别名

	string& string::operator=(const string& s){if (this != &s){string tmp(s._str);this->swap(tmp);}return *this;}

s3拷贝给s1,设置一个临时变量tmp,s3拷贝构造tmp,然后再交换s1和tmp的空间。

而且tmp是个局部对象,出了作用域会析构,免去了释放空间这一步

最简化的写法:

s1 = s3

string& operator=(string tmp);string& string::operator=(string tmp)
{swap(tmp);return *this;
}

和上面最大的区别在于没有引用,s3拷贝构造tmp,然后s1和tmp交换,和上面的道理一样,tmp是临时对象,出了作用域自动销毁,效率并没有提示,只是简化了代码

swap()

如果我们swap一下s1 和 s2呢?库里的swap能否帮我们完成任务呢?答案是可以的,因为他是模板,但是它的代价非常大,

a 拷贝给 c,b 赋值给 a,c赋值给b,都会开空间,拷贝数据,传值传参代价都非常大。

自己实现:

void string::swap(string& s)
{std::swap(_str, s._str);//交换char*指针,size capacitystd::swap(_size, s._size);std::swap(_capacity, s._capacity);
}

通过命名空间,来使用库里的swap,如果不写std,swap就会调用自己,而且这里面交换的都是内置类型

strsub()

从pos位置开始,取len个字符的子串

代码实现:

string string::substr(size_t pos, size_t len)
{if (len > _size - pos)//如果len大于pos后面的长度,有多少取多少{string sub(_str + pos);//_str(开始的指针 ) + pos 从pos位置开始取,然后构造一个子串返回return sub;}else{string sub;sub.reserve(len);//扩容for (size_t i = 0;i< len ;i++){sub += _str[pos + i];}return sub;}
}

运算符重载 < > <= >= == !=

bool string::operator<(const string& s) const //比较大小
{return strcmp(_str, s._str) < 0;
}
bool string::operator>(const string& s) const
{return !(*this <= s);
}
bool string::operator<=(const string& s) const
{return *this < s || *this == s;
}
bool string::operator>=(const string& s) const
{return !(*this < s);
}
bool string::operator==(const string& s) const
{return strcmp(_str, s._str);
}
bool string::operator!=(const string& s) const
{!(*this == s);
}

其实这里写两个,然后取反复用就可以。

流插入和流提取operator<< >> 

istream& operator>>(istream& is, string& str)// is - cin
{char ch = is.get();is >> ch;while (ch != ' ' || ch != '\n')//不等于空格或换行{str += ch;//在io流里提取一个一个的char += 到str里char ch = is.get();}return is;
}
ostream& operator<<(ostream& os, const string& str)//os - cout
{for (size_t i = 0; i < str.size(); i++){os << str[i];//一个一个插入}return os;
}

流插入和流提取的运算符重载不能写成成员函数,且不一定写成友元。

cin是不能获取空格的,而scanf可以 当输入 y 空格 y 时, 写两个cin ,两个cin都会获得y,而忽略空格。

clear()

void string::clear() //请调当前的数据
{_str[0] = '\0';_size = 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/30439.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2713. 矩阵中严格递增的单元格数

题目 给定一个 m x n 的整数矩阵 mat&#xff0c;我们需要找出从某个单元格出发可以访问的最大单元格数量。移动规则是可以从当前单元格移动到同一行或同一列的任何其他单元格&#xff0c;但目标单元格的值必须严格大于当前单元格的值。需要返回最大可访问的单元格数量。 示例…

服务器流量收发测试

文章目录 一、概述二、实现方式一&#xff1a;编码1. 主要流程2. 核心代码3. 布署 三、实现方式二&#xff1a;脚本1.脚本编写2. 新增crontab任务 四、查看结果 一、概述 我们在安装vnStat、wondershaper便想通过实际的数据收发来进行测试。 二、实现方式一&#xff1a;编码 …

C#客户端

控件 打开链接 Socket socket; // 打开连接 private void button1_Click(object sender, EventArgs e) {button1.Enabled false;button2.Enabled true;//1 创建socket客户端对象socket new Socket(AddressFamily.InterNetwork, SocketType.Stream, ProtocolType.Tcp);// 2…

ChatGPT 提示词技巧一本速通

目录 一、基本术语 二、提示词设计的基本原则 三、书写技巧 2.1 赋予角色 2.2 使用分隔符 2.2 结构化输出 2.3 指定步骤 2.4 提供示例 2.5 指定长度 2.6 使用或引用参考文本 2.7 提示模型进行自我判断 2.8 思考问题的解决过程 ​编辑 2.10 询问是否有遗漏 2.11 …

Studio One 6中文官网下载-Studio One软件下载-音乐编曲软件下载安装

​众多使用者向我们证明了轨道预设保存并调用您喜欢的曲目设置的快照&#xff0c;将您的工作流程效率升级到最新水平&#xff01;存储指定轨道或频道的每项设置&#xff0c;以便即时调用&#xff0c;即使对于多个选定的曲目/频道也同样支持&#xff0c;轨道预设可存储轨道延迟、…

如何将本地代码上传到git上面

精简步骤&#xff1a; git init git add . git commit -m "first init" git remote add origin 远程仓库地址 git push -u origin master 目录 1、初始化本地仓库 2、添加所有文件到本地仓库 3、提交更改到本地仓库 4、添加github仓库作为远程仓库 5、推送更改…

国际期货投机交易的常见操作方法:

一、在开仓阶段&#xff0c;入市时机的选择&#xff1a; &#xff08;1&#xff09;通过基本分析法&#xff0c;判断市场处于牛市还是熊市 开仓阶段&#xff0c;入市时机的选择&#xff1a;当需求增加、供给减少&#xff0c;此时价格上升&#xff0c;买入期货合约&#xff1b…

# 消息中间件 RocketMQ 高级功能和源码分析(五)

消息中间件 RocketMQ 高级功能和源码分析&#xff08;五&#xff09; 一、 消息中间件 RocketMQ 源码分析&#xff1a;NameServer 路由元数据 1、消息中间件 RocketMQ 中&#xff0c;NameServer 路由管理 NameServer 的主要作用是为消息的生产者和消息消费者提供关于主题 To…

一个小的画布Canvas页面,记录点的轨迹

Hello大家好&#xff0c;好久没有更新了&#xff0c;最近在忙一些其他的事&#xff0c;今天说一下画布canvas&#xff0c;下面是我的代码&#xff0c;实现了一个点从画布的&#xff08;0,0&#xff09;到&#xff08;canvas.width&#xff0c;canvas.height&#xff09;的一个实…

60.指针数组和数组指针

一.指针数组 指针数组是一个数组&#xff0c;在指针数组中存放的是指针变量。 定义一个指针数组p int *p[5]; 内存模型如下&#xff1a; 指针数组的初始化 #include <stdio.h>int main(void) {int a1;int b2;int c3;int i;int *p[3] {&a,&b,&c};for(i0…

椭圆的标准方程与协方差矩阵的特征值和特征向量的关系

椭圆的标准方程与协方差矩阵的特征值和特征向量的关系 flyfish 单位圆 &#xff1a;单位圆表示在标准正交基下的分布。 椭圆 &#xff1a;通过协方差矩阵的特征向量和特征值变换得到的椭圆&#xff0c;表示数据在新的坐标系下的分布。 特征向量 &#xff1a;红色箭头表示特征…

Android sensor列表和访问记录

命令: dumpsys sensorservice 1.dumpsys sensorservice查看最近申请记录 dumpsys sensorservice命令输出Previous Registrations. Previous Registrations: 23:07:43 0x00000008 pid16587 uid10397 packagecom.start.testdemo.ui.udfp.fql.XsqFQLActivity samplingPeriod66…

07.MyBatis映射器:一对一关联查询

大家好&#xff0c;我是王有志&#xff0c;一个分享硬核 Java 技术的金融摸鱼侠&#xff0c;欢迎大家加入 Java 人自己的交流群“共同富裕的 Java 人”。 《MyBatis 映射器&#xff1a;实现简单的 SQL 语句》中&#xff0c;我们在 MyBatis 映射器的查询语句中使用 resultType 元…

AMBA-CHI协议详解(四)

《AMBA 5 CHI Architecture Specification》 AMBA-CHI协议详解&#xff08;一&#xff09; AMBA-CHI协议详解&#xff08;二&#xff09; AMBA-CHI协议详解&#xff08;三&#xff09; AMBA-CHI协议详解&#xff08;四&#xff09; 文章目录 2.3.3 Atomic transactions2.3.4 S…

MySql进阶:深入理解MySQL语句执行逻辑

深入理解MySQL语句执行逻辑 一、前言 本文源自微博客(www.microblog.store),且以获得授权 一直是想知道一条SQL语句是怎么被执行的&#xff0c;它执行的顺序是怎样的&#xff0c;然后查看总结各方资料&#xff0c;就有了下面这一篇博文了。   本文将从MySQL总体架构—&…

plc如何接线

在开始前刚好我有一些资料&#xff0c;是我根据网友给的问题精心整理了一份「plc的资料从专业入门到高级教程」&#xff0c; 点个关注在评论区回复“666”之后私信回复“666”&#xff0c;全部无偿共享给大家&#xff01;&#xff01;&#xff01;PLC自动化控制在电气自动化和…

Adobe Premiere 视频编辑软件下载安装,pr 全系列资源分享!

Adobe Premiere以其强大的功能、灵活的操作和卓越的性能&#xff0c;成为视频编辑领域的佼佼者。 在剪辑方面&#xff0c;Adobe Premiere提供了强大而灵活的工具集。用户可以在直观的时间线上对视频进行精细的裁剪、剪辑和合并操作。无论是快速剪辑短片&#xff0c;还是精心打造…

springboot心理健康线上咨询系统APP-计算机毕业设计源码031539

摘 要 信息化社会内需要与之针对性的信息获取途径&#xff0c;但是途径的扩展基本上为人们所努力的方向&#xff0c;由于站在的角度存在偏差&#xff0c;人们经常能够获得不同类型信息&#xff0c;这也是技术最为难以攻克的课题。针对心理健康咨询等问题&#xff0c;对其进行研…

钡铼BL102应用智能电网配电柜PLC转MQTT无线接云服务

在当今智能电网的发展浪潮中&#xff0c;配电系统的智能化升级是提升电网效率与稳定性的重要环节。随着物联网技术的飞速发展&#xff0c;实现配电柜的远程监控与管理成为了可能&#xff0c;而这一转变的关键在于如何有效地将传统配电柜中的PLC数据接入到云端进行分析与处理。 …

大数据关联规则算法

关联性&#xff08;Association&#xff09; 定义&#xff1a;指一个变量能够提供有关另一个变量的信息。特点&#xff1a;关联性是一个广泛的概念&#xff0c;它可以包括直接的、间接的、强的或弱的联系。 相关性&#xff08;Correlation&#xff09; 定义&#xff1a;指两个…