【C++】:string类底层的模拟实现

目录

  • 引言
  • 1,构造函数
  • 2,析构函数
  • 3,取出字符串的地址
  • 4,计算有效数据个数
  • 5,[ ]运算符重载
  • 6,简单迭代器
  • 7,预开空间(扩容)
  • 8,尾插一个字符
  • 9,尾插一个字符串
  • 10,+=运算符重载
  • 11,在pos位置插入字符/字符串
    • 11.1 在pos位置插入字符
    • 11.2 尾插一个字符串
  • 12,从pos位置开始删除长度为len的字符串
  • 13,从pos位置开始查找字符/字符串
    • 13.1 查找字符
    • 13.2 查找字符串
  • 14,拷贝构造(传统)
  • 15,=赋值拷贝(传统)
  • 16,交换函数swap
  • 17,从pos位置开始取len个字符的串
  • 18. 字符串的比较
  • 19,清除函数clear
  • 20,流插入,流提取
    • 20.1 流插入
    • 20.2 流提取
  • 21,拷贝构造和赋值拷贝的现代写法
    • 21.1 拷贝构造
    • 21.2 赋值拷贝

引言

上一篇文章【string类的基本使用】已经对string类进行了简单的介绍,大家只要能够正常使用即可。

这篇文章主要是对string类的一些重点接口函数进行模拟实现。本文依然采用多文件的方式,string.h放类的声明,string.cpp放成员函数的定义

string.h

#pragma once#include <iostream>
#include <assert.h>
#include <stdbool.h>using namespace std;//定义一个叫做bit的命名空间,隔离C++库里的string类namespace bit
{class string{public://typedef实现二次封装//由于string类是连续的空间,所以可以定义为原生指针typedef char* iterator;//const迭代器,指针指向的内容不能修改typedef const char* const_iterator;//实现迭代器,一定要实现为begin 和end//迭代器屏蔽了底层细节,提供了一种简单通用的访问容器的方式iterator begin();iterator end();const_iterator begin()const;const_iterator end()const;// string();//无参构造//有参与无参构造用全缺省进行合并,在声明处给缺省值string(const char* str = "");//传参构造//析构函数~string();//拷贝构造string(const string& s);//赋值运算重载(传统)//string& operator=(const string& s);//赋值运算重载(现代)string& operator=(string tmp);const char* c_str() const;//用下标的方式遍历字符串size_t size()const;char& operator[](size_t pos);const char& operator[](size_t pos)const;//用于扩容,一般不缩容void reserve(size_t n);void push_back(char ch);//尾插一个字符void append(const char* str);//尾插字符串//用运算符重载实现尾插string& operator+=(char ch);string& operator+=(const char* str);//在指定位置插入 字符或是字符串void insert(size_t pos, char ch);void insert(size_t pos, const char* str);//在指定位置删除长度为lenvoid erase(size_t pos = 0, size_t len = npos);//从pos位置开始找字符或是字符串size_t find(char ch, size_t pos =0);size_t find(const char* str, size_t pos = 0);//交换函数void swap(string& s);//从pos位置找一个子串string substr(size_t pos = 0, size_t len = npos);//字符串的比较bool operator<(const string& s)const;bool operator>(const string& s)const;bool operator<=(const string& s)const;bool operator>=(const string& s)const;bool operator==(const string& s)const;bool operator!=(const string& s)const;//把当前数据清除,但是不清空间void clear();private://这里的缺省值时给现代写法的构造函数的char* _str = nullptr;size_t _size = 0;//有效数据个数,指向最后一个有效数据的下一个位置\0size_t _capacity = 0;//容量//特例:静态成员变量只有无符号整形才可以在声明时给缺省值//const static size_t npos = -1;//ok//const static double d = 2.2;//errconst static size_t npos;};//流插入,流提取 //不适合写成成员函数,涉及第一个参数的位置问题istream& operator>> (istream& is, string& str);ostream& operator<< (ostream& os, const string& str);
}

1,构造函数

为了避免多次strlen的计算,并且符合声明的顺序,只把_size放在初始化列表,其余放在函数体中。

string::string(const char* str):_size(strlen(str))
{//_str = nullptr;//err 防止对空指针的解引用_str = new char[_size + 1];//多开一个是给\0的_capacity = _size;strcpy(_str, str);//把初始化内容拷贝进空间
}

2,析构函数

string::~string()
{delete[] _str;//析构销毁资源_str = nullptr;//置空_size = _capacity = 0;//置0
}

3,取出字符串的地址

const char* string::c_str()const
{return _str;//返回字符串的首地址,用于打印数据
}

4,计算有效数据个数

size_t string::size()const
{return _size;
}

5,[ ]运算符重载

4.1 [ ]运算符重载有两种类型,可读可写的和可读的(const修饰)。

4.2 模拟[ ]运算符重载的几个问题:
(1) 引用返回的作用:一是减少拷贝,二是修改返回对象。
(2) 为什么可以用引用返回:_str[i]出了作用域还在,因为_str开辟在堆上,它返回的是堆上的一个字符的引用别名。
(3) 重载的底层也是用assert断言的,只要下标越界直接终止报错。

//_str是new出来的,出了这个函数不会销毁,可以用引用返回
char& string::operator[](size_t pos)
{assert(pos < _size);//防止越界return _str[pos];
}const char& string::operator[](size_t pos)const
{assert(pos < _size);//防止越界return _str[pos];
}

6,简单迭代器

6.1 迭代器也有有两种类型,可读可写的和可读的(const修饰)。根据声明可知,这里的迭代器可以暂时简单的理解为类似指针的东西

6.2 这里直接利用用原生指针进行实现的原因是:string类底层的物理结构的连续的。

6.3 为什么要用typedef,而不是直接用char*呢?
一是不同编译器底层实现迭代器的方式是不同的。
二是可以实现二次封装,屏蔽了底层的实现细节,统一了上层访问容器的方式(用begin和end)。

string::iterator string::begin()
{return _str;
}string::iterator string::end()
{return _str + _size;
}string::const_iterator string::begin()const
{return _str;
}string::const_iterator string::end()const
{return _str + _size;
}

7,预开空间(扩容)

void string::reserve(size_t n)
{if (n > _capacity){//手动扩容,手动释放char* tmp = new char[n + 1];//多开一个给\0strcpy(tmp, _str);delete[] _str;_str = tmp;_capacity = n;}
}

8,尾插一个字符

8.1 先判断容量是否足够,再插入。
8.2 注意\0的处理。

//尾插一个字符
void string::push_back(char ch)
{if (_size == _capacity){//先计算容量,2倍增size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;//再扩容reserve(newcapacity);}_str[_size] = ch;//覆盖\0的位置_str[_size + 1] = '\0';//补上\0++_size;
}

9,尾插一个字符串

9.1 先判断容量是否足够,再插入。
9.2 插入字符串时strcatstrcpy均可以实现。但是strcat的底层需要遍历找到\0再进行拼接,最后自动补上\0,效率不高;所以推荐使用strcpy。

//尾插字符串
void string::append(const char* str)
{size_t len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}//strcat:从\0的位置开始追加,最后自动补上\0//strcat(_str, str);strcpy(_str + _size, str);_size += len;
}

10,+=运算符重载

它的功能也是用来尾插字符或是字符串的,而且它比push_back和append使用的更广泛。

string& string::operator+=(char ch)
{push_back(ch);return *this;
}string& string::operator+=(const char* str)
{append(str);return *this;
}

11,在pos位置插入字符/字符串

11.1 在pos位置插入字符

错误示范:
原因:当pos为0,即头插时,程序崩溃!因为end是无符号整形,减到0再减后会变成整形最大值(40多亿),造成死循环。

猜想解决方法:
只把end的类型改为int,也不行。因为当一个操作符两边的操作数类型不一样时,会产生隐式类型转换,比如有符号与无符号,有符号会隐式转换成无符号类型。

void string::insert(size_t pos, char ch)
{assert(pos <= _size);//避免下标越界if (_size == _capacity){size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;reserve(newcapacity);}size_t end = _size;while (end >= pos){_str[end + 1] = _str[end];--end;}_str[pos] = ch;++_size;
}

解决方法1:
把end的类型改为int,end指向最后一位有效位的下一位,把pos也强转为int类型。

//在指定位置插入 
void string::insert(size_t pos, char ch)
{assert(pos <= _size);//避免下标越界if (_size == _capacity){size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;reserve(newcapacity);}int end = _size;while (end >= (int)pos){_str[end + 1] = _str[end];--end;}_str[pos] = ch;++_size;
}

解决方法2:
让end指向\0的下一位。

//在指定位置插入 
void string::insert(size_t pos, char ch)
{assert(pos <= _size);//避免下标越界if (_size == _capacity){size_t newcapacity = _capacity == 0 ? 4 : _capacity * 2;reserve(newcapacity);}size_t end = _size + 1;while (end > pos){_str[end] = _str[end - 1];--end;}_str[pos] = ch;++_size;
}

11.2 尾插一个字符串

遇到的问题与上面的相同。

void string::insert(size_t pos, const char* str)
{assert(pos <= _size);//避免下标越界size_t len = strlen(str);if (_size + len > _capacity){reserve(_size + len);}//方式1/*int end = _size;while (end >= (int)pos){_str[end + len] = _str[end];end--;}*///方式2size_t end = _size + len;while (end > pos+len-1){_str[end] = _str[end - 1];end--;}memcpy(_str + pos, str, len);_size += len;
}

12,从pos位置开始删除长度为len的字符串

注意:
1.此处在声明中两个形参的缺省值,size_t pos = 0, size_t len = npos
npos是const类型的静态成员变量,npos = -1,表示无符号整形的最大值(40多亿)。

2.声明和定义分离时,静态成员变量的初始化。当是const修饰的size_t类型的静态变量时,是可以在声明时给缺省值的!这是个特例! 但是一般不这样,声明和定义分离时,只要在.cpp中初始化即可。

void string::erase(size_t pos, size_t len )
{assert(pos  < _size);//当len大于前面的字符个数时,有多少删多少if (pos+len >= _size){_str[pos] = '\0';_size = pos;}else{strcpy(_str + pos, _str + pos + len);_size -= len;}
}

13,从pos位置开始查找字符/字符串

13.1 查找字符

size_t string::find(char ch, size_t pos)
{for (size_t i = pos; i < _size; i++){if (_str[i] == ch){return i;}}return npos;
}

13.2 查找字符串

size_t string::find(const char* str, size_t pos)
{//strstr:str存在时返回所在位置的指针const char* p = strstr(_str + pos, str);return p - _str;
}

14,拷贝构造(传统)

当我们不显示实现深拷贝时,使用编译器默认的浅拷贝有两个危害:
14.1 s1和s2指向同一块空间,出了作用域时调用两次析构函数,造成程序崩溃。
14.2 修改一个,另外一个也会修改。

//要用深拷贝进行拷贝构造
//s2(s1);把s1拷贝给s2,*this是s2,s是s1的别名
string::string(const string& s)
{//开一个和要拷贝的一样大小的空间_str = new char[s._capacity + 1];strcpy(_str, s._str);//把数据拷贝进新空间_size = s._size;_capacity = s._capacity;
}

15,=赋值拷贝(传统)

开新空间,拷贝数据,释放原空间,改变指针指向。

//s1 = s3;//s1是*this,s是s3的别名
string& string::operator=(const string& s)
{//避免自己给自己赋值if (this != &s){//多开一个空间给\0char* tmp = new char[s._capacity + 1];strcpy(tmp, s._str);delete[] _str;_str = tmp;_size = s._size;_capacity = s._capacity;return *this;}
}

16,交换函数swap

//s1.swap(s3)
void string::swap(string& s)
{//调用库中的swap函数,交换内置类型//不直接交换数据,而是交换两块空间的指针std::swap(_str, s._str);std::swap(_size, s._size);std::swap(_capacity, s._capacity);
}

17,从pos位置开始取len个字符的串

复用了前面的构造函数和+=运算符。

string string::substr(size_t pos, size_t len)
{//len大于pos后面剩余的字符,有多少取多少if (len > _size - pos){string sub(_str + pos);//直接构造子串返回return sub;}else{string sub;sub.reserve(len);for (size_t i = 0; i < len; i++){sub += _str[pos + i];}return sub;}
}

18. 字符串的比较

只要实现>运算符(或<运算符)和==运算符,其他运算符直接复用即可。

bool string::operator<(const string& s)const{return strcmp(_str, s._str) < 0;}bool string::operator>(const string& s)const{return !(*this <= s);}bool string::operator<=(const string& s)const{return *this < s || *this == s;}bool string::operator>=(const string& s)const{return !(*this < s);}bool string::operator==(const string& s)const{return strcmp(_str, s._str) == 0;}bool string::operator!=(const string& s)const{return !(*this == s);}

19,清除函数clear

清除当前对象里的内容,影响的是_size,不影响_capacity。

void string::clear()
{_str[0] = '\0';_size = 0;
}

20,流插入,流提取

(1) 不适合写成成员函数,涉及第一个参数的位置问题。
(2) 根据声明可知,这两个函数并没有重载成友元函数,而是放在类外。
(3) 在日期类中写成友元是为了访问私有成员,这里可以不写成友元函数,不访问私有成员,直接访问公有成员。

20.1 流插入

ostream& operator<< (ostream& os, const string& str)
{for (size_t i = 0; i < str.size(); i++){os << str[i];}return os;
}

20.2 流提取

注意:
(1) C语言中的scanf:%c时可以拿到空格,拿不到换行,遇到换行直接忽略; %s时两个都拿不到,遇到直接忽略。

C++中的cin:拿不到空格和换行,遇到直接忽略。

在C++中不能用scanf,因为C++的流和C语言的流缓冲区不同。

(2) 为了避免一次性输入够多导致频繁扩容,开辟一个局部数组buff(类似缓冲区),先把字符存在buff中,到达一定数量后再存入str。

istream& operator>> (istream& is, string& str)
{str.clear();char buff[128];int i = 0;char ch = is.get();while (ch != ' ' && ch != '\n'){buff[i++] = ch;//0 - 126if (i == 127){buff[i] = '\0';str += buff;i = 0;}ch = is.get();}//如果buff没有装满if (i != 0){buff[i] = '\0'; str += buff;}return is;
}

21,拷贝构造和赋值拷贝的现代写法

21.1 拷贝构造

复用构造函数,构造一个tmp,再用tmp对象和this交换。此时如果不在声明时给缺省值,刚开始s2是随机值,tmp和s2交换后,tmp就是随机值,tmp出了函数会调用析构函数,此时程序可能会崩溃,所以好给缺省值。

string::string(const string& s)
{//写法1:常用string tmp(s._str);swap(tmp);//写法2://string tmp(s._str);//std::swap(_str, tmp._str);//std::swap(_size, tmp._size);//std::swap(_capacity, tmp._capacity);
}

21.2 赋值拷贝

写法1:

string& string::operator=(const string& s)
{//避免自己给自己赋值if (this != &s){string tmp(s._str);swap(tmp);}return *this;
}

写法2:常用

//s3 = s1   
//这里的传参不能用引用,传值传参会进行拷贝构造,s1会拷贝一份给tmp
//再让tmp与s3交换
string& string::operator=(string tmp)
{swap(tmp);//一行搞定赋值拷贝return *this;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/17181.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

互联网十万个为什么之什么是虚拟化?

虚拟化是在一台物理计算机上同时运行多个虚拟操作系统实例的技术。虚拟操作系统上运行的这些实例被称为虚拟机&#xff08;Virtual Machine&#xff09;或者客户机&#xff08;Guest Machine&#xff09;。每个虚拟机都具备完整的硬件抽象&#xff0c;包括CPU、内存、网络适配器…

【408精华知识】时钟周期、机器周期、总线周期、指令周期、存取周期还傻傻分不清?

在做题时&#xff0c;我们经常能遇到关于“周期”的表述&#xff0c;比如时钟周期、机器周期、总线周期、指令周期、存取周期&#xff0c;类似的表述让我们很容易迷茫&#xff0c;那么接下来我们就看看它们到底是什么、有什么区别&#xff1f; 周期特点时钟周期也称为CPU时钟周…

图片数据增强-resize(不同插值)、各种模糊

各种不同的模糊处理 import os import cv2def apply_blur_to_images(input_folder_path, output_folder_path):# 遍历文件夹下的所有文件for filename in os.listdir(input_folder_path):# 检查文件类型是否为图片if filename.endswith(.jpg) or filename.endswith(.jpeg) or …

手算示例:在神经网络中进行后门攻击及验证

手算示例&#xff1a;在神经网络中进行后门攻击及验证 一、神经网络架构二、初始化参数三、数据集干净数据&#xff08;原始数据&#xff09;带后门数据&#xff08;污染数据&#xff09; 训练步骤四、示例前向传播&#xff08;干净数据&#xff09;计算损失&#xff08;干净数…

每天五分钟深度学习框架pytorch:tensor张量的维度转换大全

本文重点 在深度学习中比较让人头疼的一点就是矩阵的维度,我们必须构建出符合神经网络维度的矩阵,只有将符合要求的矩阵放到神经网络中才可以运行神经网络,本节课程我们将学习以下tensor中维度的变化。 view和shape View和shape,这两个方法可以完成维度的变换操作,而且使…

【C语言实现TCP通信】

要在C语言中实现TCP通信&#xff0c;您可以遵循以下步骤&#xff1a; 创建Socket&#xff1a;使用socket()函数创建套接字&#xff0c;指定协议族为AF_INET&#xff08;IPv4&#xff09;或AF_INET6&#xff08;IPv6&#xff09;&#xff0c;类型为SOCK_STREAM表示使用TCP协议。…

【相机标定系列】【相机模型】SLAM 中常用的相机模型畸变模型总结

Overview 鱼眼镜头的成像原理分类&#xff1a; Dioptric cameras&#xff0c;通过透镜来实现&#xff0c;主要是折射 Catadioptric cameras&#xff0c;使用一个标准相机加一个面镜&#xff08;Shaped mirror&#xff09; polydioptric camera&#xff0c;通过多个相机重叠视…

npm的基本命令和用法

1. 安装与初始化 安装npm 首先&#xff0c;确保你的系统中已安装了Node.js&#xff0c;因为npm随Node.js一同分发。访问Node.js官网下载并安装适合你操作系统的版本。安装完成后&#xff0c;在终端或命令提示符中输入以下命令来验证安装&#xff1a; 1$ node -v 2$ npm -v …

[STM32-HAL库]ADC采集-DMA中断采集-平均值滤波-STM32CUBEMX开发-HAL库开发系列-主控STM32F103C8T6

目录 一、前言 二、实现步骤 1.STM32CUBEMX配置 2.Keil工程程序设计 三、结语 一、前言 本文通过STM32CUBEMX实现对ADC的数据采集和滤波操作&#xff0c;帮助各位开发者完成与模拟量输入的采集工作。 二、实现步骤 1.STM32CUBEMX配置 以STM32F103C8T6为例&#xff0c;打开S…

3D 生成重建015-nerf2mesh从神经辐射场中提取mesh和纹理!

3D 生成重建015-nerf2mesh从神经辐射场中提取mesh和纹理&#xff01; 文章目录 0 论文工作1 论文方法2 效果 0 论文工作 NeRF2Mesh 提出了一种从多视角 RGB 图像重建纹理表面网格的新方法。它克服了传统 NeRF 模型的局限性&#xff0c;由于其隐式表示&#xff0c;传统 NeRF 模…

高斯分步正态分布

高斯分布&#xff0c;也称为正态分布&#xff08;Normal Distribution&#xff09;&#xff0c;是统计学和概率论中最重要的分布之一。它由德国数学家卡尔弗里德里希高斯&#xff08;Carl Friedrich Gauss&#xff09;首先系统研究并命名。以下是关于高斯分布的详细介绍&#x…

基于 Pre-commit 的 Python项目代码风格统一实践

背景信息 统一代码风格首先需要定义参照的规范&#xff0c;每个团队可能会有自己的规范&#xff0c;我们选择的规范是 yapf mypy isort&#xff0c;如果保证所有的研发人员都遵循相关规范呢&#xff1f; 鼓励 IDE 中对应的插件的安装&#xff0c;通过直接对应的插件&#x…

bootstrap实现天平效果

之前提到了&#xff0c;最近&#xff0c;孩子的幼儿园让家长体验“半日助教活动”&#xff0c;每个家长需要讲授15-20分钟的课程。作为一名程序员&#xff0c;实在没有能教的课程&#xff0c;只能做了一个小游戏&#xff0c;带着小朋友们熟悉数字。 在上一章博客中&#xff0c…

【读书】读书笔记——理科生的视角:底层逻辑+数学之美

1&#xff0c;底层逻辑1&#xff08;看清这个世界的底牌&#xff09; 刘润 著 0&#xff09;什么是底层逻辑&#xff1f; 底层逻辑是&#xff1a;事物之间共同点、变化背后不变的东西事&#xff1b;看清事物的本质&#xff0c;才能在复杂变化中从根本上解决问题。 1&#x…

【Java继承】(超级详细!!!)

【Java继承】&#xff08;超级详细&#xff01;&#xff01;&#xff01;&#xff09; 1、 继承的概念2 、继承的语法3、 父类成员访问3.1 子类中访问父类的成员变量3.2 子类中访问父类的成员方法 4、 super关键字5 、子类的构造方法6、 继承关系上的执行顺序7、protected 关键…

ubuntu20.04安装后配置:wifi、屏幕亮度、Nvidia驱动等

文章目录 一、安装时最好用英语&#xff0c;否则Downloads等home下文件夹是中文二、安装后开机无法进入系统图形界面三、清理不必要软件&#xff0c;更新系统四、屏幕亮度、Nvidia驱动五、wifi 一、安装时最好用英语&#xff0c;否则Downloads等home下文件夹是中文 安装完再在…

error: ‘address‘ in ‘class school‘ does not name a type school:: address = “

错误代码 class school{ public:string name;static string address; public:static string getAddress(){return address;} };school::address "南京路";原因 school::address “南京路”;前面未加类型&#xff0c;导致编译错误 解决 class school{ public:stri…

选项卡式小部件QTabWidget

文章目录 1. 详细介绍2. 常用属性3. 信号4. 常用函数5. 官方示例Tab Dialog QTabWidget提供一堆选项卡式小部件。 1. 详细介绍 选项卡式部件提供一个选项卡栏和一个用于显示与每个选项卡相关的页面的页面区域。 默认情况下&#xff0c;选项卡栏显示在页面区域上方&#xff0c;…

Vue.js - 计算属性与侦听器 【0基础向 Vue 基础学习】

文章目录 计算属性 computedcomputed 的使用方法computed 与 method 的区别计算属性完整写法 watch 侦听器&#xff08;监视器&#xff09;简单写法 → 简单类型数据&#xff0c;直接监视完整写法 → 添加额外配置项 计算属性 computed computed 的使用方法 **概念&#xff1…

web题解,基础知识巩固(qsnctf)

1.文章管理系统 1&#xff09;打开题目&#xff0c;把它页面翻完了&#xff0c;没看懂它有啥用 2&#xff09;看了看源码&#xff0c;也是一样的&#xff0c;没找到有用的东西 3&#xff09;想着可能还是在隐藏文件里找&#xff0c;那我就直接用dirsearch扫扫看 4&#xff09;…