【c++】string深度刨析以及实现

#pragma once
#include<iostream>
using namespace std;
#include<assert.h>
namespace bite
{class string{public://迭代器  //像指针 底层不一定是指针 typedef char* iterator;iterator begin(){return _str;}iterator end(){return _str + _size;}//const 版本typedef const char* const_iterator;const_iterator begin() const{return _str;}const_iterator end() const{return _str + _size;}/*	string():_str(nullptr), _size(0),_capacity(0){}*///string(char* str)    //常量字符串不能直接赋值//	:_str(new char[strlen(str) + 1])  //不是很好,strlen是在运行时,所以不适宜多调用//	, _size(strlen(str))//	,_capacity(strlen(str))//{//	strcpy(_str, str);//}// string(const char* str="\0");  可以但是实际不推荐  因为\0的后面还有\0//string(const char* str=nullptr)  缺省参数,strlen不能初始化为空const char* c_str() const{return _str;}//二合一//构造string(const char* str=""):_size(strlen(str)){_str = new char[_size+1];_capacity = _size;strcpy(_str, str);}//拷贝构造s2(s1)//传统写法//string(const string &s)//{//	_str = new char[s._capacity+1];//	strcpy(_str, s._str);//	_size = s._size;//	_capacity = s._capacity;//}//s1=s3//string& operator=(const string& s)//{//	char* tmp = new char[s._capacity + 1];//	strcpy(tmp, s._str);//	delete[] _str;//	_str = tmp;//	_size = s._size;//	_capacity = s._capacity;//	return *this;//}//现代写法   本质是一种复用  假他人之手string(const string& s):_str(nullptr){//调用构造string stmp(s._str);//this和tmp进行交换swap(stmp);}//s1==s3//string& operator=(const string&ss)//{//	//调用拷贝构造//	string tmp(ss);//	swap(tmp);//	return *this;//}string& operator=(string tmp){swap(tmp);return *this;}//析构~string(){delete[] _str;_str = nullptr;_size = _capacity = 0;}//下标+【】遍历size_t  size() const{return _size;}size_t capacity()  const{return _capacity;}char& operator[](size_t pos){assert(pos < _size);return _str[pos];}//const 构造const char& operator[](size_t pos)  const{assert(pos < _size);return _str[pos];}void resize(size_t n, char ch = '\0'){if (n < _size){_str[n] = '\0';_size = n;}else{reserve(n);for (size_t i = _size; i < n; ++i){_str[i] = ch;}_str[n] = '\0';_size = n;}}void reserve(size_t n){if (n > _capacity){char*tmp = new char[n+1];//多开一个‘\0’strcpy(tmp, _str);delete[] _str;_str = tmp;_capacity = n;}}void push_back(char ch){//扩容2倍/*	if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}_str[_size] = ch;_size++;_str[_size] = '\0';*/insert(_size,ch);}void append(const char* str){扩容//int len = strlen(str);//if (_size + len > _capacity)//{//	reserve(_size + len);//}//strcpy(_str + _size, str);//_size += len;insert(_size, str);}string& operator+=(char ch){push_back(ch);return *this;}string& operator+=(const char* str){append(str);return *this;}//pos位置插入void insert(size_t pos, char ch){//等于_size就是尾插assert(pos <= _size);if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}size_t end = _size+1;////这么写头插时因为end是size_t会发生整形提升//while (end>=pos)/*while (end >= pos){_str[end + 1] = _str[end];--end;}*/while (end>pos){_str[end] = _str[end - 1];--end;}_str[pos] = ch;++_size;}void insert(size_t pos, const char*str){assert(pos<=_size);size_t len = strlen(str); if (_size + len > _capacity){reserve(_size+len);}size_t end = _size + len;while (end>pos+len-1){_str[end] = _str[end - len];--end;			}strncpy(_str+pos,str,len);_size += len;}//pos位置删除len个字符void erase(size_t pos,size_t len = npos){assert(pos < _size);//pos+len len处于接近阈值的时候会出现溢出的风险//if (len == npos || pos + len >= _size)//解决溢出风险if (len == npos || _size-pos <=len){_str[pos] = '\0';_size = pos;}else{strcpy(_str+pos,_str+pos+len);_size -=len;}}void swap(string& s){//就近原则,去全局找std::swap(_str, s._str);std::swap(_size, s._size);std::swap(_capacity, s._capacity);}//查找位置 ,返回下标size_t find(char ch,size_t pos=0) const{assert(pos < _size);for (int i = pos; i < _size; ++i){if (_str[i]==ch){return i;}}return npos;}size_t find(const char*sub, size_t pos = 0) const{assert(pos < _size);const char* p = strstr(_str+pos, sub);if (pos){return p - _str;}else{return npos;}}string substr(size_t pos=0, size_t len = npos){string sub;//if(pos==npos||len>=_size-pos)if (len >= _size - pos){for (size_t i = pos; i < _size; ++i){sub += _str[i];}}else{for (size_t i = pos; i < pos + len; ++i){sub += _str[i];}}return sub;}void clear(){_size = 0;_str[_size] = '\0';}private:char* _str;size_t _size;size_t _capacity;public://共有的静态成员变量static const int npos;};const int string::npos = -1;bool operator==(const string& s1, const string& s2){int ret = strcmp(s1.c_str(), s2.c_str());return ret == 0;}bool operator>(const string& s1, const string& s2){int ret = strcmp(s1.c_str(), s2.c_str());return ret > 0;}bool operator>=(const string& s1, const string& s2){return s1 > s2 || s1 == s2;}bool operator<(const string & s1, const string & s2){return !(s1 >= s2 );}bool operator<=(const string& s1, const string& s2){return !(s1 > s2);}void swap(string& x, string& y){x.swap(y);}ostream& operator<<(ostream& out, const string& s){for (auto ch : s){out << ch;}return out;}istream& operator>>(istream& in, string& s){s.clear();char ch;//会出现死循环的情况 scanf和cin默认空格和换行做分割符无法取到//in >> ch;//get遇到一个字符娶一个字符ch = in.get();while (ch!=' '&&ch!='\n'){s += ch;ch = in.get();}return in;}void test_string1(){string s1("hello world");for (size_t i = 0; i < s1.size(); ++i){cout << s1[i] << " ";}cout << endl;string s2("hello worrld");string::iterator it = s2.begin();while (it!=s2.end()){cout << *it << " ";++it;}cout << endl;for (auto ch : s2){cout << ch << " ";}cout << endl;s2.push_back('s');for (auto ch : s2){cout << ch << " ";}cout << endl;s2.append("xxxxx");for (auto ch : s2){cout << ch << " ";}cout << endl; const string s3("hello world");for (auto ch : s3){cout << ch << " ";}cout << endl;//迭代器不一定是原生指针,typeid可以查看原生类型cout << typeid(std::string::iterator).name() << endl;}void test_string2(){string s1("hello world");s1 += 'x';s1 += "ssss";s1.insert(0,'o');for (auto ch : s1){cout << ch << " ";}cout << endl;}void test_string3(){string s3("hello world");for (auto ch : s3){cout << ch << " ";}cout << endl;s3.erase(5, 3);cout << s3.c_str() << endl;}void test_string4(){string s1("hello world");cout << s1.c_str() << endl;//没实现拷贝构造时//程序崩溃,析构的时候对同一块空间多次析构//发生浅拷贝,值拷贝string s2(s1);cout << s2.c_str() << endl;s2.insert(5, "xxxxx");cout << s2.c_str() << endl;}void test_string5(){string s1("hello world");string s2("hello world");cout << s1.c_str() << endl;cout << s2.c_str() << endl;//深拷贝代价:三次拷贝加一次析构 //swap(s1, s2);//s1.swap(s2);//全局重载swap(s1, s2);cout << s1 << endl;cout << s2 << endl;cout << (s1 == s2) << endl;string s4;string s5;cin >> s4 >> s5;cout << s4 << endl;cout << s5 << endl;}
}

     vs和g++下string结构的说明      

  注意:下述结构是在32位平台下进行验证,32位平台下指针占4个字节

vs下string的结构

       string总共占28个字节,内部结构稍微复杂一点,先是有一个联合体,联合体用来定义string中字符串的存储空间:

  • 当字符串长度小于16时,使用内部固定的字符数组来存放
  • 当字符串长度大于等于16时,从堆上开辟空间       
union _Bxty
{ // storage for small buffer or pointer to larger onevalue_type _Buf[_BUF_SIZE];pointer _Ptr;char _Alias[_BUF_SIZE]; // to permit aliasing
} _Bx;

 这种设计也是有一定道理的,大多数情况下字符串的长度都小于16,那string对象创建好之后,内 部已经有了16个字符数组的固定空间,不需要通过堆创建,效率高。

其次:还有一个size_t字段保存字符串长度一个size_t字段保存从堆上开辟空间总的容量

最后:还有一个指针做一些其他事情。
故总共占16+4+4+4=28个字节。

g++下string的结构 

G++下,string是通过写时拷贝实现的,string对象总共占4个字节,内部只包含了一个指针,该指 针将来指向一块堆空间,内部包含了如下字段:

  • 空间总大小
  • 字符串有效长度
  • 引用计数 (解决浅拷贝析构多次的问题)   有引用计数以后,先--引用技术 ,如果减完以后,引用技术==0 代表当前是最后一个管理资源的对象,那就释放。

浅拷贝的修改会影响其他对象的问题 :

检查引用计数,如果等于1,说明资源是自己独占的,不用拷贝
如果大于1,先拷贝再写,这就是写时拷贝

反正都要拷贝,意义是什么?

不是每个对象都会修改,拷贝后不修改就赚   

struct _Rep_base
{size_type _M_length;size_type _M_capacity;_Atomic_word _M_refcount;
};

指向堆空间的指针,用来存储字符串。 

写时拷贝

写时拷贝在读取时的缺陷 

扩展阅读

面试中string的一种正确写法 

STL中的string怎么了 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/10050.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络端口占用问题的综合调研与解决方案

原创 Randy 拍码场 问题背景 去年底信息安全团队进行网络权限治理&#xff0c;要求所有应用实例使用静态IP&#xff0c;公网访问策略与静态IP绑定&#xff1b;之后实例重启时偶现“端口被占用”错误。通过分析总结应用日志&#xff0c;共有以下4种错误类型&#xff0c;实质都是…

kafka生产者消费者举例

文章目录 kafka介绍生产者消费者例子一、生产者二、消费者三、效果 KafkaTemplate KafkaListener kafka介绍 Kafka 是一款分布式流处理平台&#xff0c;它被设计用于高吞吐量、持久性、分布式的数据流处理。 Kafka 简介&#xff1a; Kafka 是一个高吞吐、分布式、基于发布 订阅…

深入了解 Flask Request

文章目录 获取请求数据获取请求信息文件上传总结 Flask 是一个轻量级的 Python Web 框架&#xff0c;其简洁的设计和灵活的扩展性使其成为了许多开发者的首选。在 Flask 中&#xff0c;处理 HTTP 请求是至关重要的&#xff0c;而 Flask 提供了丰富而强大的 request 对象来处理…

SpringAop详解

文章目录 一、Spring自定义注解1、什么是注解&#x1f468;‍&#x1f3eb;2、注解的目的或作用&#x1f49e;3、JDK内置注解&#x1f4ab; 【内置元注解 一共八个固定注解】4、元注解 &#x1f3af;5、自定义注解&#x1f4f8;5、Java反射API和类加载过程51、什么是反射基本原…

GT资源-Clock资源

一、Transmitter 时钟分布 XCLK&#xff1a;在使用TX buffer的模式下&#xff0c;XCLK来源于TXOUTCLK。在使用TX bypassing的模式下XCLK来源于TXUSERCLK。TXUSRCLK是GTX/GTH中PCS的内部逻辑时钟。TXUSRCLK2是GT Transceiver 用户侧逻辑时钟。 TXUSRCLK与TXUSRCLK2的关系 FPGA …

ECharts系列文章汇总(持续更新中)

ECharts介绍 ECharts是一款基于JavaScript的数据可视化图表库&#xff0c;提供了直观、生动、可交互、可个性化定制的数据可视化图表。以下是关于ECharts的详细介绍&#xff1a; 发展历程&#xff1a; ECharts最初由百度团队开源&#xff0c;并在2018年初捐赠给Apache基金会&…

【C++阅览室】C++之Vector(容器)

目录 vector的介绍 vector的使用 vector的定义 vector iterator 的使用 vector 空间增长问题 vector 增删查改 vector 迭代器失效问题。&#xff08;重点&#xff09; vector的介绍 1、 vector 是表示可变大小数组的序列容器&#xff0c;可以使用连…

大语言模型的后处理

后处理的输入 常规意义上的大模型处理流程 import torch from transformers import LlamaForCausalLM, LlamaTokenizer# 加载模型和tokenizer model LlamaForCausalLM.from_pretrained("decapoda-research/llama-7b-hf") tokenizer LlamaTokenizer.from_pretrain…

【0002day】citespace知网教程

文章目录 1.建立路径2.数据转换3.数据分析 citespace这个也可以用来分析研究方向。 1.建立路径 首先建立四个文件夹。 2.数据转换 这一步需要导出知网数据&#xff0c;然后还要转换数据。 首先需要选中数据。 导出数据&#xff0c;refworks 将数据下载到input里。 转换…

Linux 磁盘分区工具 gdisk / fdisk

fdisk 是传统的 Linux 磁盘分区工具&#xff0c;磁盘容量有2T的大小限制&#xff1b;gdisk 又叫 GPT fdisk, 作为 fdisk 的升级版&#xff0c;主要使用的是GPT分区类型&#xff0c;用来划分容量大于2T的硬盘&#xff0c;本文介绍使用方法。 简介 早期的磁盘使用 fdisk 工具分区…

C++ 多态 - 下

目录 1. 多态的原理 1.1. 虚函数表 1.2. 多态原理 1.3. 静态绑定和动态绑定 1.3.1. 运行时决议 1.3.2. 编译时决议 1.4. 为什么基类的对象调用虚函数不能构成多态 2. 单继承中的虚函数表 2.1. 同类型对象的虚表 2.2. 单继承的对象的虚表 2.2.1. 内存窗口查看 2.2.2…

[CISCN 2018]sm

目录 1.题目 3.解题 4.参考 1.题目 题目链接 from Crypto.Util.number import getPrime,long_to_bytes,bytes_to_long from Crypto.Cipher import AES import hashlib from random import randint def gen512num():order[]while len(order)!512:tmprandint(1,512)if tmp n…

【送书福利第六期】Java开发的150多个坑,你踩过几个?(文末送书)

文章目录 做Java开发别掉坑里还不知道 程序员为什么会掉到坑里却不自知&#xff1f;第一是意识不到坑的存在。第二是有些 bug 或问题只在特定情况下暴露。第三是变化不明显的性能问题。 《Java开发坑点解析&#xff1a;从根因分析到最佳实践》Java 开发完美避坑指南结语 &#…

2010-2022年ESA_ CCI-LC数据集下载

扫描文末二维码&#xff0c;关注微信公众号&#xff1a;ThsPool 后台回复 g009&#xff0c;领取 2010-2022年300m分辨率 ESA_ CCI-LC 数据集 哥白尼气候数据集&#xff1a;土地利用和土地覆盖研究的宝贵资源 &#x1f30d;&#x1f50d; 土地利用和土地覆盖变化是全球变化研究…

纯血鸿蒙APP实战开发——自定义安全键盘案例

介绍 金融类应用在密码输入时&#xff0c;一般会使用自定义安全键盘。本示例介绍如何使用TextInput组件实现自定义安全键盘场景&#xff0c;主要包括TextInput.customKeyboard绑定自定义键盘、自定义键盘布局和状态更新等知识点。 效果图预览 实现思路 1. 使用TextInput的cu…

docker安装nginx支持ssl 实现https访问(完整版)

全文目录,一步到位 1.前言简介1.1 专栏传送门1.1.1 本文简介 2. docker安装nginx支持ssl2.0 准备ssl证书(例: 阿里云)2.0.1 配置域名解析2.0.2 找到数字证书管理服务并签发ssl证书2.0.3 选择默认证书 填写域名 创建2.0.4 提交审核, 签发成功2.0.5 解压并上传到宿主机ssl路径下 …

异常处理/__LINE__ 与 __FILE__ 宏在调试和异常处理中的高级使用

文章目录 概述痛点分析_LINE_ 代码所在行号_LINE_ 直接转为字符串_LINE_ 作为整型数据使用_LINE_标记宏函数的调用位置 _FILE_ 代码所在文件名简单实验不期望 _FILE_ 宏代表全路径 assert 使用了 _FILE_ 和 _LINE_借助TLS技术小结 概述 _LINE_和_FILE_是C/C中的预定义宏&#…

HarmonyOS开发案例:【生活健康app之编写通用工具类】(5)

本节将介绍日志打印、时间换算等通用工具类的编写和使用&#xff0c;工具类可以简化应用代码编写和业务流程处理。 日志类 日志类Logger旨在提供一个全局的日志打印、日志管理的地方&#xff0c;既可以规范整个应用的日志打印&#xff0c;也方便日后对日志工具类进行修改&…

利用106短信群发平台能否提升沟通效率?

利用106短信群发平台确实能够显著提升沟通效率&#xff0c;具体体现在以下几个方面&#xff1a; 1.快速传递信息&#xff1a;106短信群发平台能够实现信息的快速传递。一旦设置好发送内容和接收群体&#xff0c;短信便能在瞬间发送至大量用户。这种即时性确保了信息的迅速传达…