【c++】string深度刨析以及实现

#pragma once
#include<iostream>
using namespace std;
#include<assert.h>
namespace bite
{class string{public://迭代器  //像指针 底层不一定是指针 typedef char* iterator;iterator begin(){return _str;}iterator end(){return _str + _size;}//const 版本typedef const char* const_iterator;const_iterator begin() const{return _str;}const_iterator end() const{return _str + _size;}/*	string():_str(nullptr), _size(0),_capacity(0){}*///string(char* str)    //常量字符串不能直接赋值//	:_str(new char[strlen(str) + 1])  //不是很好,strlen是在运行时,所以不适宜多调用//	, _size(strlen(str))//	,_capacity(strlen(str))//{//	strcpy(_str, str);//}// string(const char* str="\0");  可以但是实际不推荐  因为\0的后面还有\0//string(const char* str=nullptr)  缺省参数,strlen不能初始化为空const char* c_str() const{return _str;}//二合一//构造string(const char* str=""):_size(strlen(str)){_str = new char[_size+1];_capacity = _size;strcpy(_str, str);}//拷贝构造s2(s1)//传统写法//string(const string &s)//{//	_str = new char[s._capacity+1];//	strcpy(_str, s._str);//	_size = s._size;//	_capacity = s._capacity;//}//s1=s3//string& operator=(const string& s)//{//	char* tmp = new char[s._capacity + 1];//	strcpy(tmp, s._str);//	delete[] _str;//	_str = tmp;//	_size = s._size;//	_capacity = s._capacity;//	return *this;//}//现代写法   本质是一种复用  假他人之手string(const string& s):_str(nullptr){//调用构造string stmp(s._str);//this和tmp进行交换swap(stmp);}//s1==s3//string& operator=(const string&ss)//{//	//调用拷贝构造//	string tmp(ss);//	swap(tmp);//	return *this;//}string& operator=(string tmp){swap(tmp);return *this;}//析构~string(){delete[] _str;_str = nullptr;_size = _capacity = 0;}//下标+【】遍历size_t  size() const{return _size;}size_t capacity()  const{return _capacity;}char& operator[](size_t pos){assert(pos < _size);return _str[pos];}//const 构造const char& operator[](size_t pos)  const{assert(pos < _size);return _str[pos];}void resize(size_t n, char ch = '\0'){if (n < _size){_str[n] = '\0';_size = n;}else{reserve(n);for (size_t i = _size; i < n; ++i){_str[i] = ch;}_str[n] = '\0';_size = n;}}void reserve(size_t n){if (n > _capacity){char*tmp = new char[n+1];//多开一个‘\0’strcpy(tmp, _str);delete[] _str;_str = tmp;_capacity = n;}}void push_back(char ch){//扩容2倍/*	if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}_str[_size] = ch;_size++;_str[_size] = '\0';*/insert(_size,ch);}void append(const char* str){扩容//int len = strlen(str);//if (_size + len > _capacity)//{//	reserve(_size + len);//}//strcpy(_str + _size, str);//_size += len;insert(_size, str);}string& operator+=(char ch){push_back(ch);return *this;}string& operator+=(const char* str){append(str);return *this;}//pos位置插入void insert(size_t pos, char ch){//等于_size就是尾插assert(pos <= _size);if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}size_t end = _size+1;////这么写头插时因为end是size_t会发生整形提升//while (end>=pos)/*while (end >= pos){_str[end + 1] = _str[end];--end;}*/while (end>pos){_str[end] = _str[end - 1];--end;}_str[pos] = ch;++_size;}void insert(size_t pos, const char*str){assert(pos<=_size);size_t len = strlen(str); if (_size + len > _capacity){reserve(_size+len);}size_t end = _size + len;while (end>pos+len-1){_str[end] = _str[end - len];--end;			}strncpy(_str+pos,str,len);_size += len;}//pos位置删除len个字符void erase(size_t pos,size_t len = npos){assert(pos < _size);//pos+len len处于接近阈值的时候会出现溢出的风险//if (len == npos || pos + len >= _size)//解决溢出风险if (len == npos || _size-pos <=len){_str[pos] = '\0';_size = pos;}else{strcpy(_str+pos,_str+pos+len);_size -=len;}}void swap(string& s){//就近原则,去全局找std::swap(_str, s._str);std::swap(_size, s._size);std::swap(_capacity, s._capacity);}//查找位置 ,返回下标size_t find(char ch,size_t pos=0) const{assert(pos < _size);for (int i = pos; i < _size; ++i){if (_str[i]==ch){return i;}}return npos;}size_t find(const char*sub, size_t pos = 0) const{assert(pos < _size);const char* p = strstr(_str+pos, sub);if (pos){return p - _str;}else{return npos;}}string substr(size_t pos=0, size_t len = npos){string sub;//if(pos==npos||len>=_size-pos)if (len >= _size - pos){for (size_t i = pos; i < _size; ++i){sub += _str[i];}}else{for (size_t i = pos; i < pos + len; ++i){sub += _str[i];}}return sub;}void clear(){_size = 0;_str[_size] = '\0';}private:char* _str;size_t _size;size_t _capacity;public://共有的静态成员变量static const int npos;};const int string::npos = -1;bool operator==(const string& s1, const string& s2){int ret = strcmp(s1.c_str(), s2.c_str());return ret == 0;}bool operator>(const string& s1, const string& s2){int ret = strcmp(s1.c_str(), s2.c_str());return ret > 0;}bool operator>=(const string& s1, const string& s2){return s1 > s2 || s1 == s2;}bool operator<(const string & s1, const string & s2){return !(s1 >= s2 );}bool operator<=(const string& s1, const string& s2){return !(s1 > s2);}void swap(string& x, string& y){x.swap(y);}ostream& operator<<(ostream& out, const string& s){for (auto ch : s){out << ch;}return out;}istream& operator>>(istream& in, string& s){s.clear();char ch;//会出现死循环的情况 scanf和cin默认空格和换行做分割符无法取到//in >> ch;//get遇到一个字符娶一个字符ch = in.get();while (ch!=' '&&ch!='\n'){s += ch;ch = in.get();}return in;}void test_string1(){string s1("hello world");for (size_t i = 0; i < s1.size(); ++i){cout << s1[i] << " ";}cout << endl;string s2("hello worrld");string::iterator it = s2.begin();while (it!=s2.end()){cout << *it << " ";++it;}cout << endl;for (auto ch : s2){cout << ch << " ";}cout << endl;s2.push_back('s');for (auto ch : s2){cout << ch << " ";}cout << endl;s2.append("xxxxx");for (auto ch : s2){cout << ch << " ";}cout << endl; const string s3("hello world");for (auto ch : s3){cout << ch << " ";}cout << endl;//迭代器不一定是原生指针,typeid可以查看原生类型cout << typeid(std::string::iterator).name() << endl;}void test_string2(){string s1("hello world");s1 += 'x';s1 += "ssss";s1.insert(0,'o');for (auto ch : s1){cout << ch << " ";}cout << endl;}void test_string3(){string s3("hello world");for (auto ch : s3){cout << ch << " ";}cout << endl;s3.erase(5, 3);cout << s3.c_str() << endl;}void test_string4(){string s1("hello world");cout << s1.c_str() << endl;//没实现拷贝构造时//程序崩溃,析构的时候对同一块空间多次析构//发生浅拷贝,值拷贝string s2(s1);cout << s2.c_str() << endl;s2.insert(5, "xxxxx");cout << s2.c_str() << endl;}void test_string5(){string s1("hello world");string s2("hello world");cout << s1.c_str() << endl;cout << s2.c_str() << endl;//深拷贝代价:三次拷贝加一次析构 //swap(s1, s2);//s1.swap(s2);//全局重载swap(s1, s2);cout << s1 << endl;cout << s2 << endl;cout << (s1 == s2) << endl;string s4;string s5;cin >> s4 >> s5;cout << s4 << endl;cout << s5 << endl;}
}

     vs和g++下string结构的说明      

  注意:下述结构是在32位平台下进行验证,32位平台下指针占4个字节

vs下string的结构

       string总共占28个字节,内部结构稍微复杂一点,先是有一个联合体,联合体用来定义string中字符串的存储空间:

  • 当字符串长度小于16时,使用内部固定的字符数组来存放
  • 当字符串长度大于等于16时,从堆上开辟空间       
union _Bxty
{ // storage for small buffer or pointer to larger onevalue_type _Buf[_BUF_SIZE];pointer _Ptr;char _Alias[_BUF_SIZE]; // to permit aliasing
} _Bx;

 这种设计也是有一定道理的,大多数情况下字符串的长度都小于16,那string对象创建好之后,内 部已经有了16个字符数组的固定空间,不需要通过堆创建,效率高。

其次:还有一个size_t字段保存字符串长度一个size_t字段保存从堆上开辟空间总的容量

最后:还有一个指针做一些其他事情。
故总共占16+4+4+4=28个字节。

g++下string的结构 

G++下,string是通过写时拷贝实现的,string对象总共占4个字节,内部只包含了一个指针,该指 针将来指向一块堆空间,内部包含了如下字段:

  • 空间总大小
  • 字符串有效长度
  • 引用计数 (解决浅拷贝析构多次的问题)   有引用计数以后,先--引用技术 ,如果减完以后,引用技术==0 代表当前是最后一个管理资源的对象,那就释放。

浅拷贝的修改会影响其他对象的问题 :

检查引用计数,如果等于1,说明资源是自己独占的,不用拷贝
如果大于1,先拷贝再写,这就是写时拷贝

反正都要拷贝,意义是什么?

不是每个对象都会修改,拷贝后不修改就赚   

struct _Rep_base
{size_type _M_length;size_type _M_capacity;_Atomic_word _M_refcount;
};

指向堆空间的指针,用来存储字符串。 

写时拷贝

写时拷贝在读取时的缺陷 

扩展阅读

面试中string的一种正确写法 

STL中的string怎么了 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/10050.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络端口占用问题的综合调研与解决方案

原创 Randy 拍码场 问题背景 去年底信息安全团队进行网络权限治理&#xff0c;要求所有应用实例使用静态IP&#xff0c;公网访问策略与静态IP绑定&#xff1b;之后实例重启时偶现“端口被占用”错误。通过分析总结应用日志&#xff0c;共有以下4种错误类型&#xff0c;实质都是…

kafka生产者消费者举例

文章目录 kafka介绍生产者消费者例子一、生产者二、消费者三、效果 KafkaTemplate KafkaListener kafka介绍 Kafka 是一款分布式流处理平台&#xff0c;它被设计用于高吞吐量、持久性、分布式的数据流处理。 Kafka 简介&#xff1a; Kafka 是一个高吞吐、分布式、基于发布 订阅…

Emmy load workspace 排除一些目录

项目根目录新增 emmy.config.json { “source”: [ { “dir”: “./”, “exclude”: [ “Assets/Script/LuaScript/Config/.lua", "Share/DNS/Android/common/.lua”, “Assets/Script/LuaScript/UI/Team/Views/**.lua” ] } ] }

深入了解 Flask Request

文章目录 获取请求数据获取请求信息文件上传总结 Flask 是一个轻量级的 Python Web 框架&#xff0c;其简洁的设计和灵活的扩展性使其成为了许多开发者的首选。在 Flask 中&#xff0c;处理 HTTP 请求是至关重要的&#xff0c;而 Flask 提供了丰富而强大的 request 对象来处理…

根据地址栏url上key获取值

vue项目&#xff0c;main.js: // 根据url上key获取值&#xff0c;key为参数名字&#xff0c;例如token export function sessionIdFunc(key){ const urlSessionId new URLSearchParams(window.location.hash.slice(window.location.hash.indexOf(?))); const paramSessionI…

安装InternVL

InternVL 官网 interVL 安装 完全删除环境和环境中的所有软件包 conda remove -n env_name --all 安装 克隆此存储库&#xff1a; git clone https://github.com/OpenGVLab/InternVL.git 创建conda虚拟环境并激活&#xff1a; conda create -n inter pytho…

SpringAop详解

文章目录 一、Spring自定义注解1、什么是注解&#x1f468;‍&#x1f3eb;2、注解的目的或作用&#x1f49e;3、JDK内置注解&#x1f4ab; 【内置元注解 一共八个固定注解】4、元注解 &#x1f3af;5、自定义注解&#x1f4f8;5、Java反射API和类加载过程51、什么是反射基本原…

前端:零宽字符

1. 概念 看不见得字符&#xff0c;称为零宽字符&#xff0c;也叫幽灵字符。 2. 作用 保护我们文章得知识产权。加文字水印&#xff0c;不影响阅读。 3. unicode 零宽字符 U200B: 空格符&#xff0c;用于较长单词得换行分隔。 U200C: 断字符&#xff0c;用于阿拉伯文、德文…

GT资源-Clock资源

一、Transmitter 时钟分布 XCLK&#xff1a;在使用TX buffer的模式下&#xff0c;XCLK来源于TXOUTCLK。在使用TX bypassing的模式下XCLK来源于TXUSERCLK。TXUSRCLK是GTX/GTH中PCS的内部逻辑时钟。TXUSRCLK2是GT Transceiver 用户侧逻辑时钟。 TXUSRCLK与TXUSRCLK2的关系 FPGA …

Python面试题【数据结构和算法部分161-200】

Python面试题【数据结构和算法部分161-200】 Python面试题【数据结构和算法部分161-200】 Python面试题【数据结构和算法部分161-200】 问题&#xff1a;如何在Python中找到最近公共祖先&#xff08;LCA&#xff09;&#xff1f; 答案&#xff1a; class TreeNode:def __init_…

ECharts系列文章汇总(持续更新中)

ECharts介绍 ECharts是一款基于JavaScript的数据可视化图表库&#xff0c;提供了直观、生动、可交互、可个性化定制的数据可视化图表。以下是关于ECharts的详细介绍&#xff1a; 发展历程&#xff1a; ECharts最初由百度团队开源&#xff0c;并在2018年初捐赠给Apache基金会&…

解决PL/SQL中文乱码??????

三部解决pl/sql中文乱码问题 一、查询数据库字符集 语句&#xff1a;select userenv(language) from dual 二、设置环境变量 操作&#xff1a;计算机->属性->高级系统设置->环境变量->新建环境变量名NLS_LANG&#xff0c;值是第一步查询结果。 三、重启PL/SQL&a…

【C++阅览室】C++之Vector(容器)

目录 vector的介绍 vector的使用 vector的定义 vector iterator 的使用 vector 空间增长问题 vector 增删查改 vector 迭代器失效问题。&#xff08;重点&#xff09; vector的介绍 1、 vector 是表示可变大小数组的序列容器&#xff0c;可以使用连…

大语言模型的后处理

后处理的输入 常规意义上的大模型处理流程 import torch from transformers import LlamaForCausalLM, LlamaTokenizer# 加载模型和tokenizer model LlamaForCausalLM.from_pretrained("decapoda-research/llama-7b-hf") tokenizer LlamaTokenizer.from_pretrain…

【0002day】citespace知网教程

文章目录 1.建立路径2.数据转换3.数据分析 citespace这个也可以用来分析研究方向。 1.建立路径 首先建立四个文件夹。 2.数据转换 这一步需要导出知网数据&#xff0c;然后还要转换数据。 首先需要选中数据。 导出数据&#xff0c;refworks 将数据下载到input里。 转换…

grep中正则表达式

本文正则表达式主要是对 GNU Grep 3.11的章节的学习。标注特殊颜色的文字不需要太关注。 Regular Expressions A regular expression is a pattern that describes a set of strings. Regular expressions are constructed analogously to arithmetic expressions, by using v…

Linux 磁盘分区工具 gdisk / fdisk

fdisk 是传统的 Linux 磁盘分区工具&#xff0c;磁盘容量有2T的大小限制&#xff1b;gdisk 又叫 GPT fdisk, 作为 fdisk 的升级版&#xff0c;主要使用的是GPT分区类型&#xff0c;用来划分容量大于2T的硬盘&#xff0c;本文介绍使用方法。 简介 早期的磁盘使用 fdisk 工具分区…

C++ 多态 - 下

目录 1. 多态的原理 1.1. 虚函数表 1.2. 多态原理 1.3. 静态绑定和动态绑定 1.3.1. 运行时决议 1.3.2. 编译时决议 1.4. 为什么基类的对象调用虚函数不能构成多态 2. 单继承中的虚函数表 2.1. 同类型对象的虚表 2.2. 单继承的对象的虚表 2.2.1. 内存窗口查看 2.2.2…

[CISCN 2018]sm

目录 1.题目 3.解题 4.参考 1.题目 题目链接 from Crypto.Util.number import getPrime,long_to_bytes,bytes_to_long from Crypto.Cipher import AES import hashlib from random import randint def gen512num():order[]while len(order)!512:tmprandint(1,512)if tmp n…