C++之写时复制(CopyOnWrite)

设计模式专栏:http://t.csdnimg.cn/4j9Cq

目录

1.简介

2.实现原理

3.QString的实现分析

3.1.内部结构

3.2.写入时复制

4.示例分析

5.使用场景

6.总结


1.简介

        CopyOnWrite (COW) 是一种编程思想,用于优化内存使用和提高性能。COW 的基本思想是,如果多个对象或变量共享相同的数据,那么它们最初可以共享同一份数据,而不是为每个对象创建独立的数据副本。如果任何一个对象想要修改数据,就会创建数据的副本,然后在副本上进行修改,而原始数据保持不变。

        这种技术在处理不可变数据结构或很少修改数据的情况下特别有用。通过最初共享数据,COW 避免了不必要的复制,提高了内存效率。它还减少了对共享数据的修改对其他对象的影响,因为它们继续引用原始数据,直到进行修改。

        Qt 的 QString 正是采用了 COW 思想,它是如何工作的呢?简单来说,就是平时查询的时候,都不需要加锁,随便访问,只有在更新的时候,才会从原来的数据复制一个副本出来,然后修改这个副本,最后把原数据替换成当前的副本。修改操作的同时,读操作不会被阻塞,而是继续读取旧的数据。

2.实现原理

        写时复制的原理就是浅拷贝加引用计数。 当只是进行读操作时,就进行浅拷贝,如果需要进行写操作的时候,再进行深拷贝;再加一个引用计数,多个指针指向同一块空间,记录同一块空间的对象个数。

        1) QString之写时复制

当两个QString发生复制或者赋值时,不会复制字符串内容,而是增加一个引用计数,然后字符串指针进行浅拷贝,其执行效率为O(1)。只有当修改其中一个字符串内容时,才执行真正的复制。

        2) 引用计数

堆区,为了好获取将将引用计数与数据放在一起,并且最好在数据前面,这样当数据变化的时候不会移动引用计数的位置

3.QString的实现分析

3.1.内部结构

QString 内部的数据结构是 QTypedArrayData

template <class T>
struct QTypedArrayData: QArrayData
{...
};typedef QTypedArrayData<ushort> QStringData;class Q_CORE_EXPORT QString
{
public:typedef QStringData Data;...Data*  d;  //真正存储QString数据的对象
};

而 QTypedArrayData 继承自 QArrayData。

struct Q_CORE_EXPORT QArrayData
{QtPrivate::RefCount ref;  //引用计数int size;uint alloc : 31;uint capacityReserved : 1;qptrdiff offset; // in bytes from beginning of headervoid *data(){Q_ASSERT(size == 0|| offset < 0 || size_t(offset) >= sizeof(QArrayData));return reinterpret_cast<char *>(this) + offset;}const void *data() const{Q_ASSERT(size == 0|| offset < 0 || size_t(offset) >= sizeof(QArrayData));return reinterpret_cast<const char *>(this) + offset;}...
};

QArrayData 有个 QtPrivate::RefCount 类型的成员变量 ref,该成员变量记录着该内存块的引用。也就是说,QString 采用了 Copy On Write 的技术优化了存放字符串的内存块。

3.2.写入时复制

QtPrivate::RefCount的作用就是保存计数,从它的源码可以看出:

class RefCount
{
public:inline bool ref() Q_DECL_NOTHROW {  //增加引用计数int count = atomic.load();
#if !defined(QT_NO_UNSHARABLE_CONTAINERS)if (count == 0) // !isSharablereturn false;
#endifif (count != -1) // !isStaticatomic.ref();return true;}inline bool deref() Q_DECL_NOTHROW { //减少引用计数int count = atomic.load();
#if !defined(QT_NO_UNSHARABLE_CONTAINERS)if (count == 0) // !isSharablereturn false;
#endifif (count == -1) // isStaticreturn true;return atomic.deref();}...QBasicAtomicInt atomic;  //原子变量
};

QString::QString(const QString &other)复制构造函数中:

QString &QString::operator=(const QString &other) Q_DECL_NOTHROW
{other.d->ref.ref();    //other增加引用计数 [1]if (!d->ref.deref())    //自己减少引用计数 [2]Data::deallocate(d); //如果自己计数为0则释放内存 [3]d = other.d;            //直接指针赋值 [4]return *this;
}

通过4步完成了拷贝构造函数,相比深拷贝:

class String{
public:String(const String &rhs):m_pstr(new char[strlen(rhs) + 1]()){}
private:char* m_pstr;
};

减少了内存申请和拷贝的过程,从而大大的提高了运行效率。

在追加内容函数QString::append(const QString &str) 的实现也看出的确是采用了 COW 技术

QString &QString::append(const QString &str)
{if (str.d != Data::sharedNull()) {if (d == Data::sharedNull()) {operator=(str);} else {if (d->ref.isShared() || uint(d->size + str.d->size) + 1u > d->alloc)reallocData(uint(d->size + str.d->size) + 1u, true); //memcpy(d->data() + d->size, str.d->data(), str.d->size * sizeof(QChar));d->size += str.d->size;d->data()[d->size] = '\0';}}return *this;
}
void QString::reallocData(uint alloc, bool grow)
{auto allocOptions = d->detachFlags();if (grow)allocOptions |= QArrayData::Grow;if (d->ref.isShared() || IS_RAW_DATA(d)) {Data *x = Data::allocate(alloc, allocOptions);Q_CHECK_PTR(x);x->size = qMin(int(alloc) - 1, d->size);::memcpy(x->data(), d->data(), x->size * sizeof(QChar));x->data()[x->size] = 0;if (!d->ref.deref())Data::deallocate(d);d = x;} else {Data *p = Data::reallocateUnaligned(d, alloc, allocOptions);Q_CHECK_PTR(p);d = p;}
}

从上述代码可以看出,reallocData函数在重新写入数据时会重新分配内存,在新的内存上增加计数并减少原有内存技术,这正是COW的思想所在。

4.示例分析

在C++中,虽然标准库并没有直接提供写入时复制的实现,但你可以通过自定义数据结构来实现这种策略。下面是一个简单的示例,展示了如何在C++中实现一个写入时复制的数组:

#include <iostream>  
#include <vector>  
#include <memory>  template <typename T>  
class CopyOnWriteArray {  
private:  std::shared_ptr<std::vector<T>> data;  public:  CopyOnWriteArray() : data(std::make_shared<std::vector<T>>()) {}  // 获取数组的大小  size_t size() const {  return data->size();  }  // 获取指定位置的元素(只读)  const T& operator[](size_t index) const {  return (*data)[index];  }  // 修改指定位置的元素(写入时复制)  void set(size_t index, const T& value) {  if (data.unique()) {  // 如果当前是唯一持有者,则无需复制  } else {  // 否则,创建一个新的数据副本  data = std::make_shared<std::vector<T>>(*data);  }  (*data)[index] = value;  }  // 添加一个新元素到数组的末尾(写入时复制)  void push_back(const T& value) {  if (data.unique()) {  // 如果当前是唯一持有者,则直接在原数组上添加元素  data->push_back(value);  } else {  // 否则,创建一个新的数据副本,并在副本上添加元素  data = std::make_shared<std::vector<T>>(*data);  data->push_back(value);  }  }  
};  int main() {  CopyOnWriteArray<int> array;  array.push_back(1);  array.push_back(2);  array.push_back(3);  std::cout << "Size: " << array.size() << std::endl;  std::cout << "Element at index 1: " << array[1] << std::endl;  array.set(1, 100); // 写入时复制发生在这里  std::cout << "Element at index 1 after modification: " << array[1] << std::endl;  return 0;  
}

        这个示例中,CopyOnWriteArray 类使用 std::shared_ptr 来管理底层数据的生命周期。当多个 CopyOnWriteArray 对象共享同一个 std::vector 时,如果其中一个对象尝试修改数据,就会触发写入时复制。这是因为修改操作会检查 std::shared_ptr 的引用计数,如果计数大于1,就创建一个新的 std::vector 副本,并在副本上进行修改。这样,其他仍然引用原始 std::vector 的对象不会受到影响。

5.使用场景

        写入时复制(CopyOnWrite)的使用场景主要集中在需要高并发读操作,而写操作相对较少的场景。这种策略特别适用于那些读操作远多于写操作,且写操作不会频繁发生的情况。下面是一些具体的使用场景:

  1. 并发容器:当需要实现线程安全的容器,并且读操作远多于写操作时,可以使用基于写入时复制的并发容器。这种容器可以确保在读取数据时不需要加锁,从而提供高效的并发读取性能。只有在写入数据时,才会复制底层数据并进行修改,从而保持线程安全。

  2. 共享不可变数据:在某些情况下,多个线程或进程需要共享一些不可变的数据。当这些数据需要更新时,可以使用写入时复制策略来创建一个新的数据副本,并在副本上进行修改。这样,其他线程或进程仍然可以安全地访问原始数据,而不会受到修改的影响。

  3. 事件处理系统:在事件驱动的系统中,事件处理函数通常需要读取事件数据并进行处理。如果多个事件处理函数可以同时处理不同的事件,并且事件数据在事件处理过程中不会被修改,那么可以使用写入时复制的容器来存储事件数据。这样,每个事件处理函数都可以安全地读取事件数据,而不需要担心数据竞争或一致性问题。

  4. 日志记录:在日志记录系统中,通常需要记录大量的日志信息,并且这些日志信息主要是被读取和分析的,而不是被修改的。使用写入时复制的容器来存储日志信息可以提高并发写入的性能,因为多个线程可以同时写入不同的日志条目,而不需要进行复杂的同步操作。

        需要注意的是,写入时复制策略在写操作频繁或数据量非常大的情况下可能会导致较高的内存开销和性能下降。因此,在选择使用写入时复制时,需要仔细评估应用场景的读写比例、数据量和性能要求,以确保其适用性。此外,还需要注意在实现写入时复制策略时正确管理内存和引用计数,以避免内存泄漏和其他问题。

6.总结

使用CopyOnWrite思想有以下几个好处:

内存效率:CopyOnWrite允许多个对象共享相同的数据,避免了不必要的数据复制。这对于大型数据结构或多个对象需要引用相同数据的情况下,可以节省大量的内存。

 性能优化:对于很少修改数据的情况下,CopyOnWrite可以显著提高性能。由于读操作不需要加锁,多个线程可以同时访问共享数据,提高并发访问的效率。对于一些读多写少的数据,写入时复制的做法就很不错,例如配置、黑名单、物流地址等变化非常少的数据,这是一种无锁的实现。可以帮我们实现程序更高的并发。

减少数据拷贝:CopyOnWrite只在写操作时进行数据拷贝,而在读操作时共享数据。这减少了不必要的数据拷贝开销,提高了性能。

尽管CopyOnWrite有一些优点,但也存在一些缺点或不足之处:

写操作开销:当有写操作发生时,CopyOnWrite需要进行数据的复制,这会引入一定的开销。复制大型数据结构可能会消耗较多的时间和内存,并且频繁的写操作可能会影响性能

不适合频繁修改的场景:由于CopyOnWrite需要进行数据复制,所以频繁的写操作会导致性能下降。对于需要频繁修改数据的场景,可能有更适合的数据结构或算法选择

        总的来说,CopyOnWrite适用于多个读操作、少量写操作的场景,可以提供高效的内存使用和线程安全的并发访问。但需要权衡其开销和适用性,根据具体情况选择使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/827296.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

go的编译以及运行时环境

开篇 很多语言都有自己的运行时环境&#xff0c;go自然也不例外&#xff0c;那么今天我们就来讲讲go语言的运行时环境&#xff01; 不同语言的运行时环境对比 我们都知道Java的运行时环境是jvm &#xff0c;javascript的运行时环境是浏览器内核 Java -->jvm javascript…

FastWiki一分钟本地离线部署本地企业级人工智能客服

介绍 FastWiki是一个开源的企业级人工智能客服系统&#xff0c;它使用了一系列先进的技术和框架来支持其功能。 技术栈 前端框架&#xff1a;React LobeUI TypeScript后端框架&#xff1a;MasaFramework 基于 .NET 8动态函数&#xff1a;基于JavaScript V8引擎实现向量搜索…

物联网配网工具多元化助力腾飞——智能连接,畅享未来

随着物联网技术的迅猛发展&#xff0c;智能插座、蓝牙网关作为其中常见的智能物联设备&#xff0c;无论是功能还是外观都有很大的改进&#xff0c;在智能化越来越普遍的情况下&#xff0c;它们的应用场景也在不断拓宽。对于智能设备而言&#xff0c;配网方式的选择对于设备的成…

Jenkins CI/CD 持续集成专题一 Jenkins的安装和配置

一 jenkins 官方教程 安装Jenkins 二 安装 2.1 安装方式一 通过安装包的package方式安装 第一步下载链接&#xff1a; Download the latest package 第二步操作方式&#xff1a;打开包并按照说明操作即可安装 2.2 安装方式二 brew安装 第一 安装最新版本jenkins brew in…

【Java框架】SpringMVC(二)——SpringMVC数据交互

目录 前后端数据交互RequestMapping注解基于RequestMapping注解设置接口的请求方式RequestMapping注解的常用属性一个方法配置多个接口method属性params属性headers属性consumes属性produces属性 SpringMVC中的参数传递默认单个简单参数默认多个简单参数默认参数中有基本数据类…

山与路远程控制 一个基于electron和golang实现的远控软件

山与路远程控制 &#x1f3a5;项目演示地址 还在制作… ♻️项目基本介绍 山与路远程控制是基于electron(vue3)和golang实现的远程控制软件(项目界面主要模仿向日葵远程软件,如有侵权请告知),代码可能有点臃肿毕竟只花了一周左右写的无聊项目,如果对其感兴趣的大佬可以fork自…

【JavaScriptThreejs】判断路径在二维平面上投影的方向顺逆时针

原理分析 可以将路径每个连续的两点向量叉乘相加&#xff0c;根据正负性判断路径顺逆时针性 当我们计算两个向量的叉积时&#xff0c;结果是一个新的向量&#xff0c;其方向垂直于这两个向量所在的平面&#xff0c;并且其大小与这两个向量构成的平行四边形的面积成正比。这个新…

爱普生RX-8130CE内置电池控制 RTC

特点&#xff1a;(1)封装极小&#xff0c;集成度高RX-8130CE是一个带|2C接口的实时时钟模块&#xff0c;内部集成32.768KHz晶体振荡器。实时时钟功能不仅集成了年、月、日、星期、小时、分、秒的日历和时钟计数器&#xff0c;同时也有时间闹钟、间隔定时器、时间更新中断等功能…

算法练习|Leetcode49字母异位词分词 ,Leetcode128最长连续序列,Leetcode3无重复字符的最长子串,sql总结

目录 一、Leetcode49字母异位词分词题目描述解题思路方法:哈希总结 二、Leetcode128最长连续序列题目描述解题思路方法:总结 三、Leetcode3无重复字符的最长子串题目描述解题思路方法:双指针法总结sql总结 一、Leetcode49字母异位词分词 题目描述 给你一个字符串数组&#xf…

编译支持播放H265的cef控件

接着在上次编译的基础上增加h265支持编译支持视频播放的cef控件&#xff08;h264&#xff09; 测试页面&#xff0c;直接使用cef_enhancement,里边带着的那个html即可&#xff0c;h265视频去这个网站下载elecard,我修改的这个版本参考了里边的修改方式&#xff0c;不过我的这个…

大语言模型(LLM)漏洞爆发,AI模型无一幸免

本文概述了人工智能初创公司Anthropic于2024年04月03日发表的一篇针对人工智能安全的论文&#xff0c;该公司在本论文中宣布的一种新的“越狱”技术&#xff0c;名为Many-shot Jailbreaking&#xff08;多轮越狱&#xff09;。文章详细描述了目前大语言模型&#xff08;LLM&…

CMake 编译项目

一、概述 cmake 是C一个很重要的编译和项目管理工具&#xff0c;我们在git 上以及常见的项目现在多数都是用cmake 管理的&#xff0c;那么我们今天就做一个同时有Opencv和CGAL 以及PCL 的项目。 二、项目管理 重点是CMakeList.txt 1、CMakeList.txt cmake_minimum_requir…

Springboot3集成Web、RedisTemplate、Test和knife4j

本例将展示&#xff0c;如何在Springboot3中完成&#xff1a; Redis功能的Web接口实现构建Redis功能的单元测试knife4j自动化生成文档 Redis功能 Pom.xml <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter…

windows SDK编程 --- 消息(3)

前置知识 一、消息的分类 1. 鼠标消息 处理与鼠标交互相关的事件&#xff0c;比如移动、点击和滚动等。例如&#xff1a; WM_MOUSEMOVE: 当鼠标在窗口客户区内移动时发送。WM_LBUTTONDOWN: 当用户按下鼠标左键时发送。WM_LBUTTONUP: 当用户释放鼠标左键时发送。WM_RBUTTOND…

区块链交易所技术开发架构解析 交易所开发团队

区块链交易所是加密货币市场中的关键基础设施之一&#xff0c;它提供了一个平台&#xff0c;让用户可以买卖各种数字资产。而搭建一个功能完善、安全可靠的交易所需要一个复杂的技术开发架构&#xff0c;以及一个协调配合的交易所开发团队。下面我们将分析交易所的技术架构以及…

Elasticsearch:崭新的打分机制 - Learning To Rank (LTR)

警告&#xff1a;“学习排名 (Learning To Rank)” 功能处于技术预览版&#xff0c;可能会在未来版本中更改或删除。 Elastic 将努力解决任何问题&#xff0c;但此功能不受官方 GA 功能的支持 SLA 的约束。 注意&#xff1a;此功能是在版本 8.12.0 中引入的&#xff0c;并且仅适…

Ghost Buster Pro for Mac:强大的系统优化工具

Ghost Buster Pro for Mac是一款功能强大的系统优化工具&#xff0c;专为Mac用户设计&#xff0c;旨在提供全方位的系统清理、优化和维护服务。 Ghost Buster Pro for Mac v3.2.5激活版下载 这款软件拥有出色的垃圾清理能力&#xff0c;能够深度扫描并清除Mac上的无效目录、文件…

个人网站的SEO优化系列——如何实现搜索引擎的收录

如果你自己做了一个网站&#xff0c;并且想让更多的人知道你的网站&#xff0c;那么无非就是两种途径 一、自己进行宣传&#xff0c;或者花钱宣传 二、使用搜索引擎的自然流量 而如果搜索引擎都没有收录你的站点&#xff0c;别说是自然流量&#xff0c;就算是使用特定语句【sit…

文件上传服务器、文件展示等异步问题

问题&#xff1a; 文件上传模块&#xff1a;当文件已经上传完成&#xff0c;文件进度已经走完了&#xff0c;但是服务器响应还没有返回结果&#xff0c;出现了&#xff0c;获取不到上传后的文件路径&#xff0c;需要等待服务器返回结果后&#xff0c;才能获取文件路径并点击跳…

excel中怎么用乘法、加法来替代AND和OR函数

你可以使用乘法和加法来替代Excel中的AND和OR函数&#xff0c;虽然这样做可能会增加公式的复杂度&#xff0c;但在某些情况下是可行的。 1. 使用乘法替代AND函数&#xff1a;AND函数用于判断一系列条件是否同时成立&#xff0c;如果所有条件都为TRUE&#xff0c;则返回TRUE&…