Rust源码分析——Rc 和 Weak 源码详解

Rc 和 Weak 源码详解

一个值需要被多个所有者拥有

  1. rust中所有权机制在图这种数据结构中,一个节点可能被多个其它节点所指向。那么如何表示图这种数据结构?
  2. 在多线程中,多个线程可能会持有同一个数据?如何解决这个问题。

Rc

rust 通过使用引用计数智能指针 Rc 和 Arc 来解决上面的问题。当我们对一个被 Rc 所标识的数据进行 clone() 的时候,并不会复制其内部数据,只是增加引用计数,而当一个 Rc 被 drop 的时候,只会减少其引用计数,直到引用计数为0,此时才会真正清除对应的内存。

但是使用引用计数方案有一个问题,那就是如何解决循环引用问题?如果不了解引用计数方式管理内存的,可以看这篇文章。rust 为了解决这个问题,提供了弱引用(Weak)。它不拥有数据的所有权,只产生弱引用计数。

我们来看一下 Rc 这个结构

#[cfg_attr(not(test), rustc_diagnostic_item = "Rc")]
#[stable(feature = "rust1", since = "1.0.0")]
#[rustc_insignificant_dtor]
pub struct Rc<T: ?Sized> {ptr: NonNull<RcBox<T>>,phantom: PhantomData<RcBox<T>>,
}#[stable(feature = "rust1", since = "1.0.0")]
impl<T: ?Sized> !Send for Rc<T> {}// Note that this negative impl isn't strictly necessary for correctness,
// as `Rc` transitively contains a `Cell`, which is itself `!Sync`.
// However, given how important `Rc`'s `!Sync`-ness is,
// having an explicit negative impl is nice for documentation purposes
// and results in nicer error messages.
#[stable(feature = "rust1", since = "1.0.0")]
impl<T: ?Sized> !Sync for Rc<T> {}

首先,Rc 是一个结构体,可以看到它不满足 Send 和 Sync 这两个 trait,这意味着 Rc 是不能跨线程的,它只适用于单线程下的引用计数。这是 rust 专门为单线程场景设计的高性能引用计数器;而多线程下需要 Arc (atomic reference counting)来实现多线程的引用计数。

另外一点就是 Rc 接受的泛型参数可以是大小未知(unsized)类型。Rc 结构体中有两个字段 ptr 和 phantom 。ptr 的类型是NonNull<RcBox<T>>

pub struct NonNull<T: ?Sized> {pointer: *const T,
}

也就是说 ptr 实际上是一个指向 RcBox<T> 的非空指针。OK,我们接着来看一下 RcBox 类型

struct RcBox<T: ?Sized> {strong: Cell<usize>,weak: Cell<usize>,value: T,
}

下面,让我来详细解释这个结构体的各个字段:

  1. strong: Cell<usize>:这个字段是一个 Cell 类型的包装,用于存储强引用计数(strong reference count)。Cell 是 rust标准库提供的一种允许在不可变情况下修改其内部值的类型。强引用计数用于跟踪有多少个 Rc 实例仍然拥有对数据的引用。每当创建一个新的 Rc 引用时,强引用计数会递增;当 Rc 引用离开作用域或被丢弃时,强引用计数递减。

  2. weak: Cell<usize>:这个字段是一个 Cell 类型的包装,用于存储弱引用计数(weak reference count)。弱引用计数用于跟踪有多少个 Weak 引用(Rc 的弱引用)仍然存在,但它不会阻止数据的销毁。与强引用不同,当只有弱引用剩余时,数据可以被销毁。每当创建一个新的 Weak 引用时,弱引用计数会递增;当Weak 引用离开作用域或被丢弃时,弱引用计数递减。

  3. value: T:这是 Rc 包装的实际值的字段。Rc 用于共享这个值,因此它包含在 RcBox 中。

既然强引用,弱引用以及值都包含在 RcBox 中了,那么 phantom: PhantomData<RcBox<T>> 的作用是什么?

PhantomData 是一个泛型类型,通常用于标记类型参数在运行时不实际占用内存。在这里,它用于确保 RcBox<T> 存在,尽管它在运行时不占用内存。这是为了帮助Rust编译器进行正确的类型检查和生命周期分析。

pub struct PhantomData<T: ?Sized>;

正如我们所见,PhantomData 是一个单元结构体,它的大小是零字节,不占用内存空间。

我们进一步来看一下 Rc 的构造方法,看看它到底是如何做到让一个值可以有多个所有者?按照之前的一个值只有一个所有者的模型,当所有者生命周期结束的时候,值就会被回收;而 Rc 是在强引用计数到 0 的时候,释放内存。

pub fn new(value: T) -> Rc<T> {// There is an implicit weak pointer owned by all the strong// pointers, which ensures that the weak destructor never frees// the allocation while the strong destructor is running, even// if the weak pointer is stored inside the strong one.unsafe {Self::from_inner(Box::leak(Box::new(RcBox { strong: Cell::new(1), weak: Cell::new(1), value })).into(),)}
}

首先,我们注意到 new 的实现代码是 unsafe 的,这是因为 Box::leak 方法将 Box 中的数据泄漏(leak)出来,而这个操作将绕过 Rust 的所有权和生命周期检查,这样 RcBox 结构体数据将被泄漏到堆上,使其在函数结束后继续存在,而不是按正常方式被释放,通过这种手段,让 RcBox 拥有了足够长的生命周期,以便在多个 Rc 实例之间正确地共享数据。

这段代码的注释中还告诉了我们:所有强引用指针(Rc 实例)之间都存在一个隐式的弱引用指针。这个隐式的弱引用用于确保在强引用的析构函数运行期间,弱引用不会释放数据,即使在强引用指针中存储了一个弱引用。后面当我们介绍 Weak 析构函数的时候,会看到它需要先读取 RcBox 中的数据。这样就防止弱引用析构执行的时候会访问到悬垂指针。

接着,我们来看一下析构函数的代码。

fn drop(&mut self) {unsafe {self.inner().dec_strong();      // 强引用计数减 1if self.inner().strong() == 0 {// destroy the contained objectptr::drop_in_place(Self::get_mut_unchecked(self));// remove the implicit "strong weak" pointer now that we've// destroyed the contents.self.inner().dec_weak();    // 弱引用计数减 1if self.inner().weak() == 0 {Global.deallocate(self.ptr.cast(), Layout::for_value(self.ptr.as_ref()));}}}
}
  1. 如果强引用计数为零,表示没有任何强引用指向数据了,这意味着数据可以安全地被销毁。
  2. 如果弱引用计数降至零,表示没有任何弱引用指向数据,将弱引用相关的资源清理掉。

既然 RcBox 中也存储了弱引用计数,那么 Rc 肯定提供了从一个 Rc 获取到 弱引用的方法。实际上就是 downgrade 方法

pub fn downgrade(this: &Self) -> Weak<T> {this.inner().inc_weak();// Make sure we do not create a dangling Weakdebug_assert!(!is_dangling(this.ptr.as_ptr()));Weak { ptr: this.ptr }
}

这个函数非常简单,让弱引用计数加1,然后保证不是悬垂指针之后,用这个指针作为参数构造了一个 Weak 返回。这样就实现了从 Rc 中获取 Weak。

Weak

我们顺便来看一下弱引用,Weak 用于创建弱引用,通常与 Rc 智能指针一起使用。

pub struct Weak<T: ?Sized> {// This is a `NonNull` to allow optimizing the size of this type in enums,// but it is not necessarily a valid pointer.// `Weak::new` sets this to `usize::MAX` so that it doesn’t need// to allocate space on the heap. That's not a value a real pointer// will ever have because RcBox has alignment at least 2.// This is only possible when `T: Sized`; unsized `T` never dangle.ptr: NonNull<RcBox<T>>,
}

Weak 也存储了一个指向 RcBox 的指针。看起来这是比 Rc 少了一个标记字段,实际上它们的构造函数完全不同。

pub const fn new() -> Weak<T> {Weak { ptr: unsafe { NonNull::new_unchecked(ptr::invalid_mut::<RcBox<T>>(usize::MAX)) } }
}

ptr::invalid_mut 函数来创建一个无效的指针,其值被设置为 usize::MAX。这个无效指针用于表示一个 Weak 弱引用指针,它不引用任何真实的数据,但是用于表示一个空的 Weak 实例,然后将其包装在 NonNull 中,并返回作为 Weak 实例的一部分。这个无效的 Weak 实例通常用于初始化,之后可以使用 upgrade 方法来尝试获取一个真实的强引用。

实际上,在 Weak 结构体的注释中已经解释了 new 方法为什么会是这样。设置为 usize::MAX 的目的是为了避免在创建 Weak 时需要分配堆内存。由于 Weak 通常用于检查数据的存在性而不需要实际引用数据。

我们再来看一下析构函数,

fn drop(&mut self) {let inner = if let Some(inner) = self.inner() { inner } else { return };inner.dec_weak();   // 弱引用计数减1// the weak count starts at 1, and will only go to zero if all// the strong pointers have disappeared.if inner.weak() == 0 {unsafe {Global.deallocate(self.ptr.cast(), Layout::for_value_raw(self.ptr.as_ptr()));}}
}

let inner = if let Some(inner) = self.inner() { inner } else { return };:这一行代码的目的是获取 Weak 引用内部的 RcBox 数据结构,以便后续操作。self.inner() 方法用于获取内部数据,如果存在则返回 Some(inner),否则返回 None。如果不存在内部数据,说明这个 Weak 已经被销毁,所以函数提前返回(return)。

如果弱引用计数降至零,说明没有任何弱引用指向数据,这意味着数据可以被释放。此时使用 Global.deallocate 来释放和 Weak 相关的内存。

前面说过可以通过 Rc 获取到一个弱引用,那么同样,当我们需要通过 Weak 来获取数据的时候,就会产生一个 Rc。这个时候就需要使用 Weak 提供的 upgrade 方法。

pub fn upgrade(&self) -> Option<Rc<T>> {let inner = self.inner()?;if inner.strong() == 0 {None} else {unsafe {inner.inc_strong();Some(Rc::from_inner(self.ptr))}}
}

首先,尝试获取 RcBox 中的数据,如果是 None,则直接返回,否则获取到 RcBox 中的数据,进行强引用计数判断,如果强引用计数为 0,那么意味着数据被释放,返回 None,否则将强引用计数加 1,然后返回一个 Rc 实例。

参考资料

Rust 官方文档: https://doc.rust-lang.org/std/rc/struct.Rc.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/81143.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GIS跟踪监管系统信息查询

GIS跟踪监管系统信息查询 GIS跟踪监管系统&#xff08;1&#xff09;物资查询与展示。① 几何查询。代码说明&#xff1a;② 物资定位。• 单个物资定位&#xff1a;• 多个物资定位&#xff1a;③ 物资统计。&#xff08;2&#xff09;物资信息更新① 新增物资。 GIS跟踪监管系…

【Tensorflow 2.12 电影推荐项目搭建】

Tensorflow 2.12 电影推荐项目搭建 学习笔记工具、环境创建项目项目配置安装相关python包召回模型实现排序模型实现实现电影推荐导入模块设置要推荐的用户召回推荐排序推荐推荐结果结尾学习笔记 Tensorflow 2.12 电影推荐项目搭建记录~ Tensorflow是谷歌开源的机器学习框架,可…

Kotlin File useLines nameWithoutExtension extension

Kotlin File useLines nameWithoutExtension extension import java.io.Filefun main(args: Array<String>) {val filePath "myfile.txt"val file File(filePath)println(file.name) //文件名字&#xff0c;不包括路径println(file.isFile) //是文件吗pri…

【深度学习】 Python 和 NumPy 系列教程(十五):Matplotlib详解:2、3d绘图类型(1):线框图(Wireframe Plot)

目录 一、前言 二、实验环境 三、Matplotlib详解 1、2d绘图类型 2、3d绘图类型 0. 设置中文字体 1. 线框图&#xff08;Wireframe Plot&#xff09; 一、前言 Python是一种高级编程语言&#xff0c;由Guido van Rossum于1991年创建。它以简洁、易读的语法而闻名&#xff0…

web安全漏洞-SQL注入实验2

实验目的 学习sql显注的漏洞判断原理掌握sqlmap工具的使用分析SQL注入漏洞的成因 实验工具 sqlmapsqlmap是用python写的开源的测试框架&#xff0c;支持MySQL&#xff0c;Oracle&#xff0c;PostgreSQL&#xff0c;Microsoft SQL Server&#xff0c;Microsoft Access&#x…

通过这些API,开发者可以在自己的应用程序中嵌入电商功能,为用户提供便捷的购物体验

在当今的数字化时代&#xff0c;电子商务已经成为人们日常生活的重要组成部分。随着电子商务的飞速发展&#xff0c;许多电商平台都提供了API&#xff08;应用程序接口&#xff09;来允许开发者调用特定的功能&#xff0c;如商品查询、购物车管理、订单处理以及支付等。通过这些…

element-tree树结构-默认选中第一个节点高亮-根据id选中节点高亮

前言 tree树结构是在开发中经常使用的组件&#xff0c;比如区域树&#xff0c;楼层树&#xff0c;组织架构树&#xff0c;等等包含节点关系 实际开发可能需要我们一进到页面选中树形结构第一个节点&#xff0c;并且调用数据&#xff0c;来达到用户体验 在用户选择之后&#x…

【Axure原型素材】扫一扫

今天和粉丝们免费分享扫一扫的原型素材&#xff0c;"扫一扫"是一项常见的移动应用功能&#xff0c;通常通过手机或平板电脑上的摄像头来扫描二维码或条形码以实现各种功能。下面是和大家分享扫一扫的常用素材~~~ 【原型效果】 【Axure原型素材】扫一扫 【原型预览】…

性能测试-性能测试类型(2)

基准测试 基准测试(Benchmark Testing)又称单用户测试,主要用于监测被测系统在较低压力下的运行状况并记录相关数据。当性能测试环境确定以后,通常选取业务模型中的重要业务做基准测试,对被测系统施加一定压力,从而获取被测系统在单用户运行情况下的各项性能指标,为多用户…

CPP-Templates-2nd--第二十章 基 于 类 型 属 性 的 重 载(Overloading on Type Properties)

目录 20.1 算法特化 20.2 标记派发&#xff08;Tag Dispatching&#xff09; 20.3 Enable/Disable 函数模板 20.3.1 提供多种特化版本 20.3.2 EnableIf 所之何处&#xff08;where does the EnableIf Go&#xff09;? 20.3.3 编译期 if 20.3.4 Concepts C20 20.4 类的…

档案管理系统设计与实现

摘 要 近年来&#xff0c;随着企业彼此间的竞争日趋激烈&#xff0c;信息技术在企业的发展中占据着越来越重要的地位。在企业的运输生产中&#xff0c;档案已成为企业运输经营中不可或缺的一部分&#xff0c;为管理者进行管理决策和进行各种经营活动提供了重要的依据&#xf…

程序地址空间

✅<1>主页&#xff1a;&#xff1a;我的代码爱吃辣 &#x1f4c3;<2>知识讲解&#xff1a;Linux——程序地址空间 ☂️<3>开发环境&#xff1a;Centos7 &#x1f4ac;<4>前言&#xff1a;我们一直随口就能说出来的栈区&#xff0c;堆区&#xff0c;常量…

2023-简单点-树莓派安装ncnn框架

not python 按照下面的步骤进行就可以了&#xff1a; 参考 tips: 其中有一步要用下面方法: 如果你的git clone不得行&#xff0c;可以按照以下操作方法&#xff1a; git clone --depth1 https://ghproxy.com/ https://github.com/Tencent/ncnn.git python 直接 pip install …

如何构建 Protocol Buffers(protobuf)并解决常见问题

简介 Protocol Buffers&#xff0c;通常称为protobuf&#xff0c;是一种用于序列化结构化数据的开源工具。它广泛用于数据交换&#xff0c;通常用于RPC&#xff08;远程过程调用&#xff09;和持久化数据存储。在本文中&#xff0c;我们将介绍如何构建protobuf&#xff0c;并解…

基于Java的大学生选修选课系统设计与实现(亮点:多角色、贴近现实的选课流程、好看的系统外观)

大学生选修选课系统 一、前言二、我的优势2.1 自己的网站2.2 自己的小程序&#xff08;小蔡coding&#xff09;2.3 有保障的售后2.4 福利 三、开发环境与技术3.1 MySQL数据库3.2 Vue前端技术3.3 Spring Boot框架3.4 微信小程序 四、功能设计4.1 主要功能描述 五、系统实现5.1 管…

【基础篇】ClickHouse 表引擎详解

文章目录 0. 引言1. 什么是表引擎2. 不同表引擎使用场景1. MergeTree:2. Log:3. Memory:4. Distributed:5. Kafka:6. MaterializedView:7. File和URL: 3. MergeTree 家族3.1. MergeTree:3.2. ReplacingMergeTree:3.3. SummingMergeTree:3.4. AggregatingMergeTree:3.5. Collaps…

理解HTTPS/TLS/SSL(二)可视化TLS握手过程并解密加密数据

文章目录 WireShark抓包TLS握手过程Client HelloServer HelloEncryped Extenstions, Certificate, Certificate VerifyChange Ciper Spec, FinshedTLS 1.2和TLS 1.3的区别能不能在进一步&#xff1f; 解密WireShark中抓到的TLS包参考资料 上一篇文章已经在本地使用了生成自签名…

[npm] npx 介绍与使用说明

[npm] npx 介绍与使用说明 npm 的由来npx 是什么&#xff1f;npx 特点npx 的特点项目安装包的使用全局安装包的避免指定工具包版本--no-install 参数和--ignore-existing 参数使用不同版本的 node-p 参数-c 参数实战应用 执行 GitHub 源码 npm 的由来 说到 npm 就离不开社区文…

【Linux操作系统】信号的产生捕获

&#x1f525;&#x1f525; 欢迎来到小林的博客&#xff01;&#xff01;       &#x1f6f0;️博客主页&#xff1a;✈️林 子       &#x1f6f0;️博客专栏&#xff1a;✈️ Linux       &#x1f6f0;️社区 :✈️ 进步学堂       &#x1f6f0…

css经典面试题(二)

文章目录 1、清除浮动2、opacity: 0、visibility: hidden、display: none 的区别3、css画一个三角形4、常见的主流浏览器前缀5、重绘与重排的区别&#xff1f;6、如何优化图片7、CSS3 中 transition 和 animation 的属性分别有哪些8、居中为什么要使用 transform&#xff08;为…