【Rust日报】2023-11-21 如何将 Rust 的编译效率提高 75%

这是一篇来自 https://benw.is/posts/how-i-improved-my-rust-compile-times-by-seventy-five-percent 的总结和翻译,我去掉了一些不太重要的章节,保留了所有关键技术点。

Rust经常被提到的一个痛点是编译时间较慢。为了享受借用检查器、安全性和零成本抽象等好处,我们需要花费更多时间进行编译。为了测试不同的更改,我们需要建立一个基准。我电脑的配置如下:

  • AMD 5950x processor,

  • 72GB RAM

  • SATA SSD system drive.

  • 7200RPM spinning disk storage drives

  • NVME drives

  • NixOS linux distro

  • Rust 1.75 nightly

Optimization Level

这些建议来自 Bevy,它建议在开发过程中将优化级别设置得更高,以可能减少开发编译时间并提高性能。默认情况下,Rust 编译器为开发构建设置了优化级别为 0。我们将为我们的代码设置优化级别为 1,并为我们代码的所有依赖设置优化级别为 3。

[profile.dev]
opt-level = 1
[profile.dev.package."*"]
opt-level = 3

这样做有一个缺点是如果错误来自依赖库,那么错误消息会少得多。因此,如果遇到棘手的错误,你可能需要调整优化级别。

Mold

Rust 编译器的基本步骤大致如下,首先读取源代码,将其转换为多种类型的 IR(中间表示),并在转换过程中执行优化。然后将该 IR 传递给由 LLVM 提供的代码生成器,该代码生成器将 IR 转换为目标文件,然后链接器将这些目标文件和其他系统库链接在一起,形成一个可执行二进制文件。关于它的更多详细信息可以在这里 找到。这是一篇非常棒的阅读材料,但对于我们在这里的讨论来说可能有些太深了。

Mold 是由Rui Ueyama开发的新链接器,旨在通过尽可能并行化加载来提高链接器性能,基准测试显示其比 Rust 的默认链接器快得多。

对于 Linux 和 Mac,默认的链接器是 ld,由 cc 运行。Windows 则使用微软的 MVC link.exe。如果你在 Linux上运行,可以直接使用 mold。如果你在 Mac上,有一个名为 Sold 的付费版本可供使用。如果 Mold 为你带来了好处,我鼓励你购买 Sold(价格非常实惠)或在他的 Github 赞助页面上赞助 Rui。遗憾的是,目前不支持 Windows 用户。Sold 对 Windows 的支持正在开发中。

在 Linux 上,实际上非常容易使用,只需安装 Mold,然后在 cargo 命令前加上 mold -run 。例如, mold -run cargo build 。也可以在 .cargo/config.toml 中启用,就像这样:

[target.x86_64-unknown-linux-gnu]
linker = "clang"
rustflags = ["-C", "link-arg=-fuse-ld=/path/to/mold"]

/path/to/mold 是模具可执行文件的绝对路径。这也是启用 Sold 的方式,只需用 Sold 路径替换模具路径,并将目标更改为 Mac 的编译目标。

Cranelift

在上面的优化中,我们替换了 Rust 编译器使用的链接器。现在让我们尝试替换代码生成器,Cranelift 是一种替代代码生成器,在构建步骤中代替了 LLVM。虽然它不擅长进行像 LLVM 那样的许多优化,但它擅长快速生成代码。最近,它作为 Rust 1.73 夜间版的 x86_64 linux 目标代码生成进行了集成。其他平台需要单独设置 cranelift,请参阅它的 README。

rustup update nightly #install nightly if you haven't already
rustup component add rustc-codegen-cranelift-preview --toolchain nightly

要在 Cargo 中使用它,可以通过启用不稳定的 codegen-backend 功能,并为配置文件设置 codegen-backend= "cranelift" 值来启用它。可以在 .cargo/config.toml 中这样做:

[unstable]
codegen-backend = true
[profile.server-dev]
codegen-backend = "cranelift"

当然,你也可以只对某个目标启用:

[target.x86_64-unknown-linux-gnu]
rustflags = ["-Zcodegen-backend=cranelift"]

需要注意的是,Cranelift 仍在开发中,可能存在一些缺少内在功能的问题。因此,部分 crate 可能无法在正常地工作。如果您发现缺少什么功能,我鼓励您提交 Issue,可能会有可用的解决方法。

Conclusion

经过一系列的测试和评判(可以看原文),我们发现启用 Mold 和 Cranelift 为我带来了 75% 的增量编译时间缩短和 25% 的冷编译时间缩短,这是相当大的改进。使用 Cranelift 需要 Nightly 版本的 Rust,这可能会让一些项目感到不理想,而且 Mold 需要 Linux,而 Sold 需要 Mac(并且需要付费),对我来说,这进一步证明了Rust Web 开发应该在某种 Linux 或 Mac 上进行,而不是在 Windows 上。WSL2 可能有助于改善情况,但可能会更慢。由于我有一台 Mac 笔记本和一台 Linux 工作站,我将为我的 Mac 购买 Sold,并在可以的项目中使用Cranelift。


From 日报小组 Koalr

社区学习交流平台订阅:

  • Rustcc论坛: 支持rss

  • 微信公众号:Rust语言中文社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/161352.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pikachu靶场Table pikachu.member doesn’t exist:解决

背景: 第一次搭建pikachu靶场,搭建好后访问index.php后,尝试练习,发现界面显示Table pikachu.member doesn t exist,后来找了很多教程,没有解决,后来发现是自己没有进行初始化,给大家…

VMware 系列:ESXI6.7升级7.0

ESXI6.7升级7.0 一、下载补丁二、上传文件三 启用Shell四、登录Shell后台五、删除不兼容驱动六、正常升级最近,将一台使用ESXI6.7的虚拟机升级到了7.0版本,下面记录一下自己的升级过程。 升级条件 首先确保硬件是否能升级到7.0版本,物理网卡驱动为e1000e不能升级,如果是ig…

不到十个例题带你拿下c++双指针算法(leetcode)

移动零问题 https://leetcode.cn/problems/move-zeroes/submissions/ 1.题目解析 必须在原数组进行修改,不可以新建一个数组 非零元素相对顺序不变 2.算法原理 【数组划分】【数组分块】 这一类题会给我们一个数组,让我们划分区间,比如…

【机器学习】Nonlinear Independent Component Analysis - Aapo Hyvärinen

Linear independent component analysis (ICA) x i ( k ) ∑ j 1 n a i j s j ( k ) for all i 1 … n , k 1 … K ( ) x_i(k) \sum_{j1}^{n} a_{ij}s_j(k) \quad \text{for all } i 1 \ldots n, k 1 \ldots K \tag{} xi​(k)j1∑n​aij​sj​(k)for all i1…n,k1…K()…

VUE语法-$refs和ref属性的使用

1、$refs和ref属性的使用 1、$refs:一个包含 DOM 元素和组件实例的对象,通过模板引用注册。 2、ref实际上获取元素的DOM节点 3、如果需要在Vue中操作DOM我们可以通过ref和$refs这两个来实现 总结:$refs可以获取被ref属性修饰的元素的相关信息。 1.1、$refs和re…

PS_魔幻

首先打开一个背景图片 然后ctrl j复制一层背景 在调整中将图片改成黑白颜色 点击调整中的 色相/饱和度 调整明度 点击画笔工具,并且设置画笔模板 调节画笔大小,将笔记本电脑涂个概况 然后再新建色相/饱和度 勾选着色 调节背景颜色至喜欢 右键混合选项 …

04-React脚手架 集成Axios

初始化React脚手架 前期准备 1.脚手架: 用来帮助程序员快速创建一个基于xxx库的模板项目 1.包含了所有需要的配置(语法检查、jsx编译、devServer…)2.下载好了所有相关的依赖3.可以直接运行一个简单效果 2.react提供了一个用于创建react项目的脚手架库…

【华为OD机试python】分糖果【2023 B卷|100分】

【华为OD机试】-真题 !!点这里!! 【华为OD机试】真题考点分类 !!点这里 !! 题目描述 小明从糖果盒中随意抓一把糖果,每次小明会取出一半的糖果分给同学们。 当糖果不能平均分配时,小明可以选择从糖果盒中(假设盒中糖果足够) 取出一个糖果或放回一个糖果。 小明最少需要多…

【喵叔闲扯】---小谈静态类和单例模式

静态类(Static Class)和单例(Singleton)都是在编程中用于实现特定类型的设计模式或代码组织方式。它们在不同的情境下有不同的用途和特点。 静态类(Static Class) 静态类是一种类,它的方法和属性…

一键去水印免费网站快速无痕处理图片、视频水印

水印问题往往是一个大麻烦。即使我们只想将这些照片保留在我们的个人相册中以供怀旧,水印也可能像顽固的符号一样刺激我们的眼睛。为了解决这个问题,我们需要不断探索创新的解决方案,让我们深入研究一款强大的一键去水印免费网站“水印云”。…

Rust并发编程:理解线程与并发

大家好!我是lincyang。 今天我们来深入探讨Rust中的并发编程,特别是线程的使用和并发的基本概念。 Rust中的线程 Rust使用线程来实现并发。线程是操作系统可以同时运行的最小指令集。在Rust中,创建线程非常简单,但与此同时&…

ubuntu 系统 怎么判断系统有没有GPU

在 Ubuntu 系统中,您可以通过几种方式来检查系统是否包含显卡,以及显卡的详细信息。以下是一些常用的方法: lspci 命令: 打开终端。输入 lspci | grep VGA 命令。这将显示系统中所有的 VGA 兼容设备,通常是您的显卡。 …

二叉搜索树java实现

顾名思义,二叉搜索树是一棵二叉树,每个节点就是一个对象,这个对象包含属性left、right和parent。left指向节点的左孩子,right指向节点的右孩子,parent指向节点的父节点(双亲)。如果某个孩子节点…

scala的类介绍

scala的类、抽象类、接口、对象 class :类, 通过new关键字来实例化,每次实例化都会创建一个新的对象;用来定义普通的类。object:对象,用来定义一个单例对象的,它只有一个实例,且在程序运行期间…

黑马点评笔记 redis实现缓存

文章目录 什么是缓存?为什么要使用缓存 如何使用缓存功能实现缓存模型和思路代码实现 缓存更新策略数据库缓存不一致解决方案代码实现 什么是缓存? 缓存(Cache),就是数据交换的缓冲区,俗称的缓存就是缓冲区内的数据,一般从数据库中获取,存储于本地代码(例如: 例1:Static fi…

vr小鼠虚拟解剖实验教学平台减少了受感染风险

家畜解剖实验教学是培养畜牧兽医专业学生实际操作能力的专业教学活动中的核心手段。采取新型教学方式与手段,合理设置实验教学内容,有助于激发学生的操作积极性,促进实践教学的改革。 家畜解剖VR仿真教学是一种借助VR虚拟现实制作和web3d开发…

常用通信接口、协议:SCCB

一、概述 SCCB(串行摄像头控制总线)是由欧姆尼图像技术公司(OmniVision)开发的一种类IIC的总线,主要用于其OV系列的图像传感器上(但目前有很多家的图像传感器都有采用该控制总线)。相对于IIC总线来说SCCB与之最主要的差…

java基础-集合

1、集合 在java中,集合(Collection)指的是一组数据容器,它可以存储多个对象,并且允许用户通过一些方法来访问与操作这些对象。j 集合的实现原理都基于数据结构和算法,如下: 数据结构&#xff1…

振南技术干货集:制冷设备大型IoT监测项目研发纪实(2)

注解目录 1.制冷设备的监测迫在眉睫 1.1 冷食的利润贡献 1.2 冷设监测系统的困难 (制冷设备对于便利店为何如何重要?了解一下你所不知道的便利店和新零售行业。关于电力线载波通信的论战。) 2、电路设计 2.1 防护电路 2.1.1 强电防护 …

基于JavaWeb+SSM+Vue教学辅助微信小程序系统的设计和实现

基于JavaWebSSMVue教学辅助微信小程序系统的设计和实现 源码获取入口前言主要技术系统设计功能截图Lun文目录订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 源码获取入口 前言 1.1 概述 随着信息时代的快速发展,互联网的优势和普及,人们生活…