EVM-MLIR:以MLIR编写的EVM

1. 引言

EVM_MLIR:

  • 以MLIR编写的EVM。

开源代码实现见:

  • https://github.com/lambdaclass/evm_mlir(Rust)
    • 为使用MLIR和LLVM,将EVM-bytecode,转换为,machine-bytecode。
    • LambdaClass团队在2周内,用5个新员工,借助编译器将VM opcode逻辑编译为原生机器码,实现了约75%的以太坊虚拟机功能,即实现了149个opcodes中的111个。
    • 相比于revm,运行factorial和fibnacci程序,其性能提升了300%到600%。

有很多其它虚拟机会将bytecode编译为原生指令,但奇怪的是,以太坊虚拟机(EVM)的实现并没有做这种编译。LambdaClass在做Cairo Native时(见https://github.com/lambdaclass/cairo_native(Rust + Cairo)),学到了很多MLIR/LLVM的知识(详情见:LambdaClass 2023年5月3日博客 Exciting times at the intersection of Compilers and Applied Cryptography: Cairo and MLIR),为此,开启了EVM-MLIR项目,来实现比revm更快的替代方案。

2. 将MLIR用于EVM

EVM:

  • 为基于栈的虚拟机
  • 所编译的bytecode表示了一组指令,每个指令包含1-byte opcodes 及其参数。
  • Push操作可包含多达32字节的额外数据(即推送到栈上的数据量)

EVM的内存架构包含5大组件:

  • Stack:存储最多1024个256-bit宽整数。每个操作会从Stack上pop操作数,并(或)将结果推送到Stack上。若某程序run out of stack,则该程序终结。
  • Memory:为字节数组。支持按字节随机寻址。用于按顺序存储和访问可变数据。
  • Calldata:为与Memory类似的只读字节数组,作为每笔交易的输入发送。某些操作数支持从calldata拷贝到stack或memory。
  • Storage:为具有256-bit keys和values的字典。对其的修改是持久的,除非交易被revert。
  • Transient Storage:与Storage类似,但其修改会在交易结束时丢弃。

由此可知,EVM的执行模型非常简单。
指令序列上的naive interpreter loop很容易实现,但很难优化。有很多方法可实现bytecode interpreters ,但通过直接将每个操作码翻译成机器指令来消除interpreter开销是非常有效的。唯一的困难是:

  • 需要一个编译器后端以及链接和调用所生成代码的方法。

LambdaClass团队决定利用其在MLIR方面的经验,编写一个库:

  • 将每个操作转换为a sequence of MLIR blocks,每个MLIR block包含了实现每个opcode行为的MLIR操作,
  • 并通过将每个操作码连接到下一个操作码来将其串起来
  • 最后,这个表示可以转换为LLVM IR,并通过LLVM的optimizer传递。

为此:

  • 不仅将每个opcode逻辑转换为了MLIR操作,

还需要转换内存架构:

  • Stack:在开始构建MLIR blocks sequence之前,预分配最大stack size(1024个元素)。当前指针和base指针,均用于维护该stack,并检查overflow或underflow。
  • Memory:在Rust中处理内存分配,扩展为所需的FFI callbacks。
  • Calldata:存储在Rust端,将其作为EVM的输入。
  • Storage/Transient storage:通过syscalls来处理,具有与revm类似的api。

3. EVM-MLIR benchmarks

具体的benchmark代码见:

  • https://github.com/lambdaclass/evm_mlir/tree/main/bench/revm_comparison/src

未来将添加更多复杂的程序。

3.1 以Factorial为例的benchmark

以Factorial为例:

  • 计算第N个阶乘,其中N作为calldata传入。

选择N=1000为例,将该程序循环执行10万次,有:
在这里插入图片描述

3.2 以Fibonacci为例的benchmark

以Fibonacci为例:

  • 计算第N个Fibonacci值,其中N作为calldata传入。

选择N=1000为例,将该程序循环执行10万次,有:
在这里插入图片描述

4. 未来规划

LambdaClass团队会保留一个骨干团队来完成剩余的功能并继续优化,并专注于其新执行客户端——以ETHereum Rust Execution命名为ethrex——见https://github.com/lambdaclass/ethereum_rust。
该新执行客户端的目标是:

  • 在未来两个月内为以太坊生态系统提供一个具有简单、直接代码的替代Rust执行客户端。
  • MLIR EVM准备好后,打算将其整合到ethrex中,作为 dog-fooding effort的一部分。

参考资料

[1] LambdaClass团队2024年6月14日博客 EVM performance boosts with MLIR

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/39522.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在Qt Creator中添加预处理宏定义方法指南

在Eclipse中,可以通过Paths and Symbols中的Symbols选项为项目指定预处理宏(#ifdef 宏定义)。这有助于对跨平台代码进行有效索引。那么在Qt Creator中是否有类似的选项呢? 使用qmake的项目 如果您使用的是基于qmake的项目,可以通过以下几种方法添加宏定义: 在.pro文件中…

第5章:软件工程

第5章:软件工程 软件工程概述 软件生命周期 软件过程 1.能力成熟度模型(CMM) CMM(能力成熟度模型)是一个评估和确定组织软件过程成熟度的模型。它最早于1987年由美国国防部软件工程研究所(SEI)提出,其目的…

节流和防抖是肩并肩关系

防抖节流确实容易混淆,因为我们平常也总是把这两个连在一起说。但其实防抖就是防抖,节流就是节流,它们都属于优化技术的一种,一定不能把节流当作防抖的作用了。此文将带你彻底分清并理解防抖与节流。 共同点: 都是用…

Entity Framework EF Migration 迁移

针对Code First来说关注的只有实体类。当需求变更时只需要添加新的实体类或者在实体类中添加、删除、修改属性即可。但是修改完成之后要如何将修改同步到数据库中? migration 机制就出现了 ●启用Migrations   ●通过Add-Migration添加Migration   ●Update-D…

Java 中Json中既有对象又有数组的参数 如何转化成对象

1.示例一:解析一个既包含对象又包含数组的JSON字符串,并将其转换为Java对象 在Java中处理JSON数据,尤其是当JSON结构中既包含对象又包含数组时,常用的库有org.json、Gson和Jackson。这里我将以Gson为例来展示如何解析一个既包含对…

k8s kubectl top pod报错error Metrics API not available

文章目录 1、场景2、解决方法1、确认Metrics Server是否已经在集群中安装2、安装metric-server组件2.1、组件地址2.2、组件与K8S集群版本对应关系2.3、apply资源清单文件2.4、验证Metrics Server正常工作 1、场景 在使用kubectl top pod 命令时遇到了error: Metrics API not a…

AHK的对象和类学习心得

;---------------------------------- ; AHK的对象和类学习心得 By FeiYue ;---------------------------------- 一、简单对象的使用(细节看帮助) AHK-V1: 简单数组 arr:[111, 222] 关联数组 arr:{x:111, y:222, id:“abc”} 这两种可以用…

大语言模型融合知识图谱的问答系统研究

文章目录 题目摘要方法实验消融实验 题目 大语言模型融合知识图谱的问答系统研究 论文地址:http://fcst.ceaj.org/CN/10.3778/j.issn.1673-9418.2308070 项目地址:https://github.com/zhangheyi-1/llmkgqas-tcm/ 摘要 问答系统(Question Ans…

C-I-O和多线程

C条件变量 C中的条件变量(Condition Variable)是一种同步原语,用于在多线程程序中阻塞一个或多个线程,直到收到另一个线程的通知。条件变量通常与互斥锁(Mutex)一起使用,以确保在访问共享数据时…

【持续更新】vs 编译过程中的问题及其解决方案

独立寒秋,湘江北去,橘子洲头。 目录 问题 1 : 无法查看或者打开 PDB 文件。 问题 2 : 命令提示符中查看运行结果,控制台闪退。 问题 3 : 某功能的判断条件:int val > 1e9,逻辑…

领导高水平,在管人上都会做这3点,让下属忠心耿耿

领导高水平,在管人上都会做这3点,让下属忠心耿耿 第一点:给到有面子 作为一个领导,一定要在另一方面给自己的下属做最大努力的争取,只有把利益给到位,让你的下属有面子,才能够真正的赢得下属的心…

命令行运行git reflog(reference log)报错的解决办法

文章目录 1. 检查 Git 是否已安装2. 检查 PATH 环境变量3. 重新安装 Git 在Git中, reflog的英文全称是 “ reference log”。意思是 引用日志(参考日志)。它记录了本地仓库中HEAD和分支引用所指向的提交的变更历史。这包括了你所有的提交&…

澳大利亚新闻.科技.汽车.旅行.商业类单发媒体

每日简报Daily Bulletin 澳大利亚西部时间ModernAustralian.com 澳大利亚垂直新闻.科技.汽车.旅行.商业类媒体,ModernAustralian.com是澳大利亚西部地区的一家权威媒体平台,提供全面的新闻报道、科技资讯、汽车信息、旅行指南、商业动态等内容。每日简报…

liunx文件系统,日志分析

文章目录 1.inode与block1.1 inode与block概述1.2 inode的内容1.3 文件存储1.4 inode的大小1.5 inode的特殊作用 2.硬链接与软链接2.1链接文件分类 3.恢复误删除的文件3.1 案例:恢复EXT类型的文件3.2 案例:恢复XFS类型的文件3.2.1 xfsdump使用限制 4.分析日志文件4.1日志文件4.…

element-ui Tree之懒加载叶子节点强制设置父级半选效果

效果: 前言: 我们是先只展示一级的,二级的数据是通过点击之后通过服务器获取数据,并不是全量数据直接一起返回回来的。 问题: 当你设置了默认选中的子节点,但是由于刚进入页面此时tree中数据暂是没有这个…

A*——AcWing 179. 八数码

A* 定义 A* 算法是一种在图形或地图中寻找最短路径的启发式搜索算法。它通过综合考虑起始节点到当前节点的实际代价和当前节点到目标节点的预估代价,来决定下一步的搜索方向。 运用情况 路径规划:如在地图导航中为车辆、行人规划最优路线。游戏开发&…

算法刷题笔记 单调栈(C++实现)

文章目录 题目描述基本思路实现代码 题目描述 给定一个长度为N的整数数列,输出每个数左边第一个比它小的数,如果不存在则输出−1。 输入格式 第一行包含整数N,表示数列长度。第二行包含N个整数,表示整数数列。 输出格式 共一…

学会python——用python制作一个登录和注册窗口(python实例十八)

目录 1.认识Python 2.环境与工具 2.1 python环境 2.2 Visual Studio Code编译 3.登录和注册窗口 3.1 代码构思 3.2 代码实例 3.3 运行结果 4.总结 1.认识Python Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。 Python 的设计具有很强的可读…

Spring Boot项目中使用MockMvc进行测试的详细指南

目录 MockMvc简介安装和配置基本用法高级用法集成测试测试最佳实践总结 MockMvc简介 MockMvc是Spring框架提供的一种用于测试Spring MVC控制器的工具。它允许开发者在不启动完整的Web服务器的情况下,模拟HTTP请求并验证响应。MockMvc的主要优点包括: …

免杀笔记 ---> PE

本来是想先把Shellcode Loader给更新了的,但是涉及到一些PE相关的知识,所以就先把PE给更了,后面再把Shellcode Loader 给补上。 声明:本文章内容来自于B站小甲鱼 1.PE的结构 首先我们要讲一个PE文件,就得知道它的结构…