EVM-MLIR:以MLIR编写的EVM

1. 引言

EVM_MLIR:

  • 以MLIR编写的EVM。

开源代码实现见:

  • https://github.com/lambdaclass/evm_mlir(Rust)
    • 为使用MLIR和LLVM,将EVM-bytecode,转换为,machine-bytecode。
    • LambdaClass团队在2周内,用5个新员工,借助编译器将VM opcode逻辑编译为原生机器码,实现了约75%的以太坊虚拟机功能,即实现了149个opcodes中的111个。
    • 相比于revm,运行factorial和fibnacci程序,其性能提升了300%到600%。

有很多其它虚拟机会将bytecode编译为原生指令,但奇怪的是,以太坊虚拟机(EVM)的实现并没有做这种编译。LambdaClass在做Cairo Native时(见https://github.com/lambdaclass/cairo_native(Rust + Cairo)),学到了很多MLIR/LLVM的知识(详情见:LambdaClass 2023年5月3日博客 Exciting times at the intersection of Compilers and Applied Cryptography: Cairo and MLIR),为此,开启了EVM-MLIR项目,来实现比revm更快的替代方案。

2. 将MLIR用于EVM

EVM:

  • 为基于栈的虚拟机
  • 所编译的bytecode表示了一组指令,每个指令包含1-byte opcodes 及其参数。
  • Push操作可包含多达32字节的额外数据(即推送到栈上的数据量)

EVM的内存架构包含5大组件:

  • Stack:存储最多1024个256-bit宽整数。每个操作会从Stack上pop操作数,并(或)将结果推送到Stack上。若某程序run out of stack,则该程序终结。
  • Memory:为字节数组。支持按字节随机寻址。用于按顺序存储和访问可变数据。
  • Calldata:为与Memory类似的只读字节数组,作为每笔交易的输入发送。某些操作数支持从calldata拷贝到stack或memory。
  • Storage:为具有256-bit keys和values的字典。对其的修改是持久的,除非交易被revert。
  • Transient Storage:与Storage类似,但其修改会在交易结束时丢弃。

由此可知,EVM的执行模型非常简单。
指令序列上的naive interpreter loop很容易实现,但很难优化。有很多方法可实现bytecode interpreters ,但通过直接将每个操作码翻译成机器指令来消除interpreter开销是非常有效的。唯一的困难是:

  • 需要一个编译器后端以及链接和调用所生成代码的方法。

LambdaClass团队决定利用其在MLIR方面的经验,编写一个库:

  • 将每个操作转换为a sequence of MLIR blocks,每个MLIR block包含了实现每个opcode行为的MLIR操作,
  • 并通过将每个操作码连接到下一个操作码来将其串起来
  • 最后,这个表示可以转换为LLVM IR,并通过LLVM的optimizer传递。

为此:

  • 不仅将每个opcode逻辑转换为了MLIR操作,

还需要转换内存架构:

  • Stack:在开始构建MLIR blocks sequence之前,预分配最大stack size(1024个元素)。当前指针和base指针,均用于维护该stack,并检查overflow或underflow。
  • Memory:在Rust中处理内存分配,扩展为所需的FFI callbacks。
  • Calldata:存储在Rust端,将其作为EVM的输入。
  • Storage/Transient storage:通过syscalls来处理,具有与revm类似的api。

3. EVM-MLIR benchmarks

具体的benchmark代码见:

  • https://github.com/lambdaclass/evm_mlir/tree/main/bench/revm_comparison/src

未来将添加更多复杂的程序。

3.1 以Factorial为例的benchmark

以Factorial为例:

  • 计算第N个阶乘,其中N作为calldata传入。

选择N=1000为例,将该程序循环执行10万次,有:
在这里插入图片描述

3.2 以Fibonacci为例的benchmark

以Fibonacci为例:

  • 计算第N个Fibonacci值,其中N作为calldata传入。

选择N=1000为例,将该程序循环执行10万次,有:
在这里插入图片描述

4. 未来规划

LambdaClass团队会保留一个骨干团队来完成剩余的功能并继续优化,并专注于其新执行客户端——以ETHereum Rust Execution命名为ethrex——见https://github.com/lambdaclass/ethereum_rust。
该新执行客户端的目标是:

  • 在未来两个月内为以太坊生态系统提供一个具有简单、直接代码的替代Rust执行客户端。
  • MLIR EVM准备好后,打算将其整合到ethrex中,作为 dog-fooding effort的一部分。

参考资料

[1] LambdaClass团队2024年6月14日博客 EVM performance boosts with MLIR

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/39522.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Entity Framework EF Migration 迁移

针对Code First来说关注的只有实体类。当需求变更时只需要添加新的实体类或者在实体类中添加、删除、修改属性即可。但是修改完成之后要如何将修改同步到数据库中? migration 机制就出现了 ●启用Migrations   ●通过Add-Migration添加Migration   ●Update-D…

k8s kubectl top pod报错error Metrics API not available

文章目录 1、场景2、解决方法1、确认Metrics Server是否已经在集群中安装2、安装metric-server组件2.1、组件地址2.2、组件与K8S集群版本对应关系2.3、apply资源清单文件2.4、验证Metrics Server正常工作 1、场景 在使用kubectl top pod 命令时遇到了error: Metrics API not a…

大语言模型融合知识图谱的问答系统研究

文章目录 题目摘要方法实验消融实验 题目 大语言模型融合知识图谱的问答系统研究 论文地址:http://fcst.ceaj.org/CN/10.3778/j.issn.1673-9418.2308070 项目地址:https://github.com/zhangheyi-1/llmkgqas-tcm/ 摘要 问答系统(Question Ans…

【持续更新】vs 编译过程中的问题及其解决方案

独立寒秋,湘江北去,橘子洲头。 目录 问题 1 : 无法查看或者打开 PDB 文件。 问题 2 : 命令提示符中查看运行结果,控制台闪退。 问题 3 : 某功能的判断条件:int val > 1e9,逻辑…

领导高水平,在管人上都会做这3点,让下属忠心耿耿

领导高水平,在管人上都会做这3点,让下属忠心耿耿 第一点:给到有面子 作为一个领导,一定要在另一方面给自己的下属做最大努力的争取,只有把利益给到位,让你的下属有面子,才能够真正的赢得下属的心…

命令行运行git reflog(reference log)报错的解决办法

文章目录 1. 检查 Git 是否已安装2. 检查 PATH 环境变量3. 重新安装 Git 在Git中, reflog的英文全称是 “ reference log”。意思是 引用日志(参考日志)。它记录了本地仓库中HEAD和分支引用所指向的提交的变更历史。这包括了你所有的提交&…

澳大利亚新闻.科技.汽车.旅行.商业类单发媒体

每日简报Daily Bulletin 澳大利亚西部时间ModernAustralian.com 澳大利亚垂直新闻.科技.汽车.旅行.商业类媒体,ModernAustralian.com是澳大利亚西部地区的一家权威媒体平台,提供全面的新闻报道、科技资讯、汽车信息、旅行指南、商业动态等内容。每日简报…

liunx文件系统,日志分析

文章目录 1.inode与block1.1 inode与block概述1.2 inode的内容1.3 文件存储1.4 inode的大小1.5 inode的特殊作用 2.硬链接与软链接2.1链接文件分类 3.恢复误删除的文件3.1 案例:恢复EXT类型的文件3.2 案例:恢复XFS类型的文件3.2.1 xfsdump使用限制 4.分析日志文件4.1日志文件4.…

element-ui Tree之懒加载叶子节点强制设置父级半选效果

效果: 前言: 我们是先只展示一级的,二级的数据是通过点击之后通过服务器获取数据,并不是全量数据直接一起返回回来的。 问题: 当你设置了默认选中的子节点,但是由于刚进入页面此时tree中数据暂是没有这个…

A*——AcWing 179. 八数码

A* 定义 A* 算法是一种在图形或地图中寻找最短路径的启发式搜索算法。它通过综合考虑起始节点到当前节点的实际代价和当前节点到目标节点的预估代价,来决定下一步的搜索方向。 运用情况 路径规划:如在地图导航中为车辆、行人规划最优路线。游戏开发&…

学会python——用python制作一个登录和注册窗口(python实例十八)

目录 1.认识Python 2.环境与工具 2.1 python环境 2.2 Visual Studio Code编译 3.登录和注册窗口 3.1 代码构思 3.2 代码实例 3.3 运行结果 4.总结 1.认识Python Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。 Python 的设计具有很强的可读…

免杀笔记 ---> PE

本来是想先把Shellcode Loader给更新了的,但是涉及到一些PE相关的知识,所以就先把PE给更了,后面再把Shellcode Loader 给补上。 声明:本文章内容来自于B站小甲鱼 1.PE的结构 首先我们要讲一个PE文件,就得知道它的结构…

SPI四种模式--极性与相位

SPI的四种模式:相位和极性 极性 定义时钟空闲状态: CPOL0:时钟线在空闲状态为低电平 CPOL1:时钟线在空闲状态为高电平 这个设置决定了设备不进行通信时时钟线的状态。 兼容性: 不同的SPI设备可能需要不同的时钟极性…

【Linux开发实战指南】基于TCP、进程数据结构与SQL数据库:构建在线云词典系统(含注册、登录、查询、历史记录管理功能及源码分享)

目录 项目演示: 1. 主界面 技术讲解: TCP连接 进程的并发 链表 SQLite3 IO对文件的读写 功能实现 实现逻辑 我遇到的问题: 服务器端代码思路解析 必要条件 步骤详解 客户端代码思路解析 步骤详解 服务器源码如下:…

windows电脑如何运行python的定时任务

这里需要使用:windows系统设置-控制面板里的计划任务 1.打开计划任务之后,选择:创建基本任务 2.填写名称,这里根据自己具体的项目需求填写,然后点击下一步。 3.选择每日,再点击下一步 4.设置时间&…

科普文:linux I/O原理、监控、和调优思路

Linux 文件系统 磁盘和文件系统的关系: 磁盘为系统提供了最基本的持久化存储。 文件系统则在磁盘的基础上,提供了一个用来管理文件的树状结构。 文件系统工作原理 索引节点和目录项 文件系统,本身是对存储设备上的文件,进行…

多维度多场景文档门户,鸿翼ECM文档云打造文档管理新范式

​在现代企业运营中,内容协作的效率直接影响到组织的整体表现和竞争力。传统的文档管理系统都是通过目录结构的方式进行文件管理,在实际业务中无法满足用户多视角、多维度、多场景的文档业务需求。因此,搭建结合文档体系的业务门户是许多企业…

策略模式入门:基本概念与应用

目录 策略模式策略模式结构策略模式应用场景策略模式优缺点练手题目题目描述输入描述输出描述题解 策略模式 策略模式,又称政策模式,是一种行为型设计模式,它能让你定义一系列算法,并将每种算法分别放入独立的类中,以…

数字研发·驱动变革 | 2024达索系统装备行业数字化研发专题研讨会成功举办

2024年6月28日,由百世慧举办的“数字研发驱动变革|2024达索系统装备行业数字化研发专题研讨会”在达索系统(重庆)智能制造创新中心成功举办。 随着全球制造业向着智能化、数字化转型,我国工业装备行业也面临着转型升级的压力和机遇…

Gym cuda error: invalid resource handle

gym模拟的时候, 出现问题: sim和gym的定义如下: from isaacgym import gymapi,gymtorch import math,random# 1. Simulation Setup gym gymapi.acquire_gym()# get default set of parameters sim_params gymapi.SimParams() sim_params.u…