GEM5 McPAT NoC教程: xml设置汇总-2023版

简介

McPAT的xml有一些参数需要设置,noc的部分很多Gem5ToMcpatparser没有设置,也没有给出如何设置的条件。尤其是和活动相关的total access,不知道具体怎么设置,也不知道如何从gem5 stats.txt中导出。本文提供了2023年的收集到getech的教程和设置汇总。最重要的一句话是,system.Noc0:total_accesses = (all cores’) l2_demandaccess*2。

需要调整的部分

一共大概30行左右,是system.noc这个组件。其中total access
在这里插入图片描述

乔治亚理工 total access = 4 times of number of memory accesses,

在乔治亚理工的网站:https://faculty.cc.gatech.edu/~hyesoon/fall11/prog5.html,有一个mcpat手动设置的作业,需要手动改写mcpat的xml,其中给的system.Noc0:total_accesses 原文如下:
Number of memory accesses (McPAT: system.Noc0:total_accesses = 4 times of number of memory accesses, system.mem.Memory accesses, system.mem.memory_reads, system.mem.memory_writes, (system.mc.memory_accesses, = 4 times of number of memory accesses system.mc.memory_reads = system.mc.memory_writes = 2 times of number of memory accesses))
在这里插入图片描述

剑桥大学的 perl 脚本

用于获取 m5 的输出并为 mcpat 创建输入文件的 Perl 脚本:m5-mcpat.pl。用法:perl m5-mcpat.pl [m5out/stats.txt] [m5out/config.ini] [mcpat-template.xml] >输出.xml
这个版本应该是相对最权威的,可惜是perl的格式而且是2011年的版本。
用的参数是l2 demand×2 。
在这里插入图片描述
在2023年的版本中,我有四个l2 demand_access,虽然名字和l2.demand_accesses有所差异。我的结果里有四个,推测是因为这个文件里我有四个核。
system.ruby.l1_cntrl0.L2cache.m_demand_accesses 21462729
system.ruby.l1_cntrl1.L2cache.m_demand_accesses 17043475
system.ruby.l1_cntrl2.L2cache.m_demand_accesses 20771998
system.ruby.l1_cntrl3.L2cache.m_demand_accesses 22050985
在这里插入图片描述
剑桥给的noc access是在l2 demand的基础上×2,推测是一个l2 demand,是需要noc发一个request和noc发一个response,也就是一次访问内存需要使用noc两次。

2023 可用的parser,最好是python

我们已经知道了,但最好有个(别人已经用过,可用的)自动化工具来做这个事情。乔治亚理工的版本是手动输入,剑桥的版本是perl代码而且是2011年的。我们需要一步步看过去2023年有那些可用于noc的mcpat parser 代码。

在2023年12月15看来,没有可用的gem5 noc mcpat库,还是手动计算n个core 的l2 demand 再x2

其他的itlb access很多人做了,noc很多人没做应该是没用garnet的缘故。好在是也不难,只用读l2 demand 然后sum x2就好。但是在2023年12月15日为止,没有找到自动化的python。

2020 EU COSSIM cMcPAT 提出更准的cMcPAT 和 total_accesses = l2.demand_accesses::total * 2

https://github.com/H2020-COSSIM/cMcPAT/tree/master 。 比较新,维护比较好,资料多,
COSSIM是一个很大的项目,其中cMcPAT 被修改来处理这些情况(针对gem5优化)。最重要的是,它添加了两个处理器描述模板,可以在尝试从 gem5 建模 ARM 和 x86 simpleCPU 模型时使用。
但对于noc来说,转换脚本是dskhudia bitbucket的库改进版,但是stats.testsys.l2.demand_accesses::total 是一般的gem5stats没有的,需要对gem5进行改源代码并且编译才能在stats.txt 输出这个文件。对我们只关心noc access的人来说,初始阶段不如用默认的输出文件,然后手动更改。


好处是他再次确认了,total_access 是两倍的l2.demand_accesses。
在这里插入图片描述
同一个文件内设置了其他access。
在这里插入图片描述

dskhudia bitbucket的库: 没有设置noc access

https://bitbucket.org/dskhudia/gem5tomcpat/src/master/template-xeon.xml

saideeptiku 没有noc access

https://github.com/saideeptiku/Gem5McPatParser/blob/master/templates/template_x86.xml。好处是他声明了用的mcpat 1.3和python 3.6,是相对新的版本了。其他有的用的是python 2.7和mcpat1.0。

2022年的csdn 帖子

2022年的 Mcpat与gem5联合 csdn帖子用的 https://blog.csdn.net/ffriend/article/details/127114214?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522170263778216800182144970%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=170263778216800182144970&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_ecpm_v1~rank_v31_ecpm-2-127114214-null-null.142v96pc_search_result_base7&utm_term=mcpat%20parser&spm=1018.2226.3001.4187 这一篇用的 https://github.com/Dhruv-Acharya/Gem5ToMcPAT-Parser 作者Dhuruv的github代码,但他的noc total_accesses 没有从gem5里的stats.txt读取。无效。
在这里插入图片描述

hardik44 Gem5toMcPat_parser 一样没有noc access

hardik44 https://github.com/Hardik44/Gem5toMcPat_parser 里也没有从没有从gem5里的stats.txt读取。无效。
在这里插入图片描述

zhenwen404 gem5tomcpat 没有读取noc access

https://github.com/zhewen404/gem5tomcpat/blob/main/template-xeon.xml 一样没有noc total_access. 不过他有设置itlb和dtlb读取。

takakeya gem5tomcpat 没有读取noc access

https://github.com/TAKAKEYA/gem5tomcpat/blob/master/template-xeon.xml 没有。

JuninhoCarlos gem5ToMcPAT 没有读取noc access

https://github.com/JuninhoCarlos/gem5ToMcPAT/blob/master/template-xeon.xml

UDC-GAC 用的C,不方便用和读, 不知道有没有noc access

https://github.com/UDC-GAC/gem5McPATparse/blob/master/template.xml 还说明了他们专注x86.其他的isa可能会有问题?

其他资料

有gem5 user email 提到有parser会统计total access

在这里插入图片描述
这个link提到了,有的parser会给关于total_access 的警告,意外着这个parser会查找total access。可惜他的问题没有回复也没有po出用的哪个parser。
在这里插入图片描述

有例子给出转换过的noc total_access

https://www.mail-archive.com/gem5-users@gem5.org/msg17699.html 提到了他的xml文件,其中noc access 是一个复杂的值,应该来自与gem5的stats.txt转化。 他用的文件是 Gem5tomcpat 和 mcpat-template.xml。

https://www.teraflux.eu/sites/teraflux.eu/files/TERAFLUX-D73-v7.pdf
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/70b584c82e84438ab4c9e0f8af844b3a.png)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/224286.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

EasyExcel读取Excel数据(含多种方式)

目录 EasyExcel简介 使用EasyExcel进行读数据 引入依赖: EasyExcel提供了两种读取模式 使用 监听器 读取模式 1.创建一个实体类 2.创建监听器 代码 使用 同步读 读取模式 1.创建一个实体类 2.代码 添加导入数据库的逻辑 其实官方文档讲得很清楚&#xff…

用友NC word.docx任意文件读取漏洞

文章目录 产品简介漏洞概述指纹识别漏洞利用修复建议 产品简介 用友NC是一款企业级ERP软件。作为一种信息化管理工具,用友NC提供了一系列业务管理模块,包括财务会计、采购管理、销售管理、物料管理、生产计划和人力资源管理等,帮助企业实现数…

代码随想录第三十三天(一刷C语言)|斐波那契数爬楼梯使用最小花费爬楼梯

创作目的:为了方便自己后续复习重点,以及养成写博客的习惯。 动态规划步骤: 确定dp数组以及下标的含义确定递推公式dp数组如何初始化确定遍历顺序举例推导dp数组 一、斐波那契数 思路:参考carl文档 1、dp[i]的定义为&#xff…

JMeter逻辑控制器

JMeter逻辑控制器 一、IF控制器1、作用2、步骤 二、循环控制器1、作用2、步骤3、线程组和循环控制器的区别? 三、ForEach控制器1、作用2、步骤 一、IF控制器 1、作用 **控制下面的测试元素是否执行**2、步骤 添加线程组用户定义的变量添加if控制器,判断…

动态内存管理,malloc和calloc以及realloc函数用法

目录 一.malloc函数的介绍 malloc的用法 举个例子 注意点 浅谈数据结构里的动态分配空间 二.calloc函数的介绍 三.realloc函数的介绍 四.柔性数组的介绍 为什么有些时候动态内存函数头文件是malloc.h,有些时候却是stdlib.h 一.malloc函数的介绍 malloc其实就是动态开辟…

老卫带你学---leetcode刷题(29. 两数相除)

29. 两数相除 问题 给你两个整数,被除数 dividend 和除数 divisor。将两数相除,要求 不使用 乘法、除法和取余运算。 整数除法应该向零截断,也就是截去(truncate)其小数部分。例如,8.345 将被截断为 8 &…

云原生之深入解析Kubernetes中服务的性能

一、Pyroscope 简介 ① 什么是 Pyroscope? 开发人员通常需要查看生产应用程序中的性能瓶颈以确定问题的原因,为此通常需要可以通过日志和代码工具收集的信息。不幸的是,这种方法通常很耗时,并且不能提供有关潜在问题的足够详细信…

论文解读:Medical Transformer论文创新点解读

这篇文章其实就是基于Axial-DeepLab: Stand-Alone Axial-Attention forPanoptic Segmentation论文上进行的一些小创新 Stand-Alone Axial-Attention forPanoptic Segmentation论文解读: 论文解读:Axial-DeepLab: Stand-Alone Axial-Attention forPanop…

【TES720D-KIT】基于国内某厂商FMQL20S400全国产化ARM开发套件(核心板+底板)

板卡概述 TES720D-KIT是专门针对我司TES720D(基于国内某厂商FMQL20S400的全国产化ARM核心板)的一套开发套件,它包含1个TES720D核心板,加上一个TES720D-EXT扩展底板。 FMQL20S400是国内某厂商电子研制的全可编程融合芯片&#xf…

使用Android Studio导入Android源码:基于全志H713 AOSP,方便解决编译、编码问题

文章目录 一、 篇头二、 操作步骤2.1 编译AOSP AS工程文件2.2 将AOSP导入Android Studio2.3 切到Project试图2.4 等待index结束2.5 下载缺失的JDK 1.82.6 导入完成 三、 导入AS的好处3.1 本文案例演示源码编译错误AS对比同文件其余地方的调用AS错误提示依赖AS做错误修正 一、 篇…

逆向经历回顾总结

逆向经历回顾总结 一、前言 将自己的逆向经验做个总结,希望新手对逆向大方向能快速了解。高手有啥不一样的经验也可以讨论讨论。 二、个人经历 本人入行逆向全因一部韩剧“幽灵”,里面涉及渗透、病毒分析、取证的攻防对抗,我觉得对新手来说…

图片转HTML-screenshot-to-code

Github地址 https://github.com/abi/screenshot-to-code 在线站 Screenshot to Code 简介 这是一个基于GPT4开发的一个工具站,它可以基于截图生成站点代码,生成速度快且准确。

SpringBoot 究竟是如何跑起来的

🎉🎉欢迎来到我的CSDN主页!🎉🎉 🏅我是Java方文山,一个在CSDN分享笔记的博主。📚📚 🌟推荐给大家我的专栏《SpringBoot》。🎯🎯 &…

【MySQL 索引】InooDB 索引实现

1 索引定义 维基百科对数据库索引的定义: 数据库索引是数据库管理系统(DBMS)中的一个排序数据结构, 以协助快速查询和更新数据库表中的数据。 MongoDB对索引的定义: 索引是一种特殊的数据结构, 以有序和便于遍历的形式存储数据集合中特定字段或一组字段…

基于ssm服装定制系统源码和论文

idea 数据库mysql5.7 数据库链接工具:navcat,小海豚等 环境: jdk8 tomcat8.5 开发技术 ssm 基于ssm服装定制系统源码和论文751 1.1项目研究的背景 困扰管理层的许多问题当中,服装定制将是广大用户们不可忽视的一块。但是管理好服装定制又面临很多麻…

EasyV易知微助力智慧城市未来趋势发展——数字孪生城市

“智慧城市的未来趋势就是数字孪生”——《基于数字孪生的智慧城市》 城市数字化管理、智慧城市和数字孪生城市的发展是相互促进、逐步深化的过程。 城市数字化管理作为起点,奠定了信息化、数据化的基础;而智慧城市则将数字城市管理进一步升级&#xff…

RabbitMQ死信队列详解

什么是死信队列 由于特定的**原因导致 Queue 中的某些消息无法被消费,**这类消费异常的数据将会保存在死信队列中防止消息丢失,例如用户在商城下单成功并点击支付后,在指定时间未支付时的订单自动失效死信队列只不过是绑定在死信交换机上的队…

Springboot集成支付宝支付---完整详细步骤

网页操作步骤 1.进入支付宝开发平台—沙箱环境 使用开发者账号登录开放平台控制平台 2.点击沙箱进入沙箱环境 说明:沙箱环境支持的产品,可以在沙箱控制台 沙箱应用 > 产品列表 中查看。 3.进入沙箱,配置接口加签方式 在沙箱进行调试前…

Python (十) operator

程序员的公众号:源1024,获取更多资料,无加密无套路! 最近整理了一波电子书籍资料,包含《Effective Java中文版 第2版》《深入JAVA虚拟机》,《重构改善既有代码设计》,《MySQL高性能-第3版》&…

找不到vcomp100.dll,无法继续执行代码怎么解决

在计算机编程中,我们经常会遇到一些错误提示,其中之一就是“找不到vcomp100.dll,无法继续执行代码”。这个错误通常出现在使用Visual Studio进行C开发时,它表示程序无法找到vcomp100.dll文件。vcomp100.dll是Visual C 2015 Redist…