计算机体系结构实验——Branch-Target Buffers

实验五 Branch-Target Buffers

本次实验的主要目的是加深对Branch-Target Buffers的理解。掌握使用Branch-Target Buffers减少或增加分支带来的延迟的情况。

实验内容： 将以下程序段修改为可利用WinMIPS64模拟器运行的程序。假设R3的初始值为R2+40
在这里插入图片描述

在使用forwarding的情况下，对比采用BTB与不采用BTB技术时流水线的变化。重点分析两种情况下每次循环的stall周期数，都是由什么原因造成的？重点分析与分支指令相关的stall。采用BTB技术时何时能够减少分支指令带来的暂停？何时会增加暂停？为什么？

实验报告:

将程序段3修改为WinMIPS64模拟器可以运行的程序如下：

.text
main:
DADDI R3,R2,40;Loop: LW R1,0(R2)DADDI R1,R1,1SW R1,0(R2)DADDI R2,R2,4DSUB R4,R3,R2BNEZ R4,Loop
end: halt

在使用forwarding，不使用BTB技术的情况下造成的暂停以及原因介绍如下：

数据相关：

1、由于LW指令取数放入R1中在Mem阶段才能到内存中取到数值，而下一条指令需要使用到R1寄存器的数值，存在RAW相关会造成一个周期的暂停

在这里插入图片描述

2、由于DSUB那条指令最后要将结果写到R4中并且在EX阶段结束后才能获得存放到R4中的数值，而跳转指令需要在ID阶段判断是否要跳转，所以会产生RAW相关，暂停一个周期

在这里插入图片描述

控制相关：

3、由下图红框中的指令可以看出，它在处理跳转指令的时候采用的是预测转移失败的行为，但在实际指令运行过程中，指令成功转移，所以会清空流水线，重新取指令，造成一个周期的暂停

在这里插入图片描述

在使用forwarding技术，并且使用BTB技术的情况下造成的暂停以及原因介绍如下：

数据相关：

由于在这种情况下所产生的数据相关与不使用BTB的情况下的数据相关相同，所以不再加以介绍

结构相关：

1、在第一次循环结束时，由于BTB表为空，预测为转移失败，但实际转移成功。所以在ex段执行中会将转移指令地址连同下一条指令的pc值放入BTB中，并且清空流水线，重新取指执行，造成两个周期的暂停。

在这里插入图片描述

2、在第二次循环以及后续的八次循环中，由于该条跳转指令在IF段会查找BTB表，并且会在表中查到对应的指令的地址，所以会预测转移成功，并且将转移地址放入PC中，因此不存在结构相关，不会造成暂停。

在这里插入图片描述

3、在最后一次循环时，由于BTB表中存在对应跳转指令的地址，所以会预测转移成功，但实际上会转移失败，所以会在转移指令的EX阶段中删除BTB表中对应的表项，同时在ex阶段执行结束后会清空流水线重新取指来运行，造成两个周期的暂停。

在这里插入图片描述

由以上可以发现在：

预测正确的时候可以减少暂停：跳转指令在IF阶段会查找BTB表，如果查找到会将下一条指令的地址放入PC寄存器中。如果预测正确则可以在下一个周期就开始下一条指令的取指阶段，而不需要等待跳转指令的ID段执行结束才能执行下一条指令的取指阶段。

预测错误时会增加暂停：由上述程序第一个阶段和最后一个可以看到，如果预测失败，不仅要清空流水线还要修改BTB表中存储的指令地址以及下一条指令的PC值，会造成两个周期的暂停。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/238386.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

计算机体系结构实验——Branch-Target Buffers

实验五 Branch-Target Buffers

相关文章

业务逻辑漏洞有哪些？漏洞攻击防御及代码示例

基于 FFmpeg 的跨平台视频播放器简明教程（十二）：Android SurfaceView 显示图片和播放视频

【LeetCode:2866. 美丽塔 II | 单调栈 + 前后缀数组】

flink watermark 实例分析

2023年12月GESP认证图形化编程四级真题试卷

Valentina Studio Pro for Mac：高效数据库管理工具

KBU808-ASEMI适配高端电源KBU808

白酒企业巧用全返消费实现绝地翻盘，最后创收八亿营业额

Docker 编译OpenHarmony 4.0 release

C#电源串口调试

【C语言】自定义类型：结构体深入解析（二）结构体内存对齐宏offsetof计算偏移量结构体传参

R语言【cli】——通过cli_abort用 cli 格式的内容显示错误、警告或信息，内部调用cli_bullets和inline-makeup

Redis实现日榜|直播间榜单|排行榜|Redis实现日榜01

力扣日记12.21【二叉树篇】98. 验证二叉搜索树

啥？你还不道数据库？赶紧进来看吧！

Ubuntu 常用命令之 df 命令用法介绍

【Python】matplotlib画图_饼状图

PIC单片机项目（7）——基于PIC16F877A的智能灯光设计

代码随想录算法训练营Day7 | 344.反转字符串、541.反转字符串||、替换数字、151.反转字符串中的单词、右旋字符串

华为二层交换机与防火墙配置实例