9 计算机组成原理第五章中央处理器指令流水线

文章目录

- - 1 指令流水线基本概念性能指标
  - - 1.1 指令流水的定义
    - - 1.1.1 指令分法
        1.1.2 指令执行时间
    - 1.2 流水线的表示方法
    - 1.3 流水线的性能指标
  - 2 指令流水线影响因素分类
  - - 2.1 机器周期的设置
    - 2.2 影响流水线的因素
    - - 2.2.1 数据相关（数据冲突）三种类型
        2.2.2 流水线影响因素小结
    - 2.3 流水线的分类
    - 2.4 流水线的多发技术
    - 2.5 指令流水线小结

1 指令流水线基本概念性能指标

1.1 指令流水的定义

1.1.1 指令分法

一条指令的执行过程可以分成多个阶段（或过程）。
根据计算机的不同，具体的分法也不同。

取指	分析	执行

取指：根据PC内容访问主存储器，取出一条指令送到IR中。
分析：对指令操作码进行译码，按照给定的寻址方式和地址字段中的内容形成操作数的有效地址EA，并从有效地址EA中取出操作数。
执行：根据操作码字段，完成指令规定的功能，即把运算结果写到通用寄存器或主存中。

以上分法特点是：每个阶段用到的硬件不一样。

1.1.2 指令执行时间

设取指、分析、执行3个阶段的时间都相等，用t表示，按以下几种执行方式分析n条指令的执行时间：

顺序执行方式总耗时 T=nx3t=3nt

传统冯·诺依曼机采用顺序执行方式，又称串行执行方式。

优点：控制简单，硬件代价小。
缺点：执行指令的速度较慢，在任何时刻，处理机中只有一条指令在执行，各功能部件的利用率很低。

一次重叠执行方式总耗时T=3t+（n-1）×2t=（1+2n）t 只有第一条指令3t，后面n-1条每隔2t

优点：程序的执行时间缩短了1/3，各功能部件的利用率明显提高。
缺点：需要付出硬件上较大开销的代价，控制过程也比顺序执行复杂了。

二次重叠执行方式总耗时T=3t+（n-1）×t=（2+n）t 只有第一条指令3t，后面n-1条每隔t

与顺序执行方式相比，指令的执行时间缩短近2/3。这是一种理想的指令执行方式，在正常情况下，处理机中同时有3条指令在执行。

注：也可以把每条指令的执行过程分成4个或5个阶段，分成5个阶段是比较常见的做法。

1.2 流水线的表示方法

指令执行过程图

主要用于分析指令执行过程以及影响流水线的因素

时空图

不同的阶段占用不同的资源，有几个阶段，纵坐标就有几个位置

主要用于分析流水线的性能

1.3 流水线的性能指标

（1）吞吐率
（2）加速比
（3）效率

吞吐率

吞吐率是指在单位时间内流水线所完成的任务数量，或是输出结果的数量。
设任务数为n；处理完成n个任务所用的时间为T_k
则计算流水线吞吐率（TP）的最基本的公式为TP=n/T_k

理想情况下，流水线的时空图如下：

理想情况：

各阶段花费时间相同
每个阶段结束后能立即进入下一阶段
一条指令的执行分为k个阶段，每个阶段耗时Δt，一般取Δt=一个时钟周期

T_k=（k+n-1）Δt
第一条指令kΔt时间结束，其余n-1条指令每隔Δt时间执行
流水线的实际吞吐率为TP=n /（k+n-1）Δt

当连续输入的任务n→oo时，得最大吞吐率为TP_max=1/Δt

第一条指令执行的时间→装入时间
最后一条指令从输入到执行完成的时间→排空时间
装入时间和排空时间中间的那块时间，流水线是最理想的状态，每一个时刻，每个功能部件都被占用，并且可以保证每隔Δt时间就有一个任务被提交

加速比

加速比表示完成同样一批任务，不使用流水线所用的时间与使用流水线所用的时间之比。

设 To 表示不使用流水线时的执行时间，即顺序执行所用的时间；
T_k 表示使用流水线时的执行时间
则计算流水线加速比（S）的基本公式为S=To / T_k

单独完成一个任务耗时为kΔt，则顺序完成n个任务耗时To=nkΔt

T_k=（k+n-1）Δt
实际加速比为S=knΔt/（k+n-1）Δt =kn/ k+n-1

当连续输入的任务n→oo时，最大加速比为S_max=k。
表示一个充分流动的流水线，它的工作能力是原来不使用流水线的k倍

效率

流水线的设备利用率称为流水线的效率。
在时空图上，流水线的效率定义为完成n个任务占用的时空区有效面积与n个任务所用的时间与k个流水段所围成的时空区总面积之比。

效率转化为：顺序完成n个任务耗时To=nkΔt/k倍使用流水线的时间

效率=红/蓝表示使用的设备占所有总设备的比率
总=长T_kX宽k

当连续输入的任务n→oo时，最高效率为E_max=1。

2 指令流水线影响因素分类

2.1 机器周期的设置

为方便流水线的设计，将每个阶段的耗时取成一样，以最长耗时为准。
即此处应将机器周期设置为100ns。

流水线每一个功能段部件后面都要有一个缓冲寄存器，或称为锁存器，其作用是保存本流水段的执行结果，提供给下一流水段使用。

设置锁存器的目的：设计流水线时，在这条指令处于当前阶段时，另一条指令是在用下一阶段的资源，如果这条指令这一阶段数据提前流入下一阶段，会破坏当前指令的指令

2.2 影响流水线的因素

（1）结构相关（资源冲突）
（2）数据相关（数据冲突）
（3）控制相关（控制冲突）

结构相关（资源冲突）

由于多条指令在同一时刻争用同一资源而形成的冲突称为结构相关。

解决办法：

后一相关指令暂停一周期
资源重复配置：数据存储器+指令存储器

数据相关（数据冲突）

数据相关指在一个程序中，存在必须等前一条指令执行完才能执行后一条指令的情况，则这两条指令即为数据相关。

解决办法：

把遇到数据相关的指令及其后续指令都暂停一至几个时钟周期，直到数据相关问题消失后再继续执行。可分为硬件阻塞（stall）和软件插入“NOP”两种方法。
数据旁路技术。
编译优化：通过编译器调整指令顺序来解决数据相关。

数据相关（数据冲突）例题：

假设某指令流水线采用“按序发射（即不能把后面的指令移到前面执行，如果发生冲突，只能等待），按序完成”方式，没有采用转发技术（也叫数据旁路技术）处理数据相关，并且同一寄存器的读和写操作不能在同一个时钟周期内进行。若高级语言程序中某赋值语句为x=a+b，x、a和b均为int型变量，它们的存储单元地址分别表示为[x]、[a]和[b]。该语句对应的指令序列及其在指令流中的执行过程如下图所示。

I1 I2 I3 I4指令表示含义：

解答：I3与I1和I2存在数据相关，I4和I3存在数据相关

说明：对于相关的指令而言，只有等到相关的数据写回之后，才可以开始这条指令的译码，取指有序进行，取指结束发现相关，是译码阶段被延迟

2.2.1 数据相关（数据冲突）三种类型

数据的基本操作：读（R）、写（W）
冲突的基本类型：RAW（A代表after，倒过来念，写后读）、WAR（读后写）、WAW（写后写）
在这里插入图片描述

注：“按序发射，按序完成”时，只可能出现RAW相关。

控制相关（控制冲突）

当流水线遇到转移指令和其他改变PC值的指令而造成断流时，会引起控制相关。

解决办法：

尽早判别转移是否发生，尽早生成转移目标地址
预取转移成功和不成功两个控制流方向上的目标指令
加快和提前形成条件码
提高转移方向的猜准率

2.2.2 流水线影响因素小结

在这里插入图片描述

2.3 流水线的分类

部件功能级、处理机级和处理机间级流水线

根据流水线使用的级别的不同，流水线可分为部件功能级流水线、处理机级流水线和处理机间流水线。
部件功能级流水就是将复杂的算术逻辑运算组成流水线工作方式。例如，可将浮点加法操作分成求阶差、对阶、尾数相加以及结果规格化等4个子过程。
处理机级流水是把一条指令解释过程分成多个子过程，如前面提到的取指、译码、执行、访存及写回5个子过程。
处理机间流水是一种宏流水，其中每一个处理机完成某一专门任务，各个处理机所得到的结果需存放在与下一个处理机所共享的存储器中。