计算机系统基础（一）

1. 引入——从源程序到可执行文件

了解高级语言编写的代码在后台是如何被编译并运行的

首先我们会编写一段代码，例如

#include<stdio.h>int main(){printf("hello world!\n");return 0;
}

并把它命名为hello.c文件

预处理阶段

接下来通过命令,得到hello.i

gcc -E hello.c -o hello.i

该阶段会把以#开头的文件内容嵌入到源程序文件中，hello.i仍是文本文件

编译阶段

gcc -S hello.i -o hello.s

将hello.i进行编译得到一个汇编语言源程序文件hello.s，将高级语言转变为汇编语言这个过程就叫编译

汇编阶段

gcc -c hello.s -o hello.o

将hello.s进行汇编得到二进制文件hello.o，里面的指令也为机器指令，无法用文本打开,

想打开也可以采用逆向汇编，注意逆向汇编和正向汇编略有不同

objdump -d hello.o

一条汇编对应一条机器指令

链接阶段

gcc hello.o -o hello.exe

将多个可重定位的目标文件与标准函数库中的可重定位目标文件合并为一个可执行目标文件

2.计算机系统的抽象

通过c语言文件的编译等操作，我们知道了高级语言编写的语言文件是如何汇编为机器语言。接下来就正式了解计算机系统

操作系统、编程语言、算法等不做过多解释

指令集体系结构

机器语言程序所运行的计算机硬件与软件之间的桥梁。ISA定义了一台计算机可以执行所有指令的集合，例如操作数存放的地址空间，操作数的类型等

微体系架构

计算机硬件执行机器语言程序的过程就是执行一条一条指令的过程，ISA是对指令系统的一种规定或结构规范，具体实现的组织是微体系结构。例如，同样是加法，是采用串行进位还是并行进位属于微体系结构，但在ISA层面可能是相同的

功能部件、电路、器件则不做过多描述

3.冯.诺伊曼

冯.诺伊曼结构基本思想

1. 采用“存储程序”的工作方式

存储方式：必须将事先编好的程序和原始数据送入主存后才能执行程序，一旦程序被启动执行，计算机能在不需操作人员干预下自动完成逐条指令取出和执行的任务

2. 计算机由运算器、控制器、存储器、输入设备、输出设备5个基本部件构成

3. 存储器不仅能存放数据也能存放指令

数据和指令尽管形式上没有区别，但计算机可以区分它们。控制器应能自动执行指令

4. 计算机内部以二进制形式表示指令和数据

每条指令由操作码和地址码两部分组成，操作码指出操作类型，地址码指出操作数的地址；由一串指令组成程序

冯.诺伊曼基本结构

ALU:算术逻辑部件，对输入端的AB进行操作
GPRs:通用寄存器，临时存储从主存取来的数据和运算结果
IR:指令寄存器
PC：程序计数器，执行当前指令过程中，自动计算出下一条指令的地址并送到PC保存
标志寄存器：结果是否为0,是否为负数，这些标志信息需要专门记录
控制部件:自动逐条取出指令并进行译码的部件
MAR：（CPU访问主存时，需先将主存地址、读写命令分别送到总线的地址线、控制线）CPU送到地址线的主存地址应先存放在MAR中
MDR：发送到或从数据线取来的信息存放在MDR中

以下是个人对CPU执行过程的理解：

程序执行前，主存地址存放在MAR中，数据存放在MDR

PC获取到第一条指令的地址后，根据指令译码让IR从MDR中获取操作数地址和操作码。控制部件对指令进行操作，操纵ALU对AB进行计算。计算结果产生的标志信息存放在标志寄存器中，并将计算结果放在MDR中返回给内存或者放在GPRs中继续计算。

修改PC，继续下一条程序

指令执行过程

假设模型机M中8位指令，16个主存单元，4个通用寄存器r0~r3，有两种指令格式

已知：

现我们需要实现z=x+y，x和y分别存放在主存5和6号单元中，结果z存放在7号单元中

我们以1110 0110指令举例，来看指令执行过程。首先，我们取出存放在主存M[0000]的指令即1110 0110放在IR中；再将高四位即1110放进控制部件进行指令译码，根据op=1110，我们知道这是一个取数操作；同时PC+1，PC内容是0001；因为是取数指令，控制器产生read信号，并将该信号送往控制线；同时它将控制addr字段作为主存地址送MAR；然后主存将0110中的变量33送到数据线并自动存储在MDR中；最后将MDR又存放在R[0]通用寄存器中

以上所有微操作都具有先后顺序需要时钟信号进行定时，时钟信号宽度为一个时钟周期，一条指令就包含多个时钟周期