前言
发布该文章的网站已经无法访问,无法获得相关翻译授权,本人的翻译仅供大家参考学习,尽可能使用直译,并加上一些译者注(使用“ [1] ”的形式),以减少信息损失,水平有限,不妥之处还请见谅。
本文不得用于其他用途,侵删,转载请加上原文链接。
Adapted from: http://edge.mcs.dre.g.el.edu/GICL/people/sevy/architecture/MIPSRef(SPIM).html
点此获取 >>> 英文原文资源链接
其实我并不建议你看翻译,因为无论如何,翻译过后都会造成信息损失甚至错误,强烈建议直接看英文原文。
0 MIPS架构及汇编语言概述
0.1 数据类型及字面含义
0.1.1数据类型
- 所有指令都是32位
- 基本数据类型
- 字节型:byte(8 bits)
- 半字:halfword(2 bytes)[1]
- 字型:word(4 bytes)
- 一个字符(character)需要1个字节的存储空间
- 一个整数(integer)需要1个字(4个字节)的存储空间
译者注:
[1] 在MARS模拟器,半字用half
[补充] 在32位环境下,C语言的char是1个字节,short是2个字节,int是4个字节,可以对比学习,关于有无符号的问题,请先忽略,不妨之后深入学习MIPS数据及指令再了解。
0.1.2 字面值[1]
- 数字(numbers)按照原样输入,就是,例如:
4
- 字符(characters)被单引号括起来,例如:
'b'
- 字符串(strings)被双引号括起来,例如:
"A string"
译者注
[1] 英文为Literal
,中文不妨理解为:不同类型数据的表示方法。
0.2 寄存器(registers)
- 32个通用寄存器
- 在汇编指令中,寄存器以
$
开头。访问(addressing)寄存器的形式有2种:- 使用寄存器的编号,例如,从
$0
到$31
[1] - 使用与编号等价的寄存器名称,例如,
$t1
,$sp
- 使用寄存器的编号,例如,从
- 特殊的寄存器
Lo
和Hi
用于存储乘法或除法运算的结果- 不能直接访问
Lo
和Hi
寄存器,它们的内容通过特殊的指令访问:mfhi
(move from Hi)和mflo
(move from Lo)[2]。
- 不能直接访问
- 栈的增长方向是从存储器的高地址走向低地址[3]
译者注
[1] MIPS有32个通用寄存器,编号为0~31。
[2] 这里不是完全直译,直译的话看不懂,给出你原文对比一下:not directly addressable; contents accessed with special instruction mfhi (“move
from Hi”) and mflo (“move from Lo”).
[3] 这意味着栈底在高地址,栈顶在低地址;数据入栈的时候,栈顶指针是从高地址往低地址方向走的,出栈反之。
[补充] 在此再补充一下“字节序”,它与硬件的设计有关,通常x86系列的硬件采用小端序,MIPS大部分与网络字节序一样,采用大端序,也有采用小端序的,不过后来增强了可移植性,采用双端序,既可以使用小端模式也可以使用大端模式。(参考链接在此)
这是来自Goodman&Miller的图9.9[1](注:功能描述请参考原文,这里没有完全翻译,对于初学者来说没有意义。)
寄存器编号 | 可代替的名字[2] | 英文全称 | (功能)描述 |
---|---|---|---|
0 | $zero | zero | 值恒为0 |
1 | $at | assembler temporary | 汇编器保留寄存器 |
2-3 | $v0 , $v1 | values | 值来自于表达式求值和函数结果 |
4-7 | $a0 - $a3 | arguments | 存储子程序调用的前4个非浮点参数,在子程序中不会跨子程序保存 |
8-15 | $t0 - $t7 | temporaries | 暂存寄存器 |
16-23 | $s0 - $s7 | saved values | 通用寄存器 |
24-25 | $t8 - $t9 | temporaries | 临时变量,与$t0 - $t7一样 |
26-27 | $k0 , $k1 | kernel reserved | 操作系统内核保留寄存器,用于中断处理 |
28 | $gp | global pointer | 全局指针 |
29 | $sp | stack pointer | 栈指针,指向栈顶 |
30 | $s8 / $fp | saved values / frame pointer | 帧指针,用于过程调用 |
31 | $ra | return address | 返回地址 |
也参考了Britton的章节1.9,Sweetman的章节2.21,Larus的附录章节A.6。
译者注
[1] 译者此处将图片以表格形式表现了出来。
[2] 原文Alternative name
,中文意思就是:与寄存器编号等价的名字,比如,$2
与$v0
等价。
[补充1] 这里我们可以注意到,32个寄存器被分成了不同类别,它们都有不同的用途,虽然它们都是通用寄存器,但是使用的时候,还是应该尽量按照实际功能去使用,以免发生不可知的错误。
[补充2] 学习建议:这部分内容,看一看有大概印象即可,不要强行记忆,因为初学者不太可能看得懂这些都是什么,后面需要的时候再回看,再查阅即可。
1 程序结构
- 纯文本文件中只有数据声明和程序代码[1](文件名的后缀为
.s
,以能够在SPIM模拟器运行[2]) - 数据声明部分后面跟着程序代码部分[3]
译者注:
[1] 意思是:MIPS源程序要在文本编辑器进行编辑,包含数据声明和程序代码。
[2] 推荐使用MARS模拟器来进行运行MIPS程序,这款软件一定程度兼容SPIM,并且提供了更加丰富的插件。另外,MIPS源程序文件的后缀可以是.s
,也可以是.asm
。
[3] 先声明数据,然后再写处理数据的代码。
1.1 数据声明
- 放置在程序段中,使用编译器指令
.data
来标识 - 声明在程序中使用的变量名;存储(的变量)会被分配到主内存(RAM)中
译者注:直译后表示很难受,可能我水平不够吧……我用汉语描述一遍
- 在MIPS源程序进行数据声明的时候,需要先加上
.data
,再进行数据声明- 在程序中需要用到的数据,需要先在数据段进行声明,并为这些数据起名
- 这些你声明好的变量(的值),在程序运行的时候,会被系统分配到主内存中
译者注:数据声明在源程序中应该是这样的
.data # 我要开始写数据声明了!variable_name_1: .word 11 # 声明了一个变量(先不用管语法)# 值:11# 变量名:variable_name_1# <其他数据声明>……
1.2 代码
- (代码需要)放在文本(text)部分,并用
.text
来标识 - (
.text
后面的文本)包含程序代码指令 - 代码执行的起始点要给定一个标签,例如
main
- 主代码的结束点应该使用“退出系统调用(功能)”,看下面的系统调用篇
1.3 注释
在一行上,任何在#
之后的内容,将会被(编译器)认为是注释[1]。
译者注:
[1] 这里的注释,也就是所谓的“单行注释”。
[补充] 下面的1.4节在原文中是包含在1.3节的,译者这里将其单独拿出来,以强调MIPS源程序结构框架。
1.4 MIPS源程序结构框架示例
下面是MIPS汇编语言程序的模板:
# 注释部分给出了程序名和函数描述
# 文件名:Template.s
# 这是最基本的MIPS汇编语言程序框架.data # 这行之后是变量声明
# ... .text # 这行之后的是指令 main: # 指出代码的起始点(第一个要执行的指令)
# ... # End of program, leave a blank line afterwards to make SPIM happy
# 程序的结尾留出一个空行,让SPIM高兴[1]
译者注:
[1]make SPIM happy
……外国人太有趣了,这句话含义就是,程序结束的时候多一个空行,这样看起来程序美观好看。
[补充] 原文程序的注释太多了,程序结构都看不见了…让我们留下最宝贵的部分,删掉冗余部分
.data # 此处进行数据声明.text
main: # 这是程序入口# 此处编辑程序代码
2 数据声明
数据声明的形式:
name: storage_type value(s)
以上语句的含义是:
- 为变量创建一个仓库(storage)[1],它指定了数据类型,给定了变量名和变量的值
- 变量的值通常会给定初始值;对于存储类型
.space
,给出要被分配的空间的数字[2]
注意:标签[3]后面总是跟着冒号:
译者注:
[1] 可以理解为存储变量的容器
[2] 也就是空间的大小
[3] 指的是变量名
例子:
var1: .word 3 # create a single integer variable with initial value 3
array1: .byte 'a','b' # create a 2-element character array with elements initialized to a and b
array2: .space 40 # allocate 40 consecutive bytes, with storage uninitialized could be used as a 40-element character array# or a 10-element integer array; a comment should indicate which!
译者注:分别解释一下这3条
- 创建一个
integer类型
的变量,变量名为var2
,变量的值初始化为3
- 创建一个字符数组
array1
,包含2个字符类型元素,它们的值分别被初始化为a
和b
- 创建一个空的空间
array2
,在内存中分配40个连续的字节,这个没有被初始化的storage可能是一个含有40个元素的字符数组,也可能是一个含有10个元素的integer数组,由于不确定,因此建议在注释中说明space的用途。
3 load/store[1]指令
- RAM的访问,只能使用
load
和store
指令[2] - 其他的指令只能使用寄存器操作数
译者注:
[1]load
意为“加载”,可以理解为“读取”,CPU从内存中读取信息;store
意为“存储”,可以理解为“写入”,CPU向内存写入信息。
[2] MIPS为RICS指令集,相比x86,它的寻址方式很少,只有这两条指令可以访问内存,也就是说,其他指令的操作数,不允许出现内存操作数
load
:
# 从RAM源位置,复制1个字(4个字节)到目标寄存器
lw register_destination, RAM_source# 从RAM源位置,复制1个字节到目标寄存器的低序字节
# 并且对字节进行符号扩展,填充到高位字节中
lb register_destination, RAM_source
store
:
# 将源寄存器中的字(型数据),存到目标RAM(地址)中
sw register_source, RAM_destination# 将源寄存器中的低位字节,存到目标RAM中
sb register_source, RAM_destination
load immediate
:
# 加载立即数到目标寄存器
li register_destination, value
举例[1]:
.data var1: .word 23 # declare storage for var1; initial value is 23 .text
__start: lw $t0, var1 # load contents of RAM location into register $t0: $t0 = var1 li $t1, 5 # $t1 = 5 ("load immediate") sw $t1, var1 # store contents of register $t1 into RAM: var1 = $t1 done
译者注:
[1] 这里不再翻译,根据前面的内容相信你能理解
[补充] 注意,这些指令其实就是英文全称的缩写,记忆起来非常容易,其他指令也一样,要关注其英文全称。
4 间接寻址和基址寻址
仅被用于load
和store
指令。
load address
:
la $t0, var1
- 将
var1
(可能是在程序中被定义的标签)的RAM地址复制到寄存器$0
indirect addressing
:
lw $t2, ($t0)
- 加载1个字大小的数据到
$t2
中,数据的地址在$t0
中,数据在数据地址指向的内存单元中
sw $t2, -12($t0)
未完成
5 算数运算指令
- 最多使用3个操作数
- 所有操作数都是寄存器;没有RAM或者直接寻址
- 操作数的大小都是1个字
add $t0,$t1,$t2 # $t0 = $t1 + $t2; add as signed (2's complement) integers
sub $t2,$t3,$t4 # $t2 = $t3 Ð $t4
addi $t2,$t3, 5 # $t2 = $t3 + 5; "add immediate" (no sub immediate)
addu $t1,$t6,$t7 # $t1 = $t6 + $t7; add as unsigned integers
subu $t1,$t6,$t7 # $t1 = $t6 + $t7; subtract as unsigned integers mult $t3,$t4
# multiply 32-bit quantities in $t3 and $t4, and store 64-bit
# result in special registers Lo and Hi: (Hi,Lo) = $t3 * $t4 div $t5,$t6
# Lo = $t5 / $t6 (integer quotient)
# Hi = $t5 mod $t6 (remainder) mfhi $t0 # move quantity in special register Hi to $t0: $t0 = Hi
mflo $t1 # move quantity in special register Lo to $t1: $t1 = Lo # used to get at result of product or quotient move $t2,$t3 # $t2 = $t3
译者注:
这里不翻译了,表达式能够看懂,注意观察指令的规律,使用分治思想理解记忆:
- 指令是英文全称的缩写,按照意思即可记忆
- 指令的后缀代表特殊的含义,例如
i
代表立即数,u
代表无符号数
6 流程控制
- 条件分支的比较,被内嵌到了指令之中
branches
:
b target # unconditional branch to program label target # 无条件跳转到程序标签targetbeq $t0,$t1,target # branch to target if $t0 = $t1 # 如果$t0 = $t1,就跳转到target标签# 下面的同理,不再一一翻译blt $t0,$t1,target # branch to target if $t0 < $t1
ble $t0,$t1,target # branch to target if $t0 <= $t1
bgt $t0,$t1,target # branch to target if $t0 > $t1
bge $t0,$t1,target # branch to target if $t0 >= $t1
bne $t0,$t1,target # branch to target if $t0 <> $t1
译者注:这里的指令,都是英文全称,比如
beq
就是branch equal
,其余的读者自行查阅。
jumps
:
j target # unconditional jump to program label target # 无条件跳转到程序标签targetjr $t3 # jump to address contained in $t3 ("jump register")# 跳转到某地址,地址的值在寄存器$t3中
未完成
subroutine calls
:
subroutine call: “jump and link” instruction
jal sub_label # "jump and link"
subroutine return: “jump register” instruction
jr $ra # "jump register"
注意:
译者注:原文没有解释程序标签
target
,译者在这里补充一下
我给出你MIPS源程序的.text
部分,我们知道,程序的入口是main
标签,事实上,还可以类似地定义很多标签,跳转指令中的target
指的就是这些,以下为示例:
.text # 程序代码部分 main: <代码 1>j target_1 # 无条件地跳转到标签target_1的位置# 再从该位置继续向下执行<代码 2>target_1:<代码 2>target_2:<代码 3>
……
7 系统调用与I/O(SPIM模拟器[1])
译者注:
[1] MARS模拟器兼容了一部分SPIM的系统调用,基本是够用的,依然推荐使用MARS模拟器。