今天来扒一扒X86汇编指令(IA-32指令),首先看看它的概念:
IA-32(Intel Architecture 32bit,英特尔32位体系架构)[1] ,属于X86体系结构的32位版本,即具有32位内存地址和32位数据操作数的处理器体系结构,从1985年面世的80386直到Pentium 4,都是使用IA-32体系结构的处理器。
一、IA-32指令的格式简介
可以看到一条完整的IA-32指令由6个部分组成,分别是:指令前缀:(prefixes)、操作码(Opcode)、modr/m字节、SIB(Scale-Index-Base)、位移(Displacement)、立即数(immediate),其中除了操作码(Opcode)是必须存在的,其他都是可选的,下面分别举例说明,具体解析比较复杂,需要参考IA-32指令手册。
1、指令前缀:(prefixes)
指令前缀长度‘1’个字节
2、操作码(Opcode)
3、ModR/M字节
ModR/M是可选项,用于辅助说明操作码的操作数(操作数的个数、种类[寄存器、地址、常量])
4、SIB(Scale-Index-Base)
用于辅助说明ModR/M,操作码的操作数为内存时,需要ModR/M项一起使用
5、位移(Displacement)
操作码的操作数为内存时,用来表示位移操作
6、立即数(immediate)
操作码的操作数为常量时,该常量就被称为立即数
二、常见汇编指令
———————–算数运算指令——————-
ADD 加法
ADC 带位加法
SBB 带位减法
SUB 减法.
INC 加法.
NEC 求反(以0减之).
NEG 求反然后加1,假如NEG AL相当于Not AL; INC AL
CMP 比较.(两操作数作减法,仅修改标志位,不回送结果).
———————–逻辑运算指令——————–
AND 与运算.
OR 或运算.
XOR 异或运算.
NOT 取反.
TEST 测试.(两操作数作与运算,仅修改标志位,不回送结果).
SHL 逻辑左移.
SHR 逻辑右移.
SAL 算术左移.(=SHL)
SAR 算术右移. (左移是一样的,右移是不同的.逻辑右移补0,算术右移补最高位)
ROL 循环左移. ( ((unsigned char)a) << 5 ) | ( ((unsigned
RCL 通过进位的循环左移.
RCR 通过进位的循环右移.
以上八种移位指令,其移位次数可达255次.
移位一次时, 可直接用操作码. 如 SHL AX,1.
移位>1次时, 则由寄存器CL给出移位次数.
如 MOV CL,04
SHL AX,CL
———————–数据转移指令——————–
1. 通用数据传送指令.
MOV 传送字或字节.
MOVSX 先符号扩展,再传送.
MOVZX 先零扩展,再传送.
PUSH 把字压入堆栈.
POP 把字弹出堆栈.
PUSHA 把AX,CX,DX,BX,SP,BP,SI,DI依次压入堆栈.
POPA 把DI,SI,BP,SP,BX,DX,CX,AX依次弹出堆栈.
PUSHAD 把EAX,ECX,EDX,EBX,ESP,EBP,ESI,EDI依次压入堆栈.
POPAD 把EDI,ESI,EBP,ESP,EBX,EDX,ECX,EAX依次弹出堆栈.
BSWAP 交换32位寄存器里字节的顺序
XCHG 交换字或字节.( 至少有一个操作数为寄存器,段寄存器不可作为操作数)
CMPXCHG 比较并交换操作数.( 第二个操作数必须为累加器AL/AX/EAX )
XADD 先交换再累加.( 结果在第一个操作数里 )
XLAT 字节查表转换.
———————-目的地址传送指令————–
LEA 装入有效地址. 例: LEA DX,string ;把偏移地址存到DX.
LDS 传送目标指针,把指针内容装入DS. 例: LDS SI,string ;把段地址:偏移地址存到DS:SI.
LES 传送目标指针,把指针内容装入ES. 例: LES DI,string ;把段地址:偏移地址存到ES:DI.
LFS 传送目标指针,把指针内容装入FS. 例: LFS DI,string ;把段地址:偏移地址存到FS:DI.
LGS 传送目标指针,把指针内容装入GS. 例: LGS DI,string ;把段地址:偏移地址存到GS:DI.
LSS 传送目标指针,把指针内容装入SS. 例: LSS DI,string ;把段地址:偏移地址存到SS:DI.
———————– 标志传送指令——————-
LAHF 标志寄存器传送,把标志装入AH.
SAHF 标志寄存器传送,把AH内容装入标志寄存器.
PUSHF 标志入栈.
POPF 标志出栈.
PUSHD 32位标志入栈.
POPD 32位标志出栈.
0012F618 |00A8E5A8 ASCII “nk’MHBh30”
———————-程序转移指令 ——————–
1>无条件转移指令 (长转移)
JMP 无条件转移指令
32位系统的jmp指令分为jmp short 、jmp 、jmp far
jmp short (EB) ADDR=目的地址-源地址-指令长度
12=40110e-4010fa-2
jmp (E9) ADDR=目的地址-源地址-指令长度
2BA=4018c7-401608-5
jmp far (跨段跳转) ADDR=目的地址
此外还有一种跳转jmp dword prt+内存单元地址(段间转移)
上面提到的地址计算方法若结果为负则要用补码表示,下面给出计算方法
一、原码(在数值前直接加一符号位的表示法,0为正,1为负)
二、反码(负数的反码,符号位为“1”,数值部分根据原码按位取反)
三、补码(负数的补码则是符号位为“1”,数值部分按位取反后再在末位(最低位)加1.也就是“反码+1”.)
CALL 过程调用 (同 push eip 和jmp 目的地址)
RET=pop eip
RETN=pop eip ,add esp,n
JA/JNBE 不小于或不等于时转移.
JAE/JNB 大于或等于转移.
JB/JNAE 小于转移.
JBE/JNA 小于或等于转移.
以上四条,测试无符号整数运算的结果(标志C和Z).
JG/JNLE 大于转移.
JGE/JNL 大于或等于转移.
JL/JNGE 小于转移.
JLE/JNG 小于或等于转移.
以上四条,测试带符号整数运算的结果(标志S,O和Z).
JE/JZ 等于转移.
JNE/JNZ 不等于时转移.
JC 有进位时转移.
JNC 无进位时转移.
JNO 不溢出时转移.
JNP/JPO 奇偶性为奇数时转移.
JNS 符号位为 "0" 时转移.
JO 溢出转移.
JP/JPE 奇偶性为偶数时转移.
JS 符号位为 "1" 时转移.
JA/JNBE 不小于或不等于时转移.
JAE/JNB 大于或等于转移.
JB/JNAE 小于转移.
JBE/JNA 小于或等于转移.
以上四条,测试无符号整数运算的结果(标志C和Z).
JG/JNLE 大于转移.
JGE/JNL 大于或等于转移.
JL/JNGE 小于转移.
JLE/JNG 小于或等于转移.
以上四条,测试带符号整数运算的结果(标志S,O和Z).
JE/JZ 等于转移.
JNE/JNZ 不等于时转移.
JC 有进位时转移.
JNC 无进位时转移.
JNO 不溢出时转移.
JNP/JPO 奇偶性为奇数时转移.
JNS 符号位为 "0" 时转移.
JO 溢出转移.
JP/JPE 奇偶性为偶数时转移.
JS 符号位为 "1" 时转移.
3>循环控制指令(短转移)
LOOP CX不为零时循环.
LOOPE/LOOPZ CX不为零且标志Z=1时循环.
LOOPNE/LOOPNZ CX不为零且标志Z=0时循环.
JCXZ CX为零时转移.
JECXZ ECX为零时转移.
4>中断指令
INT 中断指令
INTO 溢出中断
IRET 中断返回
5>处理器控制指令
HLT 处理器暂停, 直到出现中断或复位信号才继续.
WAIT 当芯片引线TEST为高电平时使CPU进入等待状态.
ESC 转换到外处理器.
LOCK 封锁总线.
NOP 空操作.
STC 置进位标志位.
CLC 清进位标志位.
CMC 进位标志取反.
STD 置方向标志位.
CLD 清方向标志位.
STI 置中断允许位.
CLI 清中断允许位.
———————--串指令-———————-
DS:SI 源串段寄存器 :串变址.
ES:DI 目标串段寄存器:串变址.
CX 重复次数计数器.
AL/AX 扫描值.
D标志 0表示重复操作中SI和DI应自动增量; 1表示应自动减量.
Z标志 用来控制扫描或比较操作的结束.
cld 将DF置为0
std 将DF置为1
MOVS 串传送.
( MOVSB 传送字符。将ds:si指向的内存单元中的字节送入es:di中,然后根据DF的标志将si和di的值增或减(0增1减)
MOVSW 传送字。 将ds:si指向的内存单元中的字节送入es:di中,然后根据DF的标志将si和di的值增或减(0增1减)
MOVSD 传送双字. ) 经常这么用rep movsb相当于s:movsb ; loop s
CMPS 串比较.
( CMPSB 比较字符. CMPSW 比较字. )
SCAS 串扫描. 把AL或AX的内容与目标串作比较,比较结果反映在标志位.
LODS 装入串. 把源串中的元素(字或字节)逐一装入AL或AX中.
( LODSB 传送字符. LODSW 传送字. LODSD 传送双字. )
STOS 保存串.是LODS的逆过程.
REP 当CX/ECX<>0时重复.
REPE/REPZ 当ZF=1或比较结果相等,且CX/ECX<>0时重复.
REPNE/REPNZ 当ZF=0或比较结果不相等,且CX/ECX<>0时重复.
REPC 当CF=1且CX/ECX<>0时重复.
REPNC 当CF=0且CX/ECX<>0时重复.
———————–伪指令———————–
DW 定义字(2字节).
PROC 定义过程.
ENDP 过程结束.
SEGMENT 定义段.
ASSUME 建立段寄存器寻址.
ENDS 段结束.
END 程序结束.
三、内存寻址机制
80386内存寻址不同于8086的寻址机制,由于80386及以后的CPU内存分页机制和保护模式的加入,使之相比实模式的寻址变的复杂。
8086实模式寻址方式为段地址*16+偏移地址,如xxxx:yyyy格式的虚拟地址在内存中的实际位置是xxxx*16+yyyy。
而80386以后由于寄存器达到32位以上,可以直接寻址2^32=4G的内存地址,于是寻址不在依赖段+偏移地址的模式,而段寄存器用来存储段选择器(Segment Seletor),段选择器用于找到段描述符,在描述符表(Descriptor Table)里面记录着每个段的安全属性,系统所有任务的段描述符存在全局描述符GDT(Global Descriptor Table)中,由全局描述符寄存器GDTR指向,每个任务自己的段描述符存在于局部描述符表LDT(Local Descriptor Table)中,由局部描述符寄存器LDTR指向,具体寻址方式在另外一篇文中有详细介绍,再来看看16位系统(DOS)和32位系统的内存安排情况对比:
DOS内存安排
32内存安排
https://blog.csdn.net/qq_20977145/article/details/52682526