简介
在计算机中,数据存储的介质一直在变化,从最早的穿孔纸带,到现在的固态硬盘。但存储的原理是一直没有变化的,在计算机中,我们所存储的数据,一直都是以二进制的形式被存储存在不同的介质中。
计算机用位 (bits) 来存储数据,每一位可以是两种状态之一:0或1,这就是二进制数字。而这种形式十分不方便记忆,所以,为了方便记忆,每个二进制数字,都可以转换为十六进制数字或十进制数字。
二进制 | 十六进制 | 十进制 |
0001 | $01 | 1 |
0010 | $02 | 2 |
0011 | $03 | 3 |
0100 | $04 | 4 |
0101 | $05 | 5 |
0110 | $06 | 6 |
0111 | $07 | 7 |
1000 | $08 | 8 |
1001 | $09 | 9 |
1010 | $0A | 10 |
1011 | $0B | 11 |
1100 | $0C | 12 |
1101 | $0D | 13 |
1110 | $0E | 14 |
1111 | $0F | 15 |
数据长度
在计算机中,最小的长度为位(bits),也是计算机中用来存储的基本单位。
当我们把8个位(bits),放到一起,那我们就得到了一个单字节(byte)的长度。
把两个单字节长度放到一起,就可以得到一个字 (word)的长度,或者叫双字节。
我们把两个字(word)放到一起,就可以得到一个长字 (long-word),或者叫四字节。
在街机游戏的逆向研究中,我们通常使用一个名为M68K的汇编语言,在这个汇编语言中,我们常用的数据长度就是这三种,分别用B,W,L来表示这三种数据的长度。而位的形式,在这个汇编中,也常常会使用。
长度 | 二进制 | 十六进制 |
字节 | 0010 1100 | 2C |
字 | 0010 1100 1111 0101 | 2C F5 |
长字 | 0010 1100 1111 0101 1001 1101 0111 0110 | 2C F5 9D 76 |
二进制存储原理
我们以最早的穿孔纸带为例,来说明数据是如何存储的:
位(bits) | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 | |||
10进制 | 16进制值 | ||||||||||
1 | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ① | $01 | ||
2 | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ① | ⓿ | $02 | ||
3 | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ① | ① | $03 | ||
4 | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ① | ⓿ | ⓿ | $04 | ||
5 | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ① | ⓿ | ① | $05 | ||
6 | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ① | ① | ⓿ | $06 | ||
7 | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ① | ① | ① | $07 | ||
8 | ⓿ | ⓿ | ⓿ | ⓿ | ① | ⓿ | ⓿ | ⓿ | $08 | ||
9 | ⓿ | ⓿ | ⓿ | ⓿ | ① | ⓿ | ⓿ | ① | $09 | ||
10 | ⓿ | ⓿ | ⓿ | ⓿ | ① | ⓿ | ① | ⓿ | $0A | ||
11 | ⓿ | ⓿ | ⓿ | ⓿ | ① | ⓿ | ① | ① | $0B | ||
12 | ⓿ | ⓿ | ⓿ | ⓿ | ① | ① | ⓿ | ⓿ | $0C | ||
13 | ⓿ | ⓿ | ⓿ | ⓿ | ① | ① | ⓿ | ① | $0D | ||
14 | ⓿ | ⓿ | ⓿ | ⓿ | ① | ① | ① | ⓿ | $0E | ||
15 | ⓿ | ⓿ | ⓿ | ⓿ | ① | ① | ① | ① | $0F | ||
16 | ⓿ | ⓿ | ⓿ | ① | ⓿ | ⓿ | ⓿ | ⓿ | $10 | ||
32 | ⓿ | ⓿ | ① | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | $20 | ||
128 | ① | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | ⓿ | $80 | ||
255 | ① | ① | ① | ① | ① | ① | ① | ① | $FF |
我们把纸带的每一行看成是一个字节的长度,在纸带中,用1来表示该位置已穿孔,代表该位为1。用0来表示该位置未穿孔,代表该位为0。这样,我们就把这些数据保存在了一个纸带上面。
而对于现代的比如硬盘,光盘,它们的存储原理是一样的,只是存储的介质发生了变化,硬盘是用磁性物质的S和N极代表示该位置为0和1,光盘是用一个个凹凸来表示该位置的0和1。
当然,因为二进制数值难于阅读和记忆,我们用各种工具软件,从中读出来的数据是已经被转换为了16进制数值。
助记符
因为我们从计算机中所读取到的数据都是二进制,我们基本上很难去阅读和记忆,所以,这时我们需要一个翻译器,把他们翻译成人类方便理解的方式。比如在m68K汇编中,会把读取到的比如:
0011 1101 0111 1100 0000 0000 0000 0101 0000 0000 1111 1100
3D 7C 00 05 00 FC
如果只查看二进制或十六进制数值,我们很难理解,这段数据有什么作用。所以,M68K把他翻译为一段方便阅读和记忆的助记符:
move.w #5,$FC(a6)
我们把这段助记符分成四个部份:
1、命令: - move ,代表了这句代码在程序中的作用
2、操作长度: - 指定该指令想要操作的数值长度,以B(字节),W(字),L(长字)表示
3、源操作数: - 表示了数据的从哪里读取
4、目的操作数: - 表示了数据在运算后会哪里会被修改或者操作