Exynos4412 内核移植（四）—— MMU 相关知识解析

一、MMU的产生

许多年以前，当人们还在使用DOS或是更古老的操作系统的时候，计算机的内存还非常小，一般都是以K为单位进行计算，相应的，当时的程序规模也不大，所以内存容量虽然小，但还是可以容纳当时的程序。但随着图形界面的兴起还用用户需求的不断增大，应用程序的规模也随之膨胀起来，终于一个难题出现在程序员的面前，那就是应用程序太大以至于内存容纳不下该程序，通常解决的办法是把程序分割成许多称为覆盖块（overlay）的片段。覆盖块0首先运行，结束时他将调用另一个覆盖块。虽然覆盖块的交换是由OS完成的，但是必须先由程序员把程序先进行分割，这是一个费时费力的工作，而且相当枯燥。人们必须找到更好的办法从根本上解决这个问题。不久人们找到了一个办法，这就是虚拟存储器(virtual memory) .虚拟存储器的基本思想是程序，数据，堆栈的总的大小可以超过物理存储器的大小，操作系统把当前使用的部分保留在内存中，而把其他未被使用的部分保存在磁盘上比如对一个16MB的程序和一个内存只有4MB的机器，OS通过选择，可以决定各个时刻将哪4M的内容保留在内存中，并在需要时在内存和磁盘间交换程序片段，这样就可以把这个16M的程序运行在一个只具有4M内存机器上了。而这个16M的程序在运行前不必由程序员进行分割。

任何时候，计算机上都存在一个程序能够产生的地址集合，我们称之为地址范围。这个范围的大小由CPU的位数决定,例如一个32位的CPU，它的地址范围是0~0xFFFFFFFF (4G)而对于一个64位的CPU，它的地址范围为0~0xFFFFFFFFFFFFFFFF (64T),这个范围就是我们的程序能够产生的地址范围，我们把这个地址范围称为 虚拟地址空间 ，该空间中的某一个地址我们称之为虚拟地址。与虚拟地址空间和虚拟地址相对应的则是 物理地址空间和物理地址 ，大多数时候我们的系统所具备的物理地址空间只是虚拟地址空间的一个子集，这里举一个最简单的例子直观地说明这两者，对于一台内存为256MB的32bit x86主机来说，它的虚拟地址空间范围是0~0xFFFFFFFF(4G),而物理地址空间范围是0x000000000~0x0FFFFFFF（256MB）。

在没有使用虚拟存储器的机器上，虚拟地址被直接送到内存总线上，使具有相同地址的物理存储器被读写。而在使用了虚拟存储器的情况下，虚拟地址不是被直接送到内存地址总线上，而是送到内存管理单元—— MMU （主角终于出现了）。他由一个或一组芯片组成，一般存在与协处理器中，其功能是 把虚拟地址映射为物理地址 。

二、MMU工作过程

大多数使用虚拟存储器的系统都使用一种称为分页（paging）。虚拟地址空间划分成称为页（page）的单位，而相应的物理地址空间也被进行划分，单位是页框(frame).页和页框的大小必须相同。接下来配合图片我以一个例子说明页与页框之间在MMU的调度下是如何进行映射的：

这里提到了一个概念，就是页表，下面将详细介绍页表。

三、页表

首先让我们来介绍一个概念-页表（page table）。页表就是存储在内存中的一张表，表中记录了将虚拟地址转换成物理地址的关键信息。MMU正是通过对页表进行查询，实现了地址之间的转换。也就是说，MMU每次工作的时候都要去查这张表，从中找出与虚拟地址相对应的物理地址，然后再进行数据存取。页表的作用如下图所示。

页表中的条目被称为页表项（page table entry），一个页表项负责记录一段虚拟地址到物理地址的映射关系，稍后我们会详细介绍。

既然页表是存储在内存中的，那么程序每次完成一次内存读取时都至少会访问内存两次，相比于不使用MMU时的一次内存访问，效率被大大降低了，如果所使用的内存的性能比较差的话，这种效率的降低将会更明显。因此，如何在发挥MMU优势的同时使系统消耗尽量减小，就成为了一个亟待解决的问题。

于是，TLB产生了。TLB是什么呢？我们叫它转换旁路缓冲器，它实际上是MMU中临时存放转换数据的一组重定位寄存器。既然TLB本质上是一组寄存器，那么不难理解，相比于访问内存中的页表，访问TLB的速度要快很多。因此如果页表的内容全部存放于TLB中，就可以解决访问效率的问题了。

然而，由于制造成本等诸多限制，所有页表都存储在TLB中几乎是不可能的。这样一来，我们只能通过在有限容量的TLB中存储一部分最常用的页表，从而在一定程度上提高MMU的工作效率。

这一方法能够产生效果的理论依据叫做存储器访问的局部性原理。它的意思是说，程序在执行过程中访问与当前位置临近的代码的概率更高一些。因此，从理论上我们可以说，TLB中存储了当前时间段需要使用的大多数页表项，所以可以在很大程度上提高MMU的运行效率。

让我们接着聊页表。页表是由页表项组成的，每一个页表项都能够将一段虚拟地址空间映射到一段物理地址空间中。这里所谓的这段虚拟地址空间，更专业地讲，应该叫页，一个页对应了页表中的一项，页的大小通常是可选的。在ARM中，一个页可以被配置成1K、4K、64K或1M大小（ARM v6体系以后，不再支持1K大小的页），分别叫做微页、小页、大页和段页。页的大小决定了映射的粒度，是根据实际应用有选择地配置的。以1M为例，按照我们前面的描述，假设系统中将有64M内存需要被映射，那么我们一共需要64M/1M个页表项，而每个页表项需要占据4个字节，也就是说，有256字节的内存要专门负责地址映射，不能用于其他用途。

对于1K、4K和64K大小的页，MMU采用二级查表的方法，即首先由虚拟地址索引出第一张表的某一段内容，然后再根据这段内容搜索第二张表，最后才能确定物理地址。这里的第一张表，我们叫它一级页表，第二张表被称为是二级页表。采用二级查表法的主要目的是减小页表自身占据的内存空间，但缺点是进一步降低了内存的寻址效率。不同大小的页对查表方法的支持程度如表3-1所示。

表3-1 不同大小页的查表方法

	页大小
查表方法	1K	4K	64K	1M
一级查表	不支持	不支持	不支持	支持
二级查表	支持	支持	支持	不支持

下面，首先来研究一下相对简单的一级查表。

1、一级查表

一级查表只支持大小为1M的页。准确地讲，这里所谓的1M大小的页，应称为段（section）。此时，一级页表也被称为段页表。图3-4描述了段页表的内存分布情况和段页表项的具体格式。

图3-4 段页表项的结构

段页表中的每一项都类似于上图中的形式，其中：

（1）31~20位段表示物理地址的基地址，一共12位，也就是说，如果我们通过虚拟地址找到某一个段页表项，那么就可以确定这段虚拟地址所对应的物理地址的高12位了。因为段页表项后20位正好可以描述1M的内存，因此基地址每增加一个单位，物理地址就会增加1M空间。所以，我们也可以说该基地址表示了虚拟地址属于哪1M范围的物理地址。由此可知，使用段页表进行地址映射时，每一页能够描述1M的物理地址空间。进一步讲，段页表最多支持1024个页，最多占用系统4K字节的内存来存放页表。

（2）11~10位是AP位，区分了用户模式和特权模式对同一个页的不同访问权限。例如，当AP位为"11"时，表示任何模式下都可以对该空间进行读写，"10"则表示特权模式可读写该页，而用户模式只能读取该页。对AP位详细的描述请参考页权限一节。

（3）8~5位代表该页所属的域。在ARM体系结构中，系统中规定了16个域，因此使用4个位就能表示该页属于哪个域，而每一个域又有各自独立的访问权限，从而实现了初级的存储器保护。

（4）3位和2位分别代表cache和write buffer。相应的位为1则表示被映射的物理地址将使用cache或write buffer。关于cache和write buffer的有关内容，我们稍后会详述。

（5）1~0位。这两位用来区分页表类型，对于段页表，这两位的值总是为"10"。

总的来说，段页表项的内容虽然复杂，但归结起来无非就是两个问题，一是，如何解决某一虚拟地址属于哪段物理地址，二是，如何确定这段地址的访问权限。使用其他形式的页表，本质上也是要解决这两个问题。

现在，假设段页表已经被成功地添加到内存之中了，那么接下来的问题是我们应该怎样通过一个虚拟地址找到与之对应的段页表项呢？找到页表项之后，又是怎样找到对应的物理地址的呢？

很显然，虚拟地址本身就可以解决上述问题。

如下图所示，首先，我们要让MMU知道段页表在内存中的首地址，也就是图中所说的页表基地址，因为段页表是我们通过程序确定的，存储在什么位置程序员自然清楚。然后，在CPU需要寻址的时候，MMU就可以自动地利用页表将虚拟地址映射为物理地址并寻址物理地址，其步骤如下：

（1）MMU取出虚拟地址的前12位作为页表项的偏移，结合页表基地址，找到对应的页表项。具体来说，就是将这12位数取出，然后左移两位和页表基地址相或，就能得到相应页表项的地址了。例如，页表基地址是0x10000000，如果虚拟地址是0x00101000，则前12位数是0x001，那么根据上述步骤将其左移两位，结果为0x004，那么页表项地址就应该是0x10000000|0x004=0x10000004，从该地址中读取的32位的数据即是该虚拟地址所对应的页表项。

（2）找到与虚拟地址对应的页表项之后，就可以从该页表项中读出一个重要信息，如图3-4所示，页表项的前12位定位了该虚拟地址所对应的物理地址在哪个范围内。例如，从0x10000004中读出的页表项的内容为0x30000c12，那么我们就已经知道了，虚拟地址0x00101000对应的物理地址在0x30000000与0x30100000之间。既然地址范围已经清楚了，那么虚拟地址又该定位到该范围的哪个位置呢？这就要靠虚拟地址的后20位了。

图3-5 段页表映射过程

3）MMU将虚拟地址后20位和页表项内容清除掉后20位之后的结果做与的操作，就得到了与虚拟地址对应的实际物理地址了。例如，页表项的内容为0x30000c12，清除掉后20位的结果为0x30000000，虚拟地址的后20位为0x01000，将其和0x30000000相与，结果为0x30001000，这便是最终的物理地址。

当然，MMU在进行地址映射期间，还要进行访问权限的检查，方法是读出页表项的权限位，按照既定规则去检查，如果允许对该地址进行访问则正常访问，如果不允许访问，则抛出异常，通过程序将其捕获并处理。这便是使用段页表时MMU的地址映射过程。