Exynos4412 内核移植(四)—— MMU 相关知识解析

一、MMU的产生

      许多年以前,当人们还在使用DOS或是更古老的操作系统的时候,计算机的内存还非常小,一般都是以K为单位进行计算,相应的,当时的程序规模也不大,所以内存容量虽然小,但还是可以容纳当时的程序。但随着图形界面的兴起还用用户需求的不断增大,应用程序的规模也随之膨胀起来,终于一个难题出现在程序员的面前,那就是应用程序太大以至于内存容纳不下该程序,通常解决的办法是把程序分割成许多称为覆盖块(overlay)的片段。覆盖块0首先运行,结束时他将调用另一个覆盖块。虽然覆盖块的交换是由OS完成的,但是必须先由程序员把程序先进行分割,这是一个费时费力的工作,而且相当枯燥。人们必须找到更好的办法从根本上解决这个问题。不久人们找到了一个办法,这就是 虚拟存储器(virtual memory) .虚拟存储器的基本思想是程序,数据,堆栈的总的大小可以超过物理存储器的大小,操作系统把当前使用的部分保留在内存中,而把其他未被使用的部分保存在磁盘上比如对一个16MB的程序和一个内存只有4MB的机器,OS通过选择,可以决定各个时刻将哪4M的内容保留在内存中,并在需要时在内存和磁盘间交换程序片段,这样就可以把这个16M的程序运行在一个只具有4M内存机器上了。而这个16M的程序在运行前不必由程序员进行分割。

      任何时候,计算机上都存在一个程序能够产生的地址集合,我们称之为 地址范围 。这个范围的大小由CPU的位数决定,例如一个32位的CPU,它的地址范围是0~0xFFFFFFFF (4G)而对于一个64位的CPU,它的地址范围为0~0xFFFFFFFFFFFFFFFF (64T),这个范围就是我们的程序能够产生的地址范围,我们把这个地址范围称为 虚拟地址空间 ,该空间中的某一个地址我们称之为 虚拟地址 。与虚拟地址空间和虚拟地址相对应的则是 物理地址空间和物理地址 ,大多数时候我们的系统所具备的物理地址空间只是虚拟地址空间的一个子集,这里举一个最简单的例子直观地说明这两者,对于一台内存为256MB的32bit x86主机来说,它的虚拟地址空间范围是0~0xFFFFFFFF(4G),而物理地址空间范围是0x000000000~0x0FFFFFFF(256MB)。

     在没有使用虚拟存储器的机器上,虚拟地址被直接送到内存总线上,使具有相同地址的物理存储器被读写。而在使用了虚拟存储器的情况下,虚拟地址不是被直接送到内存地址总线上,而是送到内存管理单元—— MMU (主角终于出现了)。他由一个或一组芯片组成,一般存在与协处理器中,其功能是 把虚拟地址映射为物理地址
 


二、MMU工作过程

      大多数使用虚拟存储器的系统都使用一种称为分页(paging)。虚拟地址空间划分成称为页(page)的单位,而相应的物理地址空间也被进行划分,单位是页框(frame).页和页框的大小必须相同。接下来配合图片我以一个例子说明页与页框之间在MMU的调度下是如何进行映射的:


       这里提到了一个概念,就是 页表,下面将详细介绍 页表。


三、页表

         首先让我们来介绍一个概念-页表(page table)。页表就是存储在内存中的一张表,表中记录了将虚拟地址转换成物理地址的关键信息。MMU正是通过对页表进行查询,实现了地址之间的转换。也就是说,MMU每次工作的时候都要去查这张表,从中找出与虚拟地址相对应的物理地址,然后再进行数据存取。页表的作用如下图所示



       页表中的条目被称为页表项(page table entry),一个页表项负责记录一段虚拟地址到物理地址的映射关系,稍后我们会详细介绍。

       既然页表是存储在内存中的,那么程序每次完成一次内存读取时都至少会访问内存两次,相比于不使用MMU时的一次内存访问,效率被大大降低了,如果所使用的内存的性能比较差的话,这种效率的降低将会更明显。因此,如何在发挥MMU优势的同时使系统消耗尽量减小,就成为了一个亟待解决的问题。

     于是,TLB产生了。TLB是什么呢?我们叫它转换旁路缓冲器,它实际上是MMU中临时存放转换数据的一组重定位寄存器。既然TLB本质上是一组寄存器,那么不难理解,相比于访问内存中的页表,访问TLB的速度要快很多。因此如果页表的内容全部存放于TLB中,就可以解决访问效率的问题了。

         然而,由于制造成本等诸多限制,所有页表都存储在TLB中几乎是不可能的。这样一来,我们只能通过在有限容量的TLB中存储一部分最常用的页表,从而在一定程度上提高MMU的工作效率。

        这一方法能够产生效果的理论依据叫做存储器访问的局部性原理。它的意思是说,程序在执行过程中访问与当前位置临近的代码的概率更高一些。因此,从理论上我们可以说,TLB中存储了当前时间段需要使用的大多数页表项,所以可以在很大程度上提高MMU的运行效率。

       让我们接着聊页表。页表是由页表项组成的,每一个页表项都能够将一段虚拟地址空间映射到一段物理地址空间中。这里所谓的这段虚拟地址空间,更专业地讲,应该叫页,一个页对应了页表中的一项,页的大小通常是可选的。在ARM中,一个页可以被配置成1K、4K、64K或1M大小(ARM v6体系以后,不再支持1K大小的页),分别叫做微页、小页、大页和段页。页的大小决定了映射的粒度,是根据实际应用有选择地配置的。以1M为例,按照我们前面的描述,假设系统中将有64M内存需要被映射,那么我们一共需要64M/1M个页表项,而每个页表项需要占据4个字节,也就是说,有256字节的内存要专门负责地址映射,不能用于其他用途。

       对于1K、4K和64K大小的页,MMU采用二级查表的方法,即首先由虚拟地址索引出第一张表的某一段内容,然后再根据这段内容搜索第二张表,最后才能确定物理地址。这里的第一张表,我们叫它一级页表,第二张表被称为是二级页表采用二级查表法的主要目的是减小页表自身占据的内存空间,但缺点是进一步降低了内存的寻址效率。不同大小的页对查表方法的支持程度如表3-1所示。

表3-1  不同大小页的查表方法

 

页大小

查表方法

1K

4K

64K

1M

一级查表

不支持

不支持

不支持

支持

二级查表

支持

支持

支持

不支持




下面,首先来研究一下相对简单的一级查表。

1、一级查表

       一级查表只支持大小为1M的页。准确地讲,这里所谓的1M大小的页,应称为段(section)。此时,一级页表也被称为段页表。图3-4描述了段页表的内存分布情况和段页表项的具体格式。


                                                            图3-4  段页表项的结构


          段页表中的每一项都类似于上图中的形式,其中:

      (1)31~20位段表示物理地址的基地址,一共12位,也就是说,如果我们通过虚拟地址找到某一个段页表项,那么就可以确定这段虚拟地址所对应的物理地址的高12位了。因为段页表项后20位正好可以描述1M的内存,因此基地址每增加一个单位,物理地址就会增加1M空间。所以,我们也可以说该基地址表示了虚拟地址属于哪1M范围的物理地址。由此可知,使用段页表进行地址映射时,每一页能够描述1M的物理地址空间。进一步讲,段页表最多支持1024个页,最多占用系统4K字节的内存来存放页表。

      (2)11~10位是AP位,区分了用户模式和特权模式对同一个页的不同访问权限。例如,当AP位为"11"时,表示任何模式下都可以对该空间进行读写,"10"则表示特权模式可读写该页,而用户模式只能读取该页。对AP位详细的描述请参考页权限一节。

      (3)8~5位代表该页所属的域。在ARM体系结构中,系统中规定了16个域,因此使用4个位就能表示该页属于哪个域,而每一个域又有各自独立的访问权限,从而实现了初级的存储器保护。

      (4)3位和2位分别代表cache和write buffer。相应的位为1则表示被映射的物理地址将使用cache或write buffer。关于cache和write buffer的有关内容,我们稍后会详述。

      (5)1~0位。这两位用来区分页表类型,对于段页表,这两位的值总是为"10"。

        总的来说,段页表项的内容虽然复杂,但归结起来无非就是两个问题,一是,如何解决某一虚拟地址属于哪段物理地址,二是,如何确定这段地址的访问权限。使用其他形式的页表,本质上也是要解决这两个问题。

     

       现在,假设段页表已经被成功地添加到内存之中了,那么接下来的问题是我们应该怎样通过一个虚拟地址找到与之对应的段页表项呢找到页表项之后,又是怎样找到对应的物理地址的呢?

      很显然,虚拟地址本身就可以解决上述问题。

      如下图所示,首先,我们要让MMU知道段页表在内存中的首地址,也就是图中所说的页表基地址,因为段页表是我们通过程序确定的,存储在什么位置程序员自然清楚。然后,在CPU需要寻址的时候,MMU就可以自动地利用页表将虚拟地址映射为物理地址并寻址物理地址,其步骤如下:

    (1)MMU取出虚拟地址的前12位作为页表项的偏移,结合页表基地址,找到对应的页表项。具体来说,就是将这12位数取出,然后左移两位和页表基地址相,就能得到相应页表项的地址了。例如,页表基地址是0x10000000,如果虚拟地址是0x00101000,则前12位数是0x001,那么根据上述步骤将其左移两位,结果为0x004,那么页表项地址就应该是0x10000000|0x004=0x10000004,从该地址中读取的32位的数据即是该虚拟地址所对应的页表项。

     (2)找到与虚拟地址对应的页表项之后,就可以从该页表项中读出一个重要信息,如图3-4所示,页表项的前12位定位了该虚拟地址所对应的物理地址在哪个范围内。例如,从0x10000004中读出的页表项的内容为0x30000c12,那么我们就已经知道了,虚拟地址0x00101000对应的物理地址在0x30000000与0x30100000之间。既然地址范围已经清楚了,那么虚拟地址又该定位到该范围的哪个位置呢?这就要靠虚拟地址的后20位了。

图3-5  段页表映射过程


        3)MMU将虚拟地址后20位和页表项内容清除掉后20位之后的结果做与的操作,就得到了与虚拟地址对应的实际物理地址了。例如,页表项的内容为0x30000c12,清除掉后20位的结果为0x30000000,虚拟地址的后20位为0x01000,将其和0x30000000相与,结果为0x30001000,这便是最终的物理地址。

      当然,MMU在进行地址映射期间,还要进行访问权限的检查,方法是读出页表项的权限位,按照既定规则去检查,如果允许对该地址进行访问则正常访问,如果不允许访问,则抛出异常,通过程序将其捕获并处理。这便是使用段页表时MMU的地址映射过程。


:viraddr是0xc000 0000 映射 phyaddr 0x2000 000




2、二级页表:

       可以让我们访问的内不是连续的

       我们也可以选择使用二级查表的方式去实现地址映射。从原理上讲,一级查表和二级查表其实并没有太大的差别。使用二级查表法,经过一级页表得到的数据不再是记录了物理地址信息的数据了,而是二级页表项的索引信息。而这些信息除了相应位和标志与一级页表项略有不同之外,与一级查表并无不同。



线性地址高10---------索引页目录表----------->找到相应页表

线性地址中间10---------索引页表----------->得到页表中相应的项,其中的高20位就是物理地址的高20

线性地址低12-------------------->物理地址的低12

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/402097.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Mysql limit 子查询

为什么80%的码农都做不了架构师?>>> (1)mysql limit 不支持子查询像下面这条语句无法执行 SELECT * FROM b_c_s1 where CT_ID IN (SELECT DISTINCT CT_ID FROM b_c_s1 LIMIT 0,2); (2)应该在只查询外面再…

Exynos4412 内核移植(二)—— 内核编译过程分析

内核的编译同样是从Makefile 来分析: 一、内核源码结构 Linux内核文件数目近2万,出去其他架构CPU的相关文件,他们分别位于顶层目录下的17个子目录,各个目录功能独立,下面是常用目录: arch:体系结构相关代码…

深入理解Java:注解(Annotation)

2019独角兽企业重金招聘Python工程师标准>>> 一、概述 1.什么是注解(Annotation) Annotation(注解)就是Java提供了一种元程序中的元素关联任何信息和着任何元数据(metadata)的途径和方法。Ann…

Exynos4412 内核移植(三)—— 内核启动过程分析

内核启动所用函数如下: 与移植U-Boot 的过程相似,在移植Linux 之前,先了解它的启动过程。Linux 的过程可以分为两部分:架构/开发板相关的引导过程、后续的通用启动过程。对于uImage、zImage ,它们首先进行自解压得到vmlinux &…

开源自己用python封装的一个Windows GUI(UI Automation)自动化工具,支持MFC,Windows Forms,WPF,Metro,Qt...

首先,大家可以看下这个链接 Windows GUI自动化测试技术的比较和展望 。 这篇文章介绍了Windows中GUI自动化的三种技术:Windows API, MSAA - Microsoft Active Accessibility, UIAutomation 用脚本语言AutoIT实现自动化就是第一种技术Windows API, 查找窗…

Exynos4412 Uboot 移植(六)—— 相关知识补充

Uboot版本:u-boot-2013.01 一、gd结构体的定义与使用 gd_t 和 bd_t 是u-boot中两个重要的数据结构,在初始化操作很多都要靠这两个数据结构来保存或传递。 gd_t 定义在/u-boot-2013.01/arch/arm/include/asm/global_data.h bd_t 定义在 ./include/asm-ar…

Exynos4412 Uboot 移植(五)—— Uboot 移植过程

Uboot 版本:u-boot-2013.01 开发板:FS_4412 平台(Exynos4412,可以根据自己的板子修改,只要是4412的过程都是一样的) 一、建立自己的平台 1、下载源码 我们可以在下面这个网站上下载最新的和以前任一版本的uboot ftp://…

Nagios 安装及常见错误

一、实验环境监控服务器(nagios服务器--192.168.1.100)CentOS5.4 nagios-3.2.1 nagios-plugins-1.4.14 nrpe-2.12被监控客户端(linux客户端--192.168.1.200)CentOS5.4 nagios-plugins-1.4.14 nrpe-2.12二、nrpe插件1、nrpe插…

Exynos4412 Uboot 移植(四)—— Uboot引导内核过程分析

bootloader 要想启动内核,可以直接跳到内核的第一个指令处,即内核的起始地址,这样便可以完成内核的启动工作了。但是要想启动内核还需要满足一些条件,如下所示: 1、cpu 寄存器设置 * R0 0 * R1 机器类型 id …

Exynos4412 Uboot 移植(三)—— Uboot添加自定义命令

Uboot添加自定义命令:uboot中的命令使用U_BOOT_CMD这个宏声明来注册进系统,链接脚本会把所有的cmd_tbl_t结构体放在相邻的地方。 UBoot版本:u-boot-2013.01 一、U-Boot命令的格式 即使是内核的启动,也是通过U-Boot命令来实现的。…

Exynos4412 Uboot 移植(二)—— Uboot 启动流程分析

uboot启动流程分析如下: 第一阶段: a -- 设置cpu工作模式为SVC模式 b -- 关闭中断,mmu,cache v -- 关看门狗 d -- 初始化内存,串口 e -- 设置栈 f -- 代码自搬移 g -- 清bss h -- 跳c 第二阶段 a -- 初始化外设,进入超…

Linux内核学习四库全书

http://blog.csdn.net/21aspnet/article/details/6585602 关于内核学习我建议不要上来就读内核而是先了解内核的构成和特性,然后通过思考发现疑问这时再去读内核源码。即先了解概貌在读局部细节。而且内核分成好多部分,不要只是按照顺序去读,…

Exynos4412 Uboot 移植(一)—— Uboot 编译流程分析

Uboot 所用版本 u-boot-2013.01 u-boot-2013.01 中有上千文件,要想了解对于某款开发板,使用哪些文件、哪些文件首先执行、可执行文件占用内存的情况,最好的方法就是阅读它的Makefile。 根据顶层Readme文件的说明: 可以知道如果使…

Exynos4412 所用内存 —— DDR2

一、SDRAM 二、DDR 三、DDR2 四、DDR2的配置

Exynos4412启动过程分析

学习Exynos4412启动流程前,我们先看看三星4412芯片启动框图: 我们从图中可以看到4412内部有64K的ROM和256K SRAM,在ROM中已经固化好了一段代码,当硬件上电后首先运行的就是这段代码,这段代码三星起名为BLO(…

Exynos4412 所用外存 —— eMMC

Exynos4412所用外存不是原来的Nand Flash 与 Nor Flash,而是eMMC。eMMC是什么呢?和Nand Flash有什么区别呢? 一、eMMC概述 eMMC(Embeded MultiMedia Card):它并非是一种全新尺寸的存储卡,而…

mini-uboot 启动过程简单分析

单片机有最小系统,所谓最小系统,就是单片机能正常工作所需要的最少外设。对于Uboot来说,同样有个最小系统,因为Uboot最主要的功能就是引导内核。下面我们通过一个简单的Mini-Uboot来分析Uboot的启动加载过程。(只是分析…

MySql中的varchar类型

2019独角兽企业重金招聘Python工程师标准>>> MySql中的varchar类型(转) 今天新开始的项目在做数据库设计,发现自己对MySql的varchar类型还不熟悉,故又上网收集资料整理如下。 1.varchar类型的变化 MySQL 数据库的va…

进入保护模式(三)内存的分页

2019独角兽企业重金招聘Python工程师标准>>> 一、分页 先入为主理解的分页和系统中内存内应的分页 1.弄过数据库数据查找展示,有个数据分页展示的概念,这个的目的是为了速度、和展示效果上的提升 2.内存的分页又是怎么回事哪? …

C#实现简单的 Ping 的功能,用于测试网络是否已经联通

1 /// <summary>2 /// 是否能 Ping 通指定的主机3 /// </summary>4 /// <param name"ip">ip 地址或主机名或域名</param>5 /// <returns>true 通&#xff0c;false 不通</returns>6 …