Bootloader:加载OS。操作系统一开始是放在DISK(硬盘)中,并不是放在内存中。
BIOS:基本I/O处理系统。存放在ROMRead-Only Memory)只读存储中
BIOS(Basic Input/Output System)基本输入输出系统。
首先我们需要知道,计算机加电之后,是从什么地方读取的第一条指令,从磁盘的什么地方读取的我的操作系统的内容,也就是计算机启动的过程是怎样的。
计算机加电后,首先是CPU的初始化过程,将各寄存器初始化,此时系统处于实模式下。我们要知道计算机内存分为两种,RAM(Random Access Memory)随机访问存储和ROM(Read-Only Memory)只读存储。其中RAM掉电内容会丢失(也就是我平时所理解的内存条内的内容比如),ROM掉电不会丢失内容。因此系统初始化代码就存储在ROM中。由于CPU初始化完成后处于实模式,寻址空间为20位也就是1M,因此系统初始化代码也就是BIOS启动固件是存储在1M之下,如下图。还需要知道的是,CPU初始化完后CS代码段寄存器与IP指令指针寄存器决定了第一条要执行的代码在ROM中的位置,而BIOS能提供的功能也列在下图之中:
- 基本输入输出的程序(从磁盘读数据、从键盘读输入、显示器上显示输出等);
- 系统设置信息(从硬盘启动还是从网络启动还是从U盘启动等);
- 开机后自检程序(检查内存显卡是否正常);
- 系统自启动程序(启动操作系统)等。
BIOS会根据设置执行启动程序,从磁盘把加载程序和操作系统内容加载到系统。首先BIOS将磁盘读引导扇区加载进指定位置0x7c00,引导扇区大小限制为512byte。此时跳转到CS:IP = 0000:7c00执行引导扇区的程序段,通过引导扇区的程序段跳转到读取操作系统的加载程序。加载程序主要有两个功能:
- 将操作系统的代码和数据从硬盘加载到内容中;
- 将控制权转移给操作系统,也就是CS:IP跳转到操作系统代码段,执行操作系统的功能。
那么问题来了,既然能读磁盘内容,为什么不直接将操作系统内核映像读取到内存空间而要先读取引导扇区的加载程序呢?这是因为不同的操作系统有不同的文件系统,也就需要不同的启动方式。而加载程序限制为512字节,无法覆盖所有类型的系统,因此首先将磁盘引导扇区内的程序加载进来,引导扇区内的程序可以识别并加载不同类型的系统内核到内存中(亦或是不同的系统有着不同的引导扇区,加载进来之后就知道是什么类型的系统了,至少学到现在还不知道,后续可能会有详细介绍吧)。此时控制权转移给操作系统内核。
除此之外BIOS还可以使用一些简单地系统调用,比如说:1. INT 10h:字符显示;2. INT 13h:磁盘扇区读写;3. INT 15h:检测内存大小;4. INT 16h:键盘输入。这些系统调用都只是最简单的系统调用,并且只能在实模式下访问。当进入操作系统并且操作系统是保护模式,那么这些功能就不能用了。
系统启动流程
上一节讲解系统调用的过程中粗略的讲了一下系统启动的流程,然而实际上系统地启动流程远没有那么简单,本节就稍微详细地讲解一下。但是实际上即使是这一节也无法十分详细讲解,只是让我们对系统启动的过程有一个整体的认识而已。
首先是BIOS读取加载程序的过程:系统加电后,CPU初始化,然后BIOS初始化硬件,然后查询主引导记录读取主引导扇区代码,这是由于现代计算机内通常不止有一个分区,不同分区内可能有不同的操作系统,而我们需要知道我们要启动的操作系统在哪个分区内(称为活动分区),这就是通过读取主引导记录实现的。知道活动分区之后将活动分区引导扇区内的代码读取到内存并执行,引导扇区内的代码读取文件系统的加载程序。这才是较为完整的读取加载程序的过程。
那么再详细一点讲,计算机上电后,首先是CPU初始化:CPU上电后,通过CS、IP两个寄存器知道从0XFFFF0地址读取第一条指令,这条指令是跳转指令,跳转到BIOS程序段。为什么是0XFFFF0呢,这是因为CPU上电后会初始化CS:IP = 0xf000:fff0。并且CPU初始化后处于实模式,也就是16位系统,20位寻址空间,是通过将CS左移4位与IP相加得到最终的地址因此指令指针PC = 16*CS+IP。20位寻址空间自然意味着最大寻址空间为2^20byte,即1M。
接下来是BIOS初始化:硬件自检(ROM等);检测内存(RAM)、显卡等关键部件是否存在,存在的话工作状态是否正常;查找并执行显卡等接口卡的BIOS(显卡等拥有自己的BIOS固件),对设备进行初始化;之后执行系统BIOS进行系统检测,主要是为了检测计算机有哪些即插即用设备,比如硬盘、光驱或者U盘;检查完之后更新CMOS中的扩展系统配置数据(ESCD)告知有哪些即插即用设备;之后就可以按照指定的启动顺序从软盘、硬盘或者光驱启动操作系统。
BIOS初始化完了,自然是要读取主引导记录。主引导记录(MBR)的格式如下图:启动代码限制为446字节以内,用于检查分区表的正确性、寻找活动分区并将活动分区引导程序加载到内存;还有64字节用于存储硬盘分区表,描述分区状态和位置,最多表示4个分区,每个分区16字节;还有一个MBR结束标志字(0x55AA),占2字节,只有有这个结束字才认为这条MBR是合法的MBR并执行启动代码。
当主引导记录读完并正确执行启动代码后,活动分区引导扇区的内容就被读入内存,分区引导扇区格式如下图:首先是跳转指令,这条跳转指令是与平台相关的,CPU不同则跳转指令不同,跳转至启动代码处;文件卷头结构则记录文件系统描述信息;结束标志也是0X55AA;启动代码则负责跳转到加载程序,加载程序不存储在引导扇区,而是存储在磁盘中,只要在启动代码中记录加载程序的位置即可。
活动分区引导扇区将加载程序读入内存之后,加载程序的执行状态如下图:加载程序并不是直接读取操作系统内核,而是从文件系统中读取启动配置信息;依据配置信息(不同的内核有不同的配置信息),确定启动的内核或启动参数(比如是安全模式启动还是正常模式启动);最后根据配置加载指定内核并转到内核执行,此时将控制权转移给了操作系统内核。
值的一提的是,以上所说为较早版本的系统启动流程,随着技术的发展,出现了UEFI(Unified Extensible Firmware Interface)统一可扩展固件接口,这是BIOS的接任者。里面有一些新的标准,比如MBR只能存储4个分区的方式逐渐被淘汰,现在出现了GPT(Globally Unique Identifier Partition Table)进行替代;UEFI可以选择启用哪些固件等。
中断、异常与系统调用
这一节讲解中断、异常与系统调用,这三者也可以总称为中断处理机制。首先我们需要知道这三个机制的背景:1. 计算机运行过程中,内核是被完全信任的第三方;2. 只有内核可以执行特权指令;3. 内核需要方便地为应用程序提供服务。
那么我们为什么需要这三个机制呢?也就是说这三个机制实现了什么功能呢?
中断是为了处理外设IO的,比如当我有一个新的键盘和鼠标接入了计算机,或者我们在键盘上敲了键盘,此时即使计算机正在进行其他任务也需要对此作出快速响应,这就是中断要做的事情;
当我程序运行中出现了异常,比如某个在分母上的变量运行过程中变为了0,也就是出现了除以0这种操作,这是不合法的,又比如说程序访问一块内存区,而这个内存区是不允许这个程序访问的,在运行到这一行程序之前我们无法预测这一异常,因此我们需要对这种异常有一种处理机制;
系统调用则是为上层的应用程序提供了各种接口,方便应用程序使用系统提供的服务,而又规避安全风险问题,即应用程序只使用提供给他的服务,而不会胡乱修改内核。
中断、异常与系统调用的结构图如下图:当有外部设备接入或者有输入,则告知内核(插入中断向量表),内核通过设备驱动与外部设备交互;当应用程序执行过程中出现异常,也插入中断向量表,内核要么将异常解决掉,要么终止程序,并将程序占用的资源返还;应用程序可以直接或者通过函数库间接地使用系统调用接口,插入中断向量表,中断向量表通过查询系统调用表提供系统调用实现,并将结果返还。因此可以说内核与外界打交道的接口主要就是中断、异常与系统调用。
从上图也可以看到中断、异常与系统调用的区别如下图:系统调用是应用程序主动向操作系统发出的服务请求;异常是非法指令或其他原因导致当前指令执行失败(如内存出错)后的处理请求;中断则是来自硬件设备的处理请求。
下图是三者比较:
这三者也即中断处理机制具体实现过程是怎样的呢?实现过程可以分为硬件和软件两部分。首先是硬件部分:在CPU初始化过程中会设置中断使能标志,即在CPU做好准备工作之后才会开始接受中断请求,在此之前是不会有反应的;此外需要根据内部或外部事件设置中断标志,记录出现了一次中断;依据中断向量表中的内容知道中断源是什么,并调用相应中断服务例程。以上为硬件部分工作内容,接下来的内容是软件部分:1. 现场保存(编译器);2. 中断服务处理(服务例程);3. 清除中断标记(服务例程);4. 现场恢复(编译器)。
那么如果一个中断出现的时候又出现新的中断会怎样呢(此处中断指中断处理机制即包含中断、异常、系统调用三者)?其中,硬件终端服务例程可以被打断,比如不同硬件中断源同时出现,此时可以按照优先级依次处理,而出现了非常重要的中断比如电源出现问题时,则可以临时禁止接收中断请求,而被接收了的中断请求会保持到CPU对中断做出响应。异常服务例程也是可以被打断的,比如异常执行中可能出现硬件中断,例如处理异常时进行磁盘IO,此时磁盘出现了硬件中断,则会打盹异常服务例程去进行硬件中断处理。异常服务例程也是可以嵌套的,比如处理异常时又出现了缺页异常,此时则会产生嵌套。