前言:
有了前面知识点的铺垫,本篇我们将围绕进程的三个方面来展开,即进程优先级,进程切换以及进程调度的问题,这里的进程调度其实本质就是CPU是如何去调度进程的。
进程优先级:
优先级的概念:
让我们先考虑这样一个场景,当我们中午去食堂排队买午餐的时候,我们的队伍是分为先后的,前面的人优先选择自己爱吃的,后面的人则需要等到前面的人选完才能轮到自己选。但是排队的所有人都要购买午餐的权利,只是先后买到的问题。
由此,我们便得出了在OS中进程排队的本质:
在资源不足的情况下,软硬件资源为少数,而进程是多数的,因此,在这种情况下,便有了优先级的概念。
那何为优先级呢?
即是得到某种资源的先后顺序
那优先级和权限有什么区别呢?他们两个如何区分呢?
权限是你是否有得到某种资源的能力,而优先级是你已经默认有了获取某种资源的能力,只不过是先得到还是后得到的区别
有了上面的概念的区分,我们下面来看看在实际的操作系统中是如何实现优先级的。
操作系统中优先级的实现方式:
优先级也属于PCB的一个数据段,和我们的状态一样,优先级也由一个整型变量来控制,对应的这个数值越小,它的优先级就越高。
反之,优先级就越低。
在LINUX中,进程的优先级的数值范围为60-99,一共40个等级划分,而LINUX中默认的进程的优先级都是80
我们在LINUX想要显示优先级,可以用指令ps -al来执行,即可以展示关于进程的更加详细的信息(其中的 l 代表更详细的意思,而a代表全部) 如下图:
图中的PRI即代表优先级的意思(priority),但是,默认的PRI都是80,那怎样体现优先级的先后呢?
LINUX是支持动态优先级调整的,如上图所示,你会发现,进程信息中还有一个NI值(nice值),我们默认的80的PRI是不会被修改的,本质上我们是利用PRI和NI的一个混合运算得到一个进程的优先级的,公式如下:
PRI(新)=PRI(默认80)+nice调整值
没错,根据公式,我们的PRI是不会变化的,一直是80默认,通过调整NI来调整优先级。
那如何调整NI值呢?其指令如下:
1.首先top打开任务管理器
2.输入r(renice)即修改NI值的指令
3.然后输入你要修改的进程的pid
4.然后重新输入新的要修改的NI值即可
如下图:
需要注意的点:
1.LINUX中,PRI默认都从80开始,不会记录上一次的PRI。
2.NI的取值范围为-20到19,也就是80减到60和加到99的临界情况,超出这个范围的数值,一旦超出,一律按照边界值处理,比如我NI值设为100,它也会自动将NI值设为19而不是100,不会超出范围。同理,NI值为-100,也会按照-20处理,不会超出范围
优先级的意义:
看了LINUX的优先级设置方法,或许有人会问:为什么要把优先级限定在一定的范围内呢?
这是由于OS在调度的时候,它需要较为均衡的让每一个进程都被均衡的得到调度,如果允许用户任意修改,则容易导致优先级较低的进程较长时间都得不到CPU资源来运行,这种现象又称为进程饥饿。故我们设置的级别为60-99,40位,导致区间进程的优先级相对固定。
因此,进程优先级的意义是:
让进程对于资源的调配更加合理,重要的进程优先运行,其次的进程后面运行,同时由于区间差距为40位,故优先级的差距不大,导致进程饥饿的问题得到解决。
其他的优先级指令:
1.nice指令
2.renice命令:与top一样,在进程启动时使用
3.LINUX系统调用,更改获取优先级,getpriority/setpriority
进程切换:
其他的概念:
1.竞争性:系统的进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争关系的,故为了高效完成任务,更合理竞争相关资源,便具有了优先级,
2.独立性:多进程运行,需要独享各种资源,多进程运行期间互不干扰
3.并行:多个进程在多个CPU下分别同时进行运行,称之为并行
4.并发:多个进程在一个CPU下采用进程切换的方式,在一段时间内,让多个进程都得以推进,称之为并发。
注意的一些细节:
1.首先区分一下,并行和并发的不同点,从CPU角度上,并行是多个CPU同时进行多个进程的,而并发是一个CPU分别切换进行多个进程的运行。
2.不要把并发理解为CPU同一时间内同时运行多个进程,本质上是先后切换进行的,只是这个时间非常快,在人的感知里就相当于同时在推进,因此叫并发。
因此,我们接下来详细讲讲进程切换的问题:
对进程切换的理解:
1.时间片:
首先注意,任何一个进程不是占有了CPU就一直运行,每隔一段时间,就会自动被从CPU上剥离下来,我们把这个进程在CPU上运行到被剥离出CPU的这段时间称之为时间片。
而LINUX内核是支持进程之间进行CPU资源抢占的,它的内核的本质是一种基于时间片的轮转,抢占式内核,根据每一个时间片的时间差去切换进程,故涉及到并发,则并发的过程中是一定涉及到进程间的切换的。
2.寄存器:
在我们的CPU硬件中存在着很多寄存器,比如eax,ebx,edx,ss,ds,cs,gs,fs,ebp,esp,eip,status,reg,cro~cr4等…
1.我们的函数内定义的栈的临时变量,在函数调用完就销毁的前提下,可以返回给外部,靠的就是eax寄存器将数据存储起来,为数据充当临时空间
2.为什么程序/进程,会知道我们当前程序运行到哪个位置了呢/它是如何做到函数跳转的呢?
这正是因为CPU内,有eip程序计数器,它会保存下一条指令的地址。
因此我们可以总结出:我们的进程在运行的时候,会使用寄存器,我们的进程运行的过程中会产生各种数据,这些数据都会由寄存器临时保存起来,不同的进程,CPU寄存器内的临时数据都是不一样的,我们将这些临时数据称为硬件上下文。
CPU硬件只有一套,但是寄存器可以存储的数据就不止一套了。
因此我们要明确,寄存器是硬件,而数据是逻辑的产物,寄存器!=寄存器里的内容。
寄存器里面的内容是可以随时更换的,但寄存器硬件只有一套。
3.进程切换的具体过程:
由上面的知识我们知道,一个进程的数据是由寄存器来保存的,那么在进程切换的时候,数据又是怎样保存下来为下一次运行做准备呢?
首先,所有的保存,都是为了恢复。进程保存数据也是为了下一次运行做准备。
而进程切换的本质就是将数据由硬件先保存到内存中,也就是用来管理进程属性的PCB中,再由内存中返回给硬件从而继续运行。
详细的切换过程如下:
一个进程倘若没有开始运行,则它会直接将数据拿到CPU上去跑,当涉及到进程切换的时候,CPU中的寄存器按顺序将寄存器中的数据拷贝到这个进程的PCB对应的数据段成员变量中,而后进程的PCB去执行其他调度,切换另一个进程交由CPU处理,而对于已经由CPU运算过一部分的进程,再次交给CPU运算,则会先将PCB中的数据,再按照顺序交给CPU的寄存器,其中也包括eip程序计数器等一系列寄存器,故此进程会从上一次切换的位置继续向下进行,这便是进程切换的过程如下图所示:
同时要强调一点的是,PCB的数据是以覆盖的方式把数据传给PCB的,同理寄存器传给PCB也是同理,不要担心数据丢失的问题,因为覆盖之前一定要首先对数据进行保存或者更新。
进程调度:
进程优先级,进程切换这些关于进程的知识点讲完了,下面我们来看看CPU是如何去调动我们的进程的。
我们以LINUX2.6为例,来看看它的调度队列是怎样的,如下:
从图中我们会看到,LINUX2.6的调度队列中存在着由红笔和蓝笔画上了两个一模一样的结构,在这个结构里包含三个成员:
1.一个状态标识变量nr_active
2.一个位图bitmap[5]
3.一个队列queue[140]
我用这张图让我们看懂我们的调度原理:
首先我们得queue数组是一个以PCB指针存储起来的数组,也就是说,它的每一个成员都是一个PCB结构体指针,在每一个结构体的后面去链接进程,前0-99是实时优先级,而100-139对应的就是我们的60-99正好40个优先级,数据的访问会从下标小的位置开始依次向后进行,故我们的优先级是越小优先级越高。
而在整个调度队列中还维护了两个指针voidactive,voidexpired,他们分别对应着我们的两个队列:活跃进程队列和过期进程队列
为了防止无限制的进程优先级高得进程得不断插入,导致后续得进程永远无法被执行,从而破坏了进程优先级的平衡性,LINUX2.6采取了双队列交替运行队列的方式,其中一个为活跃进程队列,另一个为过期进程队列,当活跃进程队列正在运行进程的时候,新增加的进程不论优先级都会被填入到过期运行队列中,不影响活跃队列的执行,当活跃进程队列的进程都被执行完后,此时的过期进程队列已经装配好了新的进程,这个时候active和expired交换指针的指向,让活跃变过期,过期变活跃,这个过程循环往复,两个队列交替运行进程,就保证了优先级的相对平衡性,不会有进程饥饿的情况发生。
而所谓的抢占,其实就是将过期队列的进程链接到活跃进程中优先运行。
位图成员:
在进程队列中还维护着一个位图成员bitmap[5],它是一个含有五个元素的整型数组,它的目的是快速锁定下标从而执行进程,我们找进程就不用再遍历queue去找了,而是通过位图去直接访问下标执行对应的进程,5个整型就是160个bit位,因此,利用二进制,从最右端开始位操作移动,遇到为1的说明此位数对应的下标上有进程要执行,而根据二进制的特点,我们可以8个一组或者16个一组去查看1的情况,这个要比遍历快很多,这种方法便是O(1)查找法。
因此,我们来总结一下CPU调度的具体流程:
首先访问active队列,查看nr_active的状态是否为1,为1说明有进程在队列中,然后通过位图锁定对应的下标,进入queue中直接根据下标去访问对应的进程队列从而执行相应的进程
最后我想提出的一个问题是:
我们之前说CPU维护着一条运行队列,协助调度,在这里我们有学到了调度队列中有两个队列,他们的关系是怎样的呢?
首先CPU维护着一条运行队列,这条队列在LINUX2.6中的实现方式是通过两个进程队列协助开始的,也就是说,两个进程队列是运行队列的一种实现方式,这便是他们的关系,不要混淆
总结:
本篇文章我们系统总结了进程优先级,进程切换,进程调度的问题,我希望结合前两个进程篇的知识,我们把整个进程在OS中的工作方式系统的去梳理一遍,保证每一个逻辑都是清晰的,有模糊的地方就去重新查看文章的细节,进程将对我们使用计算机的时候的一些现象有了更加合理的解释,所以,更希望大家在使用计算机的时候刻意去尝试推测某个软件所处的状态,从而进一步深化我们的进程知识。