文章目录
- 进程调度
- 0.概念
- 1.调度分类
- 高级调度
- 低级调度
- 中级调度
- 七状态模型
- 调度对比
- 2.进程调度
- 进程调度的时机
- 进程调度的方式
- 进程的切换方式
- 调度器/调度程序
- 闲逛进程
- 3. 调度算法的评价指标
- CPU利用率
- 系统吞吐量
- 周转时间
- 等待时间
- 响应时间
- 4. 调度算法
- 先来先服务(FCFS)
- 短作业优先(SJF)
- 高响应比优先(HRRN)
- 小结
- 时间片轮转调度算法(RR)
- 优先级调度算法
- 多级队列反馈调度算法
- 多级队列调度算法
进程调度
0.概念
我们知道一个进程需要上CPU上运行,需要操作系统进行调度。但操作系统同一时刻有很多进程在运行,那么操作系统应该选哪个进程上CPU上运行呢?这就涉及到进程的调度了,当有一堆任务要处理,但由于资源有限,这些事情没法同时处理.这就需要确定某种规则来决定处理这些任务的顺序,这就是“调度”研究的问题
1.调度分类
高级调度
作业:一个具体的任务
用户向操作系统提交一个作业就是用户让操作系统启动一个程序(来处理一个具体的任务)
我们知道我们要启动一个程序,肯定是从外存读取到内存里面,但内存资源又是有限的。
所以有时候内存资源不足(内存满了)的情况下,那我给操作系统提交的作业也就是要启动程序,那么就有可能马上放到内存中马上启动,那么此时操作系统就会进行所谓的高级调度。
那么操作系统就会从所谓的作业后备队列里选择一个后备作业,先把它调入内存并且会为这个作业创建对应的进程,也就是建立一个PCB
高级调度(作业调度):按一定的原则从外存的作业后备队列中挑选一个作业调入内存,并创建进程。每个作业只调入一次,调出一次。作业调入时会建立PCB,调出时才撤销PCB。
低级调度
低级调度(进程调度/处理机调度) – 按照某种策略从就绪队列中选取一个进程,将处理机分配给它。
进程调度是操作系统中最基本的一种调度,在一般的操作系统中都必须配置进程调度
进程调度的频率很高,一般几十毫秒一次。
中级调度
中级调度又叫做内存调度
前面提到在计算机中可能会出现内存资源不足的情况,内存里面同时会存在多个进程的数据,如果内存不足的化就可以把内存总一些不太紧急不太重要的进程,把这些进程的数据从内存调出到外存,那么一个进程从内存调到外存,这个进程就会处于挂起状态。
操作系统会把这些不使用的进程的PCB组织成一个队列,这个队列就叫做挂起队列。
当内存有空闲资源的时候,操作系统又会安卓某种策略决定将哪个挂起状态的进程重新调入内存。
中级调度(内存调度) 一一按照某种策略决定将哪个处于挂起状态的进程重新调入内存
个进程可能会被多次调出、调入内存,因此中级调度发生的频率要比高级调度更高
七状态模型
暂时调到外存等待的进程状态为挂起状态(挂起态,suspend)
挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态
注意**“挂起”和“阻塞”的区别,两种状态都是暂时不能获得cpu的服务,但挂起态是将进程映像调到外存去了,而阻塞态下进程映像还在内存中**.有的操作系统会把就绪挂起、阻塞挂起分为两个挂起队列,甚至会根据阻塞原因不同再把阻塞挂起进程进一步细分为多个队列
调度对比
要做什么 | 调度发送在 | 发生频率 | 对进程状态的影响 | |
---|---|---|---|---|
高级调度(作业调度) | 按照某种规则,从后备队列中选择合适的作业将其调入内存,并为其创建进程 | 外存到内存(面向作业) | 最低 | 从无到创建到就绪 |
中级调度(内存调度) | 按照某种规则,从挂起队列中选择合适的进程将其数据调回内存 | 外存到内存(面向进程) | 中等 | 挂起到就绪 |
低级调度(进程调度) | 按照某种规则,从就绪队列中选择一个进程为其分配处理机 | 内存到CPU | 最高 | 就绪到运行 |
2.进程调度
进程调度的时机
进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机。
需要进行进程调度与切换的情况
- 当前运行的进程主动放弃处理机
- 进程正常终止
- 运行过程中发生异常而终止
- 进程主动请求阻塞(如等待I/O)
- 当前运行的进程被动放弃处理机
- 分给进程的时间片用完
- 有更紧急的事需要处理(如I/O中断)
- 有更高优先级的进程进入就绪队列
不能进行进程调度与切换的情况
- 在处理中断的过程中。中断处理过程复杂,与硬件密切相关,很难做到在中断处理过程中进行进程切换。
- 进程在操作系统内核程序临界区中
- 在原子操作过程中(原语) 。原子操作不可中断,要一气呵成 (如修改PCB中进程状态标志,并把PCB放到相应队列)
注意!
- 进程在操作系统内核程序临界区中不能进行调度与切换
- 进程处于临界区时不能进行处理机调度
内核临界区和临界区不一样!
- 临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。
- 临界区: 访问临界资源的那段代码。
内核程序临界区一般是用来访问某种内核数据结构的,比如进程的就绪队列(由各就绪进程的PCB组成)
当处于内核临界区的时候,比如说这个临界区要访问就绪队列的时候,在访问这个就绪队列之前会先加锁。
如果还没退出临界区 (还没解锁)就进行进程调度,但是进程调度相关的程序也需要访问就绪队列,但此时就绪队列被锁住了,因此又无法顺利进行进程调度
内核程序临界区访问的临界资源如果不尽快释放的话,极有可能影响到操作系统内核的其他管理工作.因此在访问内核程序临界区期间不能进行调度与切换
又比如说,此时一个进程要访问普通的临界区资源比如说打印机,在打印机打印完成之前,进程一直处于临界区内,临界资源不会解锁。但打印机又是慢速设备,此时如果一直不允许进程调度的话就会导致CPU一直空闲。所以为了增加操作系统的并发度,和CPU的利用率,在访问普通临界区的时候是可以进程调度的
进程调度的方式
-
非剥夺调度方式,又称非抢占方式。即,只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。实现简单,系统开销小但是无法及时处理紧急任务,适合于早期的批处理系统
-
剥夺调度方式,又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程。可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能 (通过时钟中。适合于分时操作系统、实时操作系统
进程的切换方式
“狭义的进程调度”与“进程切换”的区别:
狭义的进程调度指的是从就绪队列中选中一个要运行的进程。 (这个进程可以是刚刚被暂停执行的进程也可能是另一个进程,后一种情况就需要进程切换)
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。
广义的进程调度包含了选择一个进程和进程切换两个步骤。
进程切换的过程主要完成了:
1,对原来运行进程各种数据的保存
2,对新的进程各种数据的恢复
(如:程序计数器、程序状态字、各种数据寄存器等处理机现场信息,这些信息一般保存在进程控制块)
注意:进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。
调度器/调度程序
时间片用完和被调度程序选中这两种调度,由调度程序引起,调度程序决定
让谁运行?一一调度算法
运行多长时间?-一时间片大小
调度时机一一什么事件会触发“调度程序” ?
- 创建新进程
- 进程退出
- 运行进程阻塞
- I/O中断发生(可能唤醒某些阻塞进程)
- 非抢占式调度策略,只有运行进程阻塞或退出才触发调度程序工作
- 抢占式调度策略,每个时钟中断或k个时钟中断会触发调度程序工作,调度程序来检测此时就绪队列有没有新进程到达,如果有就判断是否要抢占当前正在执行的进程,上CPU运行。
- 不支持内核级线程的操作系统,调度程序的处理对象是进程
- 支持内核级线程的操作系统,调度程序的处理对象是内核线程,那么此时进程就是分配资源的进程单位,而内核级线程就是调度的基本单位。
闲逛进程
调度程序永远的备胎,没有其他就绪进程时,运行闲逛进程(idle)
闲逛进程的特性:
- 优先级最低
- 执行的可以是0地址指令,占一个完整的指令周期(指令周期末尾例行检查中断),这个中断就会周期性的唤醒调度程序,检查是否有其它的进程已经就绪,有的话就让就绪进程上处理机运行
- 能耗低
3. 调度算法的评价指标
CPU利用率
由于早期的CPU造价极其昂贵,因此人们会希望让CPU尽可能多地工作
CPU利用率:指CPU“忙碌”的时间占总时间的比例。
利用率$= \frac{CPU有效工作时间}{CPU总的运行时间} $
某计算机只支持单道程序,某个作业刚开始需要在cpu上运行5秒再用打印机打印输出5秒,之后再执行5秒,才能结束.在此过程中,CPU利用率、打印机利用率分别是多少。
CPU利用率 = 5 + 5 5 + 5 + 5 = 66.66 =\frac{5+5}{5+5+5}=66.66 =5+5+55+5=66.66%
打印机利用率 = 5 15 = 33.33 =\frac{5}{15}=33.33% =155=33.33%
系统吞吐量
对于计算机来说,希望能用尽可能少的时间处理完尽可能多的作业
系统吞吐量:单位时间内完成作业的数量
系统吞吐量 = 总完成作业数 总花费时间 =\frac{总完成作业数}{总花费时间} =总花费时间总完成作业数
某计算机系统处理完10道作业,共花费100秒,则系统吞吐量为?
10 100 = 0.1 \frac{10}{100}=0.1 10010=0.1道/秒
周转时间
对于计算机的用户来说,他很关心自己的作业从提交到完成花了多少时间。周转时间,是指从作业被提交给系统开始,到作业完成为止的这段时间间隔。
它包括四个部分:作业在外存后备队列上等待作业调度(高级调度)的时间、进程在就绪队列上等待进程调度(低级调度)的时间、进程在CPU上执行的时间、进程等待I/O操作完成的时间。后三项在一个作业的整个处理过程中,可能发生多次.
(作业)周转时间 = 作业完成时间 − 作业提交时间 =作业完成时间-作业提交时间 =作业完成时间−作业提交时间
对于用户来说,更关心自己的单个作业的周转时间
平均周转时间 = 各个作业周转时间之和 作业数 =\frac{各个作业周转时间之和}{作业数} =作业数各个作业周转时间之和
对于操作系统来说,更关心系统的整体表现,因此更关心所有作业周转时间的平均值
带权周转时间 = 作业周转时间 作业实际运行时间 = 作业完成时间 − 作业提交时间 作业实际运行时间 =\frac{作业周转时间}{作业实际运行时间}=\frac{作业完成时间-作业提交时间}{作业实际运行时间} =作业实际运行时间作业周转时间=作业实际运行时间作业完成时间−作业提交时间
平均带权周转时间 = 个作业带权周转时间和 作业数量 =\frac{个作业带权周转时间和}{作业数量} =作业数量个作业带权周转时间和
对于周转时间相同的两个作业,实际运行时间长的作业在相同时间内被服务的时闯更多
带权周转时间更小,用户满意度更高
等待时间
计算机的用户希望自己的作业尽可能少的等待处理机,
等待时间,指进程/作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低
对于进程来说,等待时间就是指进程建立后等待被服务的时间之和,在等待I/O完成的期间其实进
程也是在被服务的,所以不计入等待时间。
等待时间 = = =周转时间 − - −运行时间
对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队列中等待的时间
一个作业总共需要被CPU服务多久,被I/O设备服务多久一般是确定不变的,因此调度算法其实只会影响作业/进程的等待时间。当然,与前面指标类似,也有“平均等待时间”来评价整体性能。
响应时间
对于计算机用户来说,会希望自己的提交的请求(比如通过键盘输入了一个调试命令)尽早地开始被系
统服务、回应。
响应时间,指从用户提交请求到首次产生响应所用的时间。
响应比 = 响应时间 C P U 处理时间 = 等待时间 + 处理时间 处理时间 = 1 + 等待时间 处理时间 =\frac{响应时间}{CPU处理时间}=\frac{等待时间+处理时间}{处理时间}=1+\frac{等待时间}{处理时间} =CPU处理时间响应时间=处理时间等待时间+处理时间=1+处理时间等待时间
4. 调度算法
先来先服务(FCFS)
-
算法思想:遵循先进入后备队列的作业,先进行调度的原则
-
算法规则:按照作业/进程到达的先后顺序进行服务
-
用于作业/进程调度:用于作业调度时,考虑的是哪个作业先到达后备队列: 用于进程调度时,考虑的是哪个进程先到达就绪队列。
-
是否可抢占?:非抢占式的算法
-
优缺点
- 优点:公平、算法实现简单
- 缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。即FCFS算法对长作业有利,对短作业不利
- 有利于CPU繁忙的作业,不利于I/o繁忙的作业
-
是否会导致饥饿:不会
短作业优先(SJF)
- 算法思想:根据作业控制块中作业申请时指出的执行时间,选取执行时间最短的作业优先调度。
- 算法规则:只要就绪队列中出现了需要执行时间比当前正在运行作业的剩余处理时间更短的作业,则该作业会抢占当前正在运行的作业
- 用于作业/进程调度:即可用于作业调度,也可用于进程调度。用于进程调度时
称为“短进程优先(SPF,Shortest Process First)算法 - 是否抢占式服务?:抢占式的算法
- 算法优缺点:
- 克服FCFS调度算法对短作业不利的缺点,效率高,易于编程实现.不利于长作业.预先估计作业的执行时间
- 如果有源源不断的短作业/进程到来,可能就会导致长作业/长进程得不到服务,产生饥饿现象,如果一直得不到服务,则称为饿死
- 是否会导致饥饿:会
高响应比优先(HRRN)
- 算法思想:先来先服务调度算法只片面地考虑了作业的进入时间,短作业优先调度算法考虑了作业的运行时间而忽略了作业的等待时间。响应比高者优先调度算法为这两种算法的折中
- 算法规则:在每次调度时先计算各个作业/进程的响应比,选择响应比最高的作业/进程为其服务
- 高响应比优先的算法属于非抢占式的
响应比高优先调度算法不仅体现了等待时间长的作业会优先调度,而且还体现了处理时间短的作业也会优先调度,
该算法能够客观地对待长作业和短作业
- 是否会导致饥饿:不会
小结
注:这几种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标,但是不关心“响应时间”,也并不区分任务的紧急程度,因此对于用户来说,交互性很糟糕。因此这三种算法一般适合用于早期的批处理系统,当然,FCFS算法也常结合其他的算法使用,在现在也扮演着很重要的角色。而适合用于交互式系统的调度算法。
时间片轮转调度算法(RR)
- 算法思想:公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应
- 算法规则:按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如 100ms)。若进程未在一个时间片内执行完,则剥夺处理机,将进程重新放到就绪队列队尾重新排队。
- 用于作业/进程调度:用于进程调度(只有作业放入内存建立了相应的进程后才能被分配处理机时间片)
- 是否可抢占?:若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法。由时钟装置发出时钟中断来通知CPU时间片已到
- 优缺点:
- 优点:公平;响应快,适用于分时操作系统;
- 缺点:由于高频率的进程切换,因此有一定开销;不区分
任务的紧急程度。
- 是否会导致饥饿:不会
如果时间片太大,使得每个进程都可以在一个时间片内就完成,则时间片轮转调度算法退化为先来先服务调度算法,并且会增大进程响应时间。因此时间片不能太大。
另一方面,进程调度、切换是有时间代价的(保存、恢复运行环境),因此如果时间片太小,会导致进程切换过于频繁,系统会花大量的时间来处理进程切换,从而导致实际用于进程执行的时间比例减少。可见时间片也不能太小。
优先级调度算法
- 算法思想:随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序
- 算法规则:调度时选择优先级最高的作业/进程
- 用于作业/进程调度:既可用于作业调度,也可用于进程调度。甚至,还会用于在之后会学习的I/O调度中
- 是否可抢占?:抢占式、非抢占式都有。做题时的区别在于:非抢占式只需在进程主动放弃处理机时进行调度即可,而抢占式还需在就绪队列变化时,检查是否会发生抢占。
- 优缺点:
- 优点:用优先级区分紧急程度、重要程度,适用于实时操
作系统。可灵活地调整对各种作业/进程的偏好程度。 - 缺点:若源源不断地有高优先级进程到来,则可能导致饥
饿
- 优点:用优先级区分紧急程度、重要程度,适用于实时操
- 是否会导致饥饿:是
需要注意的是:
-
就绪队列未必只有一个,可以按照不同优先级来组织。另外,也可以把优先级
高的进程排在更靠近队头的位置 -
根据优先级是否可以动态改变,可将优先级分为静态优先级和动态优先级两种
- 静态优先级:创建进程时确定,之后一直不变。
- 动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级
-
通常情况下,系统进程优先级高于用户进程,前台进程的优先级高于后台进程
-
操作系统更偏好I/O型进程(或称I/O繁忙型进程)
- I/O设备和CPU可以并行工作。如果优先让I/o繁忙型进程优先运行的话,则越有可能让I/O设备尽早地投入工作,则资源利用率、系统吞吐量都会得到提升
-
与I/o型进程相对的是计算型进程(或称 CPU繁忙型进程)
多级队列反馈调度算法
- 算法思想:对其他调度算法的折中权衡
- 算法规则:调度时选择优先级最高的作业/进程
- 用于作业/进程调度:用于进程调度
- 是否可抢占?:抢占式的算法。在k 级队列的进程运行过程中,若更上级的队列(1~k-1级)中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回 k 级队列队尾。
- 优缺点:
- 对各类型进程相对公平 (FCFS的优点);每个新到达的进程都可以很快就得到响应 (RR的优点): 短进程只用较少的时间就可完成(SPF的优点):不必实现估计进程的运行时间(避免用户作假)可灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/O密集型进程(拓展:可以将因I/O而阻塞的进程重新放回原队列,这样I/O型进程就可以保持较高优先级)
- 是否导致饥饿:是
设置多级就绪队列,各级队列优先级从高到低,时间片从小到大
新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片。若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经在最下级的队列,则重新放回最下级队列队尾
假设此时有3个进程P1、P2、P3,有对应的到达时间和运行时间如下
进程 | 到达时间 | 运行时间 |
---|---|---|
P1 | 0 | 8 |
P2 | 1 | 4 |
P3 | 5 | 1 |
此时P1进程先到达,此时也没有其它进程,P1进程就会进入到1级队列。
P1(1)
再被分配1个时间片,但P1运行完一个时间片之后,此时进程还没有结束,那么进程P1就会被放到下一级队列,也就是第2级队列,此时时间已经过去1,同时P2进程已经到达,且会进入到第1级队列。
P1(1)—>P2(1)—>
那么接下来处理的就是P2这个进程,因为此时P2处于优先级更高的队列,让P2在CPU上执行1个时间片。同理运行完一个时间片的时间后,P2进程也会被放到下一级队列队尾。
P1(1)—>P2(1)—>P1(2)
此时时间已经过去2,此时第1级队列为空,就会为第2级队列的进程分配2个时间片运行,所以进程P1会执行2个时间片单位的时间。
当P1进程运行了2个时间片后,它仍然还没有结束,那么它还会被放入下一级队列。
P1(1)—>P2(1)—>P1(2)—>P2(1)
接下来就会让P2上CPU上运行,注意,当P2上CPU运行了一个时间片后,此时P3进程到达第1级队列,由于P3进程的优先级更高,那么P2的运行就会被P3给抢占,P2就会从新回到第2级队列,因为此时P2的时间片并未执行完毕,而是被抢占被动放弃了CPU的执行,此时让P3上CPU上执行。
P1(1)—>P2(1)—>P1(2)—>P2(1)—>P3(1)
因为P3只需运行一个时间片,那么运行完毕后就被调出内存了,而因为P2刚刚只运行了一个时间片就会抢占了CPU,所以此时它又要上CPU上运行
P1(1)—>P2(1)—>P1(2)—>P2(1)—>P3(1)—>P2(2)
P2再运行2个时间片后,P2的4个时间片就运行完了,此时也会被调出内存。当上面的1级队列和2级队列都空乐之后,就会调度3级队列的进程,也就是P1。
再P1运行了4个时间片的单位之后,P1就运行了7个时间片了,但还是没有执行完,由于此时已经是最后的一级队列了,就又会把P1重新放到第3级队列的末尾继续执行一个时间片后结束。
所以最后的进程调度是这样的:P1(1)—>P2(1)—>P1(2)—>P2(1)—>P3(1)—>P2(2)—>P1(4)
多级队列调度算法
系统中按进程类型设置多个队列,进程创建成功后插入某个队列。
队列之间可采取固定优先级,或时间片划分
- 固定优先级:高优先级空时低优先级进程才能被调度
- 时间片划分: 如三个队列分配时间50%、40%、10%
各队列可采用不同的调度策略
- 系统进程队列采用优先级调度
- 交互式队列采用RR
- 批处理队列采用FCFS