当计算机系统是多道程序设计系统时,常常会出现多个进程或线程竞争CPU的情况。如果有大于处理器数的进程(线程)处于就绪态时,就必须要选择下一个要执行的进程(线程)。在操作系统,用于选择接下来要执行的进程的程序称之为调度程序(Scheduler),调度程序相应的算法称之为调度算法(Schedule Algorithm)。虽然进程调度和线程调度有些许不同,但是许多适用于进程调度的处理方法大多也适用于线程的调度。
- 进程的行为
几乎所有的进程的I/O请求和计算都是交替发生的,典型的,CPU不间断的执行一段时间,当CPU发现需要执行I/O操作,发出系统调用来完成I/O请求,当/O请求执行完成后CPU继续计算,直到进程需要执行其他的I/O操作或者执行完成。某些进程花费大量的时间在计算上(使用CPU),这类型进程称之为CPU密集型进程(compute-bound),典型的CPU密集型进程具有较长时间的CPU集中使用和较小频度的I/O操作。相反,某些进程花费大量时间用于处理I/O请求,这类进程称之为I/O密集型进程(I/O-bound),典型的I/O密集型进程具有较短的CPU集中使用和频度较大的I/O操作。随着CPU的速度的不断提升,进程更加偏向于I/O密集型,因为因此如果需要运行/O密集型进程,那么应当劲量让/O密集型进程得到执行,以便发出磁盘请求并保持磁盘忙碌。因为I/O操作远远慢于CPU的速度,对于/O密集型进程的调度就更加重要了。
- 何时调度
有关调度的一个关键问题是在何时进行调度?考虑如下的情形:
- 在进程创建子进程后,需要决定调用子进程还是父进程,因为子进程和父进程都处于就绪态,因此可以任意决定选择那个进程执行。
- 当一个进程执行结束退出时,调度程序(Scheduler)需要从就绪队列中选择一个进程执行,如果就绪队列没有就绪进程,那么应该调用操作系统提供的空闲进程。
- 当一个进程因为I/O、信号量或其他原因陷入阻塞时,调度程序需要从就绪队列中选择一个进程执行。
- 在一个I/O中断发生时,必须做出调度决策,如果终中断来自I/O设备,而设备完成中断工作后,被阻塞的进程此时处于就绪状态,那么此时是继续执行正在执行的进程还是调度完成中断的进程将由调度程序决定。或者让刚刚中断发生的的进程执行,或者让某个其他进程执行。
根据如何处理时钟中断,可以把调度算法分为两类。非抢占式调度算法是挑选一个进程让其执行,直到该进程阻塞(I/O请求或其它原因)或者主动释放CPU,即使该进程执行了若干小时也不会强制挂起。这样做的结果是在时钟中断发生时不会进行调度,在处理完时钟中断后,如果没有优先级更高的进程,该进程会继续执行。抢占式调度算法是挑选一个进程,让进程执行一个给定的最大运行时间(时间片),如果在给定的最大执行时间后进程仍然在执行,那么会强制挂起该进程,调度程序选择另一个进程执行。
- 调度算法分类
调度算法的分类主要是根据其执行的环境,不同的执行环境使用不同的调度算法。大致可以划分出三种环境:批处理、交互式、实时。
- 调度算法的目标
前面我们知道,对于不同的环境使用不同的调度算法,因为在不同的环境所追求的性能指标也不尽相同,有些是所有环境都适合,有些则适合于特定的环境。
所有系统公平——保证每个进程由公平的CPU份额策略强制执行——保证指定的策略能够被执行平衡——保持系统所有的部分都是忙碌的
批处理系统吞吐量——每小时完成最大的作业数周转时间——任务从被提交到执行完成的最小时间CPU利用率——CPU的使用情况
交互式系统响应时间——快速响应时间均衡性——满足用户的请求
实时系统满足截止时间——避免丢失数据可预测性——在多媒体系统中避免品质降低
对于所有情形,公平性十分重要,进程应该得到公平的CPU的份额,在理论上能够达到公平。再者,尽量保证系统的各个部分都保持忙碌,保证CPU和I/O设备都在处理任务,这样比CPU空转或I/O设备空闲会更加高效。因此调度程序在把进程调入到内存时,保证内存中既有CPU密集型进程和I/O密集型进程是较好的想法。好于内存中先全部都是CPU密集型进程然后在全是I/O密集型进程。如果是后一种策略,在CPU密集型进程执行时会竞争CPU并且磁盘空闲,而后面执行I/O密集型进程时会竞争磁盘,而CPU却空转。因此保证内存中的进程既包含CPU密集型又包含I/O密集型能够让系统的性能好一些。
- 批处理系统中的调度算法
- 先来先服务:在所有调度算法中,最简单的莫过于非抢占式的先来先服务调度算法(first-come first-served),使用该调度算法时,进程按照请求CPU的时间的先后来使用CPU。基本上会有一个就绪进程的队列,每个请求CPU的进程会被放入到就绪队列中,然后CPU从队列头部选择进程执行,新来的进程会被放入到队列尾部。当正在执行的进程陷入阻塞时,CPU会从就绪队列首部中选择一个进程执行,当被阻塞的进程变为就绪态时,它就行刚刚请求CPU的进程一样被放入到队列尾部。该算法的优点在于便于理解并且容易在程序中应用。 缺点是对长作业比较有利,而不利于短作业,因为短作业执行的时间很短,但却要等待很多长时间才能执行。当内存中的进程大部分为I/O密集型进程时,CPU在这些进程间交替时会导致很多进程竞争I/O资源而导致CPU处于空闲。
- 最短作业优先:每个进程都有使用CPU的时间,每次调度程序选择进程时选择使用CPU时间最短的进程执行,这种非抢占式调度算法称之为最短作业优先(shortest job first)。最短作业优先算法能够提升高系统的吞吐量,并且使得平均等待时间最小。有必要支持,只有在所有进程同时运行的情形,最短作业优先才是最有的。
- 最短剩余时间优先:最短作业优先算法的抢占式版本是最短剩余时间优先(shortest remaining time first)算法。调度程序总是挑选剩余运行时间最短的进程进行执行,因此每个进程的运行时间要可知。当有新进程请求CPU时,会比较正在执行的程序的剩余执行时间和新请求的进程的执行时间,如果新请求的进程的执行时间更短就会暂停正在执行的进程转而执行最新请求的进程。否则新请求的进程放入到就绪队列,CPU继续执行当前进程。对于最短作业优先算法和最短剩余时间算法最大的问题在于需要知道每个进程运行的时间,对于这点往往是很难做到的。
- 交互式系统中的调度
- 轮转算法:一种最古老、最简单、最公平且使用最广泛的算法是轮转调度(round robin)。基本思想:为每个进程分配一个执行的时间段,成为时间片(quantum),允许进程在时间片内使用CPU,如果在时间片结束时进程依然在执行,那么调度程序暂停正在执行的进程并分配CPU给其他的进程。如果正在执行的进程在时间片结束前终止或阻塞,那么调度程序立即调度进程执行CPU而不是等到时间片结束再调度。该调度算法中有趣的是时间片长度的选择:从一个进程切换的另一个进程是需要时间进行事务管理的——保存前一个进程的寄存器,堆栈信息等信息并且装入新进程的堆栈信息、寄存器信息等,这种方式称之为进程切换(process switch)或者上下文切换(context switch)。如果时间片设置的过小,那么会有很多时间会用于进程的上下文切换的开销上,如果时间片设置的比较大,那么在请求量很大的场景(例如Web服务器),那么到来的请求要等很长的时间才有机会被调度。因此时间片过长或者过短都不合适,通常将时间片长度设置为20ms-50ms是比较合理的折中。
- 优先级调度:轮转算法做出了一个假设那就是默认所有的进程的优先级一样,但是现实的情况是有些进程的优先级高一些,有些不那么重要的进程的优先级可能相对低一些。因此在优先级调度算法中每个进程给予一个优先级,运行优先级最高的进程先执行。为了方式优先级高的进程一直运行,可以在时钟滴答降低进程的优先级使得优先级相对低的进程也有机会执行。另一种方法是为进程赋予一个运行执行的最大时间片(时间片长度可能因进程的优先级的不同而不同),当使用完时间片,优先级次高的进程也能被执行。优先级也可以由系统动态分配,例如有些I/O密集型进程大多数时间在等待I/O结束,当这类型的进程请求执行时应该劲量满足,以便启动下一次I/O请求。系统应该能适当的调整进程的优先级避免出现优先级较低的进程出现饥饿现象。
- 多级队列:多级队列(Multilevel Queue)调度算法是将就绪队列分成介个单独的队列,一般根据进程的特性如占用内存的大小,进程的优先级,进程类型等,每个队列都有自己的调度算法。
- 最短进程优先:对于交互式系统,用户可能比较在意的指标是响应时间,因此最短进程优先常常伴随着最短的响应时间,用户体验也越好。这里唯一的问题是如何从当前可执行的进程中找出最短的那一个进程? 一种方法是根据进程过去的行为进行推测,并执行运行时间最短的那个。假设终端上每个命令的执行时间为T0,现在假设测量到下一次运行时间为T1,那么使用加权和来改进预计时间,即aT0+(1-a)T1,通过选择a的值,可以决定尽快忘掉老的执行时机还是保留。当a = 1/2时,可得到如下的序列: T0,To/2 + T1/2,To/4 + T1/4 + T2/2 .........
- 线程调度
当进程拥有多个线程时,就存在两个层次的并行:进程和线程,这两种调度存在本质的区别,并且还取决于线程是用户级线程还是内核级线程还是两者的混合。首先考虑用户级线程,操作系统不知道线程的存在,因此操作系统还是和以前一样调度进程,而线程调度程序在进程内部,进程内的调度程序决定如何调度线程。因为多个线程不存在时钟中断,因此使用时间片是可行的方案。当进程的运行时间介绍内核就会调度其他进程。也就是说当调度程序分配给进程一定的执行时间,进程内的多个线程如何使用这段执行时间内核不关心,内核关系的是分配给进程的执行时间(时间片长度)。对于内核级线程,内核选择一个特定的线程执行,它不用考虑该线程属于那个进程,对于被选择的进程赋予一个时间片,而且超过了时间片,就会强制挂起该线程。用户级线程和内核级线程之间的差别在于性能,用户级线程的线程切换需要更少的机器指令,甚至内核都不知道进行了线程切换,因为这是由进程内部的调度程序决定的,因此用户级线程可以使用转为应用程序定制的线程调度程序。另一方面,使用内核级线程时,一个线程被阻塞时不会出现像用户级线程那样挂起相应的进程的情况。