死锁的概念
- 死锁:在并发环境下,个进程因为竞争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。
区别:
- 饥饿:由于长期得不到想要的资源进程无法向前推进的现象。
- 死循环:程序运行无法停止的状态。
死锁产生的必要条件
- 互斥条件:资源是互斥使用的,只能被有限进程同时使用。(像内存、扬声器这样的资源不会发生死锁)
- 不剥夺条件:进程所获得的资源在未使用完之前不能由其他进程夺走,只能主动释放。
- 请求和保持条件:进程已经保持了至少一个资源,但是又提出请求新的资源,当无法获取新资源的时候阻塞,保持已经占有的资源不放。
- 循环等待:存在一种进程资源的循环等待链,链中的每一个进程以获得的资源同时被下一个进程请求。循环等待不一定会发生死锁,但是死锁一定会有循环等待现象发生。
需要注意的是上述条件都是必要条件。如果同类资源数大于1,则有循环等待也未必发生死锁,但是如果每个资源只有一个的,那么循环等待就是死锁的充分必要条件。
死锁产生的时期
- 对不可剥夺系统资源的竞争
- 进程推进顺序非法
- 信号量使用不当
死锁的处理策略
- 预防死锁:破坏死锁产生的四个必要条件中的一个或者几个
- 避免死锁:用某种方法防止系统进入不安全感的状态,从而避免死锁(例如银行家算法)
- 死锁的检测和解除:允许死锁的发生,如果检测发生后需要进行解除
预防死锁
破坏互斥条件
将互斥使用的资源改造为允许共享使用的资源。
例如:SPOOLing
技术。操作系统可以采用SPOOLing
技术把独占设备在逻辑上改造成共享设备。使用的方法就是增加了一个专门用于调度专用资源的进程。这样对于其他进程来讲自己的进程就立马被处理了,而不会造成阻塞。
缺点:并不是所有的资源都可以改造成共享使用的资源,为了系统安全,许多地方必须保护这种互斥性,因此很多时候我们无法破坏这种互斥性。
破坏不剥夺条件
方案一:当某个进程请求新的资源得不到满足时,他必须释放所保持的所有资源,待以后需要的时候再主动申请。(即使自己还没有使用结束)
方案二:当某个进程需要使用被占用的资源的时候,可以由操作系统协助将想要的资源强制剥夺。这种方式一般需要考虑各进程的优先级。
缺点:
- 实现起来比较复杂
- 释放已经获得的资源可能造成前一段工作的失效。因此这种方法一般只适用于已保存和恢复的资源,例如CPU。
- 反复的申请和释放资源会增加系统开销,降低系统吞吐量。
- 采用方案一的话如果得不到某个资源则之前的资源都需要放弃,以后再重新申请,这样有可能导致进程的饥饿。
破坏请求和保持条件
- 静态分配方法:在进程运行前一次申请完它所需要的全部进程,在他的资源未满足前不让他投入运行,一旦投入运行后这些资源就一直归他所有。
实现简单。缺点明显:资源利用率极低,而且可能导致某些进程饥饿。
破坏循环等待条件
- 顺序资源分配法:首先给系统中的资源编号,规定每个进程必须按照编号递增的顺序请求资源,同类资源(编号相同的资源)一次性申请完。
原理分析:只有拥有小编号资源的进程等待大编号资源,而不会有拥有大编号资源的进程等待小编号资源,从而防止了循环等待现象的发生。
缺点:
- 不方便增加新的设备,因为可能需要重新分配编号
- 进程实际使用资源的顺序可能和编号递增的顺序不一样从而导致资源的浪费。如果想要解决这个问题,就必须按照规定次序申请资源,用户编程麻烦。
避免死锁
安全序列:如果系统按照安全序列分配资源,则每个进程都能够顺利完成。只要能和造出一个安全序列,系统就是安全状态。当然安全状态可能有多个。
如果分配了资源以后,系统找不出任何一个安全序列,则系统进入不安全状态。这就意味着之后可能所有进程都无法顺利执行下去。当然,如果有进程提前归还了一些资源,则系统也有可能重新回到安全状态。
如果系统处于安全状态,就一定不会发生死锁。如果系统进入不安全状态,就可能发生死锁(处于不安全状态未必就是发生了死锁。但是发生死锁一定是在不安全状态)
因此可以在资源分配之前与预先判断分配是否会导致系统进入不安全状态,以此决定是否答应资源分配请求。
银行家算法
核心思想:在进程提出资源申请时,先预判此次分配是否会导致系统进入不安全状态。如果会进入不安全状态,就暂时不答应这次请求,让该进程先被阻塞等待。
数据结构:
- 长度为m的一维数组
Available
表示还有多少可用资源 - n*m矩阵
Max
表示各个进程对资源的最大需求数 - n*m矩阵
Allocation
表示已经给个进程分配了多少资源 - n*m矩阵
Need
表示各进程还需要多少资源 - 长度为m的一维数组
Request
表示进程此次申请的各种资源数
银行家算法步骤:
- 检查此次申请是否超过了最大需求数
- 检查此时系统剩余的可用资源是否还能满足这次请求
- 试探着分配,更改各数据结构(
Available
Allocation
Need
) - 用安全性算法检查此次分配是否会导致系统进入不安全状态
安全性算法步骤:
- 检查当前剩余可用资源能否满足某个进程的最大需求,如果可以,就将该进程加入安全序列,并把该进程持有的资源全部回收
- 不断重复上述过程,检查最终能否将所有进程都加入安全序列
死锁的检测和解除
如果不采取预防思索的措施,也不采取避免死锁的措施,系统很有可能发生死锁。这个时候就应该进行死锁的检测和解除。
死锁的检测
资源分配图:
如果系统中剩余的可用资源足够满足进程的需求,那么这个进程是不会阻塞的,可以顺利执行下去。执行结束后消除与该进程相连的所有边(归还资源)。
如果按照上述过程最终能够消除所有边,则称这个图是可完全简化的。此时一定没有发生死锁。(相当于找到一个安全序列)
如果不能消除所有边,那么此时就是发生了死锁。
检测死锁的算法:
- 在资源分配图中,找出既不阻塞又不是孤点的进程,消去它所有的请求边和分配边,使之成为孤立的节点。
- 重复上面的过程,直至资源分配图变成可完全简化的。
死锁定理:如果某时刻的资源分配图是不可完全简化的,那么此时可系统死锁。
死锁的解除
并不是系统中所有进程都是死锁状态,用死锁检测算法化简资源分配图以后,还连着边的那些进程就是死锁进程。
解除死锁的主要方法有:
- 资源剥夺法。挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他死锁进程。但是应该防止被挂起的进程长时间得不到资源而饥饿。
- 撤销进程法(终止进程法)。强制撤销部分、甚至全部死锁的进程,并剥夺这些进程的资源。实现简单,代价较大。
- 进程回退法:让一个或者多个死锁进程回退到可以避免死锁的地步。这就要求系统记录进程的历史信息,设置还原点。
应该夺取哪个进程的资源:
- 进程优先级
- 已执行时间
- 还有多久能够完成
- 进程已经使用了多少资源
- 进程是交互式的还是批处理式的(优先牺牲批处理)