进程和线程已经是老生常谈的问题了,现在那么他们是如何进行切换的呢?他们之间的切换有什么区别呢?如果你不懂的话,就让我们一起来探讨一下吧!
进程上下文切换(context switch)
进程到底由哪些部分组成?
首先我们要弄懂,进程到底是由哪些部分构成的。
进程是由进程控制块(process control block)<灵魂>和程序<躯体>共同组成。
PCB
对linux系统来说,PCB就是 task_struct 结构体,这个结构体非常大,这个结构体有一个指针 void *stack;
,它指向进程的内核栈(kernel stack)。这个结构体还有一个成员叫 void *mm
指向这个进程的地址空间(3G,包括了代码段、数据段、堆、栈)。
在一个在linxu系统中内核栈和一个叫做 thread_info 的结构体是在一起的,这里不做深度讨论。
另外PCB中包含的重要内容我们也必须要点出来,这就是以下两块:
代表进程运行环境的CPU中的register
对于一个正在运行的进程,它的重要内容还有包含CPU寄存器所包含的这个进程的相关的环境和信息。
主要有:
- 基址寄存器(Base Register): 指示进程地址空间的起始地址。
- 界限寄存器(Limit Register): 指示进程地址空间的大小。
理论上PCB应该包含这些信息,但是在实际环境中,PCB并不会保存该信息,只有当该进程成为了下降进程,CPU中的register就会保存在内存栈中,PCB中会有一个指针指向该信息,这个内存块也就是后文所说的的寄存器上下文
页表或段表
该进程应该还有一个页表来帮助这个进程从逻辑地址映射到物理地址。
但需要注意的是,理论上讲PCB中应该保存这些信息,但实际上linxu中PCB并不会保存这些信息。他会被保存在内核栈和其他地方
程序
程序作为躯体,他到底是个啥?其实就是我们所说的地址空间:
32位系统下,该地址空间有1G属于内核空间,3G属于用户空间。
进程自身的上下文由哪些部分组成
我们谈到进程的上下文切换,那么它的上下文是由哪些部分构成的呢?
- 进程的物理实体(进程的地址空间)和支持进程运行的环境(可以认为是PCB和内核栈、寄存器等等)一起合称为进程的上下文
那么我们为了理清整个进程上下文切换的过程,现在把进程的上下文进行细分:
- 用户级上下文:也就是用户空间信息,也就是刚才我们图中展示的3G的用户空间。
- 系统级上下文:也就是我们的内核空间信息,包括了我们之前讲的PCB及其指向的内核栈的信息。包括了进程标识信息、线程现场信息、进程控制信息等等。
- 寄存器上下文:也被称为硬件上下文和进程的线程信息,在程序运行时,其存起上下文在CPU的reg中,当进程成为下降进程,该上下文会作为系统级上下文的现场信息。
好了现在我们一起来整理一下进程的上下文切换:
在发生进程上下文切换时,操作系统把下降进程的寄存器上下文保存到该进程自身的系统级上下文的现场信息中,此时用户级上下文地址空间和系统级上下文地址空间一起构成了一个进程的整个存储器印象。
把下降进程的上下文保存下来,把上升进程曾经被保存过的上下文重新放到CPU中,这就叫做上下文切换。
何时发生进程上下文切换?
处于运行态占据CPU的只可能是一个进程「理论上是这样的,实际上linux操作系统将运行态和就绪态都算作运行态」,调度算法将该运行态的进程踢出CPU或者它主动自己出去「成为block态」,然后把另外一个进程从就绪队列(ready态)拿进到CPU,一旦达成了“那个进程出来,那个进程进去”的决定,那么这个时候就要发生进程的上下文切换。
我们把踢出CPU的进程成为下降进程,把从就绪态被调入CPU的进程称为上升进程。
那么下面我们总结一下何时发生进程上下文的切换:
主要来说就是由于进程状态的变化导致了进程的上下文切换,详细来说有以下两点,
- 可能是自身的原因,比如说等待资源、启动IO。
代码示例:
int main () {...char c = getchar(); //在这里从运行态-》阻塞态printf("%c\n", c);...return 0;
}
- 也可能是外部原因被剥夺CPU:主要是时钟中断,也就是给其他程序运行机会。这是被分时系统,也就是所谓的CPU时间片资源,强制剥夺CPU。这个时候进程状态从运行态到就绪态。
下降进程的现场和断点保存在哪里?是PCB吗?
我们知道,一旦发生线程上下文切换,我们就需要把下降进程的现场(即代表这个进程运行状态的通用寄存器)和断点(PC寄存器,PC一定会指向当前进程执行指令的下一条指令,也就是这个进程即将执行的指令的位置意味着一旦该进程回到CPU,它将从该条指令开始执行)进行保存。
所以下降进程自然要保存他的线程和断点。保存在哪里呢?理论上我们认为应该保存在PCB上,但是由于PCB不够大,所以在实际操作系统中,下降进程的现场和断点没有完全保存在PCB里面。
再看一下之前讲过的图,原来下降进程的现场和断点,也就是我们的寄存器信息是存储在内核栈中,PCB中有一个指针会指向该信息。
当进程在运行态的时候,寄存器上下文信息在CPU寄存器中。
用户栈和内核栈(中断栈)「论述了上下文切换的完整过程」
之前我们提到过下降进程的现场和断点没有完全保存在PCB里面。因为他还有一部分被保存在了内核栈(也叫中断栈)里面。那么什么是内核栈?什么是中断栈呢?
在开始这一节之前,我们之前谈论过:
进程的上下文切换主要是由于进程状态的变化导致,那么这个变化是由什么导致的呢?答案就是中断。站在系统的角度来看,没有中断就不可能导致上下文切换。
好了有了这个概念我们在讨论该话题
综合我们上文所说的,我们知道用户栈在用户空间的虚拟内存中,其包含了用户级上下文,
内核栈在内核空间,内核栈保存着系统级上下文。
也就是说,我们需要明确:每个进程都有两个栈。
好了,剩下的切换流程,可以直接移步蒋剑老师视频的10'54
:
进程上下文切换讲解_2
线程的上下文和上下文切换
可以直接去看阿布老师视频:
【CPU眼里的:线程切换 | 上下文 | 线程调度】
区别
其实整个过程没啥区别,主要根据被打断的程序主体和时机的不同,他们会被细分成线程上下文、进程上下文、中断上下文。名称虽多,但他们都是一样的配方、一样的味道