文章目录
- 一、什么是进程
- 二、进程的状态
- 三、Linux是如何做的?
- 3.1 R状态
- 3.2 S状态
- 3.3 D状态
- 3.4 T状态
- 3.5 t状态
- 3.6 X状态
- 3.7 Z状态
- 四、僵尸进程
- 4.1 僵尸进程危害
- 五、孤儿进程
一、什么是进程
- 对于进程理解来说,在Windows上是也可以观察到的,右键状态栏的任务管理器就可以看到
- 运行一个进程是需要占用CPU和内存的
- 在我们平时运行一个进程的时候(Windows)直接双击后,系统将磁盘里的exe文件加载到内存当中,这个时候就当运行起来的时候就开启了一个进程,这里要注意,加载到内存中中是不算进程的,只有当运行起来后才算是进程 -->进程 = PCB + 自己的代码和数据
- 对应的每一个进程都有一个PCB结构体,操作系统需要通过此结构体找对应的二进制
- 当有多个进程被运行起来的时候,就会产生多个PCB结构体,这个时候需要组织(可以是链表或者其他更高效的数据结构)起来进行管理,这就产生一个重要的概念------->先描述,再组织
- 每个进程都对应的每个PCB结构体,当运行的时候需要进行排队,CPU就可以通过PCB找到原代码,再把代码交给CPU运行
二、进程的状态
-
每个进程都有自己的一个状态,告诉操作系统正在干什么,将来要干什么?也就是说,进程的多种状态,本质都是为了满足未来的某种使用场景。
-
就比如Windows上的任务管理器也有显示进程的状态
- 在操作系统上有三种状态
- 运行状态
- 挂起状态
- 阻塞状态
- 运行状态:从计算机的硬件出发,我们所写的代码在硬盘中,要让程序运行起来就要加载到内存当中, 每一个程序(进程)都会有一个属于自己的PCB,通过PCB来进行排队,等待CPU的调度,为了方便调度管理,操作系统会维护一个运行队列,所有就绪状态的进程的PCB会被加入到这个队列当中, CPU在调度执行时就会通过这个运行队列拿到进程的PCB,进而调度执行该进程,在排队的时候就是运行状态。
-
挂起状态:内存满负荷时,又要增加新的进程显然是不行的。所以操作系统会观察内存中的哪些进程没有被放在任何一个队列里面(在内存里面啥也不干),找到以后就把此进程的代码和数据短期内置换到磁盘上,仅保留此进程的PCB。腾出的这一块空间供新的进程使用。针对于这种情况,操作系统会将阻塞进程的代码和数据置换到外设,此时该进程的状态就被称为挂起状态;
-
其中阻塞进程的代码和数据一般会存放在磁盘的swap分区,当进程被操作系统调度时,被置换到外设的代码和数据又会重新加载到内存;
-
一般情况下,swap分区的大小不会太大,大概等于内存的大小,过大的swap分区会导致操作系统过于依赖swap分区,导致效率变低;
-
- 阻塞状态:在CPU执行一个进程的时候,可能会需要访问系统的某些资源,就比如在C语言中写的scanf(),在使用这个函数的时候,需要调用键盘,等待键盘输入数据,当进程需要键盘资源的时候,会将进程的PCB加入到硬件设备结构描述的等待队列当中,并且把PCB设置为阻塞状态,当PCB在这个等待队列中等待数据资源时,这个状态就叫做阻塞状态;
三、Linux是如何做的?
- 在Linux内核中是这样定义的:
/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {"R (running)", /* 0 */"S (sleeping)", /* 1 */"D (disk sleep)", /* 2 */"T (stopped)", /* 4 */"t (tracing stop)", /* 8 */"X (dead)", /* 16 */"Z (zombie)", /* 32 */
};
-
先简单描述一下这些状态:
- R (Running):该进程正在运行中。
- S (Sleep):该进程目前正在睡眠状态,但可以被唤醒。
- D :不可被唤醒的睡眠状态,通常这个进程可能在等待I/O的情况。
- T :停止状态,发送一个暂停信号给进程,进程就暂停了。
- t :追踪停止状态,通常在断点调试时,进程处于此状态。
- X :死亡状态,这个状态是用来告诉操作系统的,所以我们观察不到此状态。
- Z (Zombie):僵尸状态,进程已经死亡,但是却无法被删除至内存外。
- 下面我们挨个介绍一下,以下用Linux来查看:
- 这里我们还需要了解一个概念,进程是有依赖的,就比如我运行这个C语言程序,其父进程是bash,pid是本进程的id,ppid是父进程的id
3.1 R状态
- 下面我们编写这样一段代码,是一个死循环,这样可以观察到进程
#include<stdio.h>
#include<unistd.h>
int main()
{while(1){}return 0;
}
- 普通查看进程可以这样查看
ps -aux | head -1 &&ps -aux | grep a.out
- 我们还可以用shell命令来一直刷新观察
while :; do ps ajx | head -1 && ps ajx | grep a.out | grep -v grep; sleep 1; done
-
这里看到是R+是代表在前台运行,在运行的时候可以使用ctrl+c进行中断,中断后进程也就退出了
-
我们可以让此程序到后台运行
-
在命令后面加“&”符号
-
这里的pid进程id是唯一的,标识此进程,ppid代表父进程
-
- 在运行起来后看到那个+号就没有了,说明是在后台运行中
- 想要杀死这个程序就需要使用kill命令来进行杀死
kill -9 27165
- 这里使用kill -9命令比较麻烦需要找到进程的id,我们还有一个命令
killall -9 a.out
- 这样就可以不用输入进程id输入此进程的名字即可
-
我们再补充一个概念,每一个进程运行起来的时候都有一个文件被创建
-
在根目录下的proc
3.2 S状态
-
这个状态表示此进程正在睡眠,但是可以被唤醒
-
下面可以进行演示一下:
#include<stdio.h>
#include<unistd.h>
int main()
{while(1){printf("hello world\n");}return 0;
}
- 在上面的那段代码中添加了一个printf打印函数,同样是运行,但是这里为什么是S状态呢?
- 这是因为CPU运行的速度很快,一直需要请求显示器响应,CPU多数的时候是在等待,所以就显示S
3.3 D状态
-
此状态是深度休眠状态,不可被唤醒,是为磁盘准备的
-
当进程需要大量的数据写入磁盘的时候,等待磁盘写入的进程状态就是休眠,上面也将过了,
-
在内存严重不足的情况下,操作系统没办法时会通过杀死进程的方式来节省资源;如果在等待的过程中进程被操作系统杀掉,并且磁盘写入数据失败,那么就会导致数据无法再加载(数据丢失);为了避免这种情况,就可以把等待数据写入的进程状态设为D状态;
-
D状态无法被杀掉(OS也不行),只能等待执行完毕后状态转换;
这个D状态不好验证,如果看到此状态说明计算机就要快挂了~~
3.4 T状态
- 此状态是停止状态,可以通过发送 SIGSTOP 信号给进程来停止(T)进程。这个被暂停的进程可以通过发送 SIGCONT 信号让进程继续运行
- 可以使用kill -l命令查看一下发送信号的类型
3.5 t状态
-
这个小写的t状态也是停止状态
-
主要出现在程序Debug时,在Debug的时候,遇到断点,进程就暂停,此时就是t状态
-
D状态、T状态、t状态其实都是阻塞状态,阻塞可以等待硬件资源也可以等待软件资源
3.6 X状态
- X状态(死亡状态),就是我们常说的终止状态,它是一个瞬时状态,不会在任务列表里看到这个状态
3.7 Z状态
- 最后就是Z(zombie)僵尸状态,僵尸状态较为复杂,Linux系统中的僵尸进程状态也是一种特殊的进程状态,通常是指一个子进程已经结束运行,但其父进程还未对其进行善后处理。如果不及时清理僵尸进程,会导致系统资源泄漏,影响系统性能甚至造成系统崩溃;
四、僵尸进程
-
当有一个进程要退出的时候,它是直接原地消失、释放空间的吗?
-
当进程退出的时候,它是不会立即释放空间的,它的PCB会保存一段时间让父进程或者操作系统读取,让父进程或操作系统知道这个进程即将退出了,然后父进程或者操作系统释放掉进程占用的资源和空间。一般情况下,清理进程资源空间的操作都是父进程。
-
那么僵尸进程,指的是什么呢?就是进程退出时,依然会在内存里面待一段时间,如果父进程没有能力将此进程完整地释放掉,造成这个进程一直在内存里面,此时这个进程就是僵尸进程。
- 下面我们创建一个子进程来看一看
#include<stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{pid_t id = fork(); while(1){if(id == 0){printf("我是子进程,pid:%d,ppid:%d\n",getpid(),getppid());sleep(1);}else if(id > 0){printf("我是父进程,pid:%d,ppid:%d\n",getpid(),getppid());sleep(2);}} return 0;
}
- 使用man 的2号手册可以看到fork的用法,fork有两个返回值
- 父子进程代码共享,数据各自开辟空间,私有一份(采用写时拷贝)
- 在
return val
这里可以看到返回值,如果成功返回0,失败返回-1,
- 在程序上面的那个程序的时候,杀死子进程后,子进程的状态就变成了僵尸进程
- 僵尸进程通常是无法再进行管理的,所以我们不能直接杀kill掉它,而是交给操作系统来处理这个进程。
4.1 僵尸进程危害
- 进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎么样了。可父进程如果一直不读取,那子进程就一直处于Z状态?是的!
- 维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在task_struct(PCB)中,换句话说,Z状态一直不退出,PCB一直都要维护?是的!
- 那一个父进程创建了很多子进程,就是不回收,是不是就会造成内存资源的浪费?是的!因为数据结构对象本身就要占用内存,想想C中定义一个结构体变量(对象),是要在内存的某个位置进行开辟空间!
五、孤儿进程
-
孤儿进程,顾名思义,没有父亲的进程就是孤儿进程,也就是,父进程创建了一个子进程,而父进程先退出了,就留下了子进程,这个时候这个进程就叫做孤儿进程
-
我们再用上面的代码可以演示一下,运行起来后,杀死父进程,就留下一个子进程
- 父进程是2200,当杀死父进程后,子进程的ppid就变成了1,就被操作系统接管了
本文介绍了Linux的进程概念,补充了一些概念,最后讲解了僵尸进程和孤儿进程是什么原因造成的