聊聊僵尸进程

文章目录

  • 1. 前言
    • 1.1 什么是僵尸进程
    • 1.2 为什么需要关注僵尸进程
  • 2. 僵尸进程的产生
    • 2.2 为什么会产生僵尸进程
    • 2.3 举个栗子
  • 3. 僵尸进程的影响
    • 3.1 僵尸进程为何会占用系统资源
    • 3.2 操作系统如何知道哪个资源需要被释放
    • 3.3 什么是进程表
    • 3.4 什么是PCB
  • 5. 如何处理僵尸进程
    • 4.1 识别僵尸进程
      • 第一种方法
      • 第二种方法
    • 4.3 清理僵尸进程
      • 1. 找到僵尸进程的父进程ID(PPID)
      • 2. 向父进程发送`SIGCHLD`信号
  • 6. 实例分析
  • 7. 参考文档

1. 前言

1.1 什么是僵尸进程

僵尸进程,也被称为"defunct process" 我们在看国外的一些博客的时候会发现僵尸进程又称为 Zombie Processes
它是一种已经终止但是仍然在进程表中存在的进程。这种情况通常发生在父进程还没有来得及读取子进程的退出状态,而子进程已经结束,这样子进程虽然已经结束,但是在操作系统中仍然保留了相关记录。
《Processes in a Zombie (Z) or Defunct State》
《How to Clean a Linux Zombie Process》

1.2 为什么需要关注僵尸进程

僵尸进程可能会导致一些问题。首先,它们占用了系统资源。虽然僵尸进程自身已经不再运行,但是它在进程表中的记录仍然会占用系统资源,如果有大量的僵尸进程,可能会消耗掉所有的进程表空间,导致无法创建新的进程。其次,僵尸进程可能会影响到其他进程的运行,特别是那些需要读取进程状态或者和已经终止的进程进行交互的进程。因此,对于僵尸进程,我们需要及时处理,避免它们引起更大的问题。

2. 僵尸进程的产生

2.2 为什么会产生僵尸进程

在操作系统中,僵尸进程是指原本已经结束运行并退出的进程,但是它在系统的进程表中仍然保留有记录。这种情况通常有以下几种可能:

  1. 父进程没有调用wait()或waitpid()来获取子进程的结束状态。当子进程结束运行后,系统会向父进程发送一个SIGCHLD信号。如果父进程没有处理这个信号或者没有正确地获取子进程的结束状态,那么子进程就会变成僵尸进程。

  2. 父进程在子进程结束之前就已经结束了。这种情况下,子进程会被init进程接管,init进程会定期调用wait()来回收这些僵尸进程。

  3. 父进程由于某种原因没有接收到SIGCHLD信号,例如父进程正在执行一个长时间的任务或者被阻塞了。这种情况下,子进程的结束状态就无法被父进程获取,导致子进程成为僵尸进程。

通俗的说,僵尸进程主要是由父进程没有正确处理子进程的结束状态造成的。虽然僵尸进程自身不会消耗除了进程表之外的其他资源,但是如果有大量的僵尸进程存在,那么进程表的空间就会被耗尽,新的进程将无法创建,对系统性能会有影响。

2.3 举个栗子

在这里插入图片描述

举例来说,假设有一个父进程P,它创建了一个子进程C。现在子进程C执行了一些任务后完成了。这时,内核发送一个SIGCHLD信号给父进程P,通知它子进程C已经完成了任务。

如果父进程P在创建子进程C时已经编程执行wait()系统调用,那么父进程P会接收到SIGCHLD信号后,执行wait()系统调用,读取子进程C的状态和退出码,并同时清除子进程C在进程表中的记录。

但是,如果父进程P在创建子进程C时没有编程执行wait()系统调用,那么它就无法读取子进程C的状态和退出码,也无法清除子进程C在进程表中的记录。这就导致子进程C虽然已经完成了任务,但是它的僵尸状态还是留在进程表中,显示为一个僵尸进程。

另外,如果父进程P在接收到SIGCHLD信号时,由于某种原因(比如过载等)无法处理该信号,那么这也会导致子进程C变成一个僵尸进程。

这些僵尸进程会占用系统资源,虽然它们不再执行任何任务,但是它们在进程表中的记录仍然存在。这可能会导致系统资源的浪费,甚至在极端情况下,可能因为进程表已满而无法再创建新的进程。

3. 僵尸进程的影响

3.1 僵尸进程为何会占用系统资源

每个进程结束时,都会产生一个退出状态,这个状态需要被它的父进程来回收。在父进程回收这个状态之前,系统会保留一部分信息(比如进程ID、进程状态和退出码等),这样父进程就可以知道其子进程结束的详细情况。这部分信息是存放在系统内存中的,因此结束的进程直到被其父进程回收之前都会占用一些内存资源。

这就是为何僵尸进程会占用系统资源的底层原理。僵尸进程就是已经结束,但是其父进程还未回收其状态的进程,因此它们还会占用一部分系统资源。

在Linux系统中,如果父进程没有回收子进程的状态,内核会把这个任务交给init进程(进程ID为1的进程)来完成。这就是为什么在系统中看到的大部分僵尸进程其父进程ID都是1的原因。

在多任务环境下,如果僵尸进程过多,理论情况下可能会导致进程表已满,从而无法创建新的进程,影响到其他任务的正常进行。看清楚是理论情况下,其实在进程表沾满之前其他资源肯定已经耗尽了已经不可能分配进程了。此外,僵尸进程还可能导致系统响应时间变慢,因为系统需要花费更多的时间来处理并不需要的进程,这对于需要快速响应的系统来说是非常不利的。同时,僵尸进程占用的内存资源也可能导致其他需要更多内存的任务无法得到足够的内存资源,从而影响其性能。

3.2 操作系统如何知道哪个资源需要被释放

这就不得不说 操作系统两个相关的概念 进程表和PCB
进程表是操作系统中管理进程的数据结构之一。它是一个存储所有进程信息的表格,每个进程在表格中都有一个对应的表项。而操作系统通过进程控制块(Process Control Block, PCB)来记录和管理系统中的各个进程。

每个进程有自己的PCB,它包含了这个进程的所有重要信息,如进程状态、程序计数器、CPU寄存器和堆栈指针、优先级、内存分配状况、资源状态、I/O状态等信息。

当一个进程结束的时候,操作系统会根据该进程的PCB中记录的信息,来知道需要释放哪些资源,例如内存资源、I/O设备等。

操作系统还会通过一些内部的数据结构来记录资源的使用情况,例如内存管理子系统会用位图或者链表来记录内存的分配情况,文件系统会用索引节点(inode)来记录文件的分配情况等。这些都可以帮助操作系统了解哪些资源正在被使用,哪些资源已经空闲,从而在需要的时候正确地释放或者分配资源。

3.3 什么是进程表

进程表是操作系统内核内部的一种数据结构,用于跟踪和管理系统中的所有进程。每当创建一个新的进程时,操作系统就会在进程表中为其分配一个新的条目。
在这里插入图片描述

进程表中的每个条目通常包含以下信息

信息类别详细描述
进程ID(PID)每个进程的唯一标识符
状态进程的当前状态(如运行、就绪、阻塞等)
优先级进程的调度优先级
所有者创建该进程的用户或者进程的用户ID
进程计数器记录了进程下一条要执行的指令的地址
CPU寄存器保存了进程上下文切换时的CPU寄存器状态
内存管理信息记录了进程的内存布局以及进程使用的虚拟内存和物理内存等信息
文件描述符表记录了进程打开的所有文件和网络套接字
执行环境如环境变量等

进程表对于操作系统来说极为重要,是实现多任务和进程隔离等核心功能的关键。进程表的主要作用是帮助操作系统管理和调度进程。具体来说,它有以下几个作用:

  1. 进程调度:操作系统根据进程表中的信息(如进程状态、优先级等)来决定下一个要运行的进程。

  2. 进程管理:操作系统通过进程表来跟踪每一个进程的状态,如运行、就绪、阻塞等。

  3. 上下文切换:当CPU从一个进程切换到另一个进程时,操作系统会保存当前进程的状态到进程表,并从进程表中恢复新的进程的状态。

  4. 内存管理:操作系统根据进程表中的信息来管理进程的内存分配,包括虚拟内存和物理内存。

  5. 文件系统管理:操作系统通过进程表中的文件描述符表来跟踪每个进程所打开的文件和网络套接字。

  6. 资源管理:操作系统使用进程表来管理和跟踪进程所需的其他系统资源,如I/O设备、信号量、消息队列等。

3.4 什么是PCB

PCB,全称为Process Control Block,中文名为进程控制块。它是操作系统中一个非常重要的数据结构,用于保存和描述一个进程的基本信息和运行状态。
通俗的说,PCB就是操作系统对进程的一种抽象,它包含了操作系统管理和控制进程所需要的所有信息。
在这里插入图片描述

PCB的主要作用如下

  1. 进程调度:在多道程序设计中,操作系统需要进行进程的调度和切换,PCB中保存的进程状态和调度信息(例如进程优先级)可以帮助操作系统做出决策。

  2. 进程同步和通信:PCB中保存了进程的同步和通信机制(比如信号量等),帮助实现进程间的协调运行。

  3. 进程管理:通过PCB,操作系统可以对进程进行管理和控制,如创建、终止进程,修改进程的状态等。

  4. 资源管理:PCB中保存了进程的资源使用情况(比如CPU时间、内存空间等),可以帮助操作系统进行资源的分配和回收。

5. 如何处理僵尸进程

4.1 识别僵尸进程

识别僵尸进程的方法是使用ps命令。在查看僵尸进程时,只需要关注STAT列的值是否为Z

第一种方法

  1. 查看所有进程的状态:
$ ps aux

输出示例:

USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root         1  0.0  0.1  16444  2580 ?        Ss   Jan21   0:02 /sbin/init
root         2  0.0  0.0      0     0 ?        S    Jan21   0:00 [kthreadd]
root         3  0.0  0.0      0     0 ?        S    Jan21   0:01 [ksoftirqd/0]
...
user     32345  0.0  0.1  34364  2928 pts/1    Z    01:30   0:00 [myprocess] <defunct>
...

在上面的输出中,STAT列的值为Z的进程(如PID为32345的进程)就是僵尸进程。

第二种方法

  1. 也可以使用以下命令直接列出所有僵尸进程:
$ ps aux | grep -w Z

输出示例:

user     32345  0.0  0.1  34364  2928 pts/1    Z    01:30   0:00 [myprocess] <defunct>

这条命令会过滤出所有STAT列值为Z的进程。

4.3 清理僵尸进程

要清理僵尸进程,需要向其父进程发送SIGCHLD信号以通知它回收子进程。通常情况下,父进程会在子进程结束时自动回收它。但在某些情况下,父进程可能没有正确地回收子进程,导致子进程成为僵尸进程。下面是清理僵尸进程的方法:

1. 找到僵尸进程的父进程ID(PPID)

$ ps -el | grep -w Z

输出

F S   UID   PID  PPID  C PRI  NI ADDR SZ WCHAN  TTY          TIME CMD
0 Z  1000 32345  1001  0  80   0 -     0 exit   pts/1    00:00:00 myprocess <defunct>

2. 向父进程发送SIGCHLD信号

$ kill -s SIGCHLD 1001

这将通知进程1001回收其子进程。

  1. 如果向父进程发送SIGCHLD信号后,僵尸进程仍未被清理,那么可以尝试杀死父进程。这样,僵尸进程将被init进程(PID为1)接管并自动清理。
    $ kill -s SIGTERM 1001
    

6. 实例分析

《How to Clean a Linux Zombie Process》 https://www.baeldung.com/linux/clean-zombie-process

7. 参考文档

https://www.geeksforgeeks.org/process-table-and-process-control-block-pcb/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/98771.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

docker安装Jenkins完整教程

1.docker拉取 Jenkins镜像并启动容器 新版本的Jenkins依赖于JDK11 我们选择docker中jdk11版本的镜像 # 拉取镜像 docker pull jenkins/jenkins:2.346.3-2-lts-jdk11 2.宿主机上创建文件夹 # 创建Jenkins目录文件夹 mkdir -p /data/jenkins_home # 设置权限 chmod 777 -R /dat…

vue解决:Parsing error: No Babel config file detected for ....

报错信息 Parsing error: No Babel config file detected for C:\Users\Admin\Desktop\shabi\work\src\App.vue. Either disable config file checking with requireConfigFile: false, or configure Babel so that it can find the config files. 分析错误&#xff1a;没有检测…

jmeter利用自身代理录制脚本

在利用代理录制脚本时一定要安装java jdk&#xff0c;不然不能录制的。 没有安装过java jdk安装jmeter后打开时会提示安装jdk&#xff0c;但是mac系统中直接打开提示安装jdk页面后下载的java并不是jdk&#xff08;windows中没有试验过&#xff0c;笔者所说的基本全部指的是在ma…

Linux从时间服务器同步时间

一、基本设定 自己的时间服务器&#xff1a;111.11.11.111 二、操作 查看当前时间命令&#xff1a;date&#xff0c;发现时间不一致。 同步命令&#xff1a;/usr/sbin/ntpdate 111.11.11.111 然后等待同步完成即可。 如果同步命令不可用&#xff0c;需要先安装Ntp服务&…

智慧用电安全云监控系统

近年来&#xff0c;我国电气火灾频发&#xff0c;2017年至2019年&#xff0c;我国共之间发生发展电气控制火灾31.1万起&#xff0c;占全国进行火灾总量及伤亡风险损失的30&#xff05;以上&#xff0c;2019年全年共接报火灾23.3万起&#xff0c;电气火灾11.1万&#xff0c;占52…

mysql 物理备份及恢复

一、物理复制的基本概念 物理备份:直接复制数据库文件&#xff0c;适用于大型的数据库环境&#xff0c;不受存储引擎的限制&#xff0c;但不能恢复到不同的mysql版本 完整备份&#xff1a;也叫完全备份&#xff0c;每次将所有数据&#xff08;不管自第一次备份有没有修改过&…

STM32实战项目——WIFI远程开关灯

前言 其实WIFI开关灯在几个月前就想做了&#xff0c;但是对于没有云平台调试经验的我&#xff0c;一开始有些摸不着头脑&#xff0c;所以就搁置了。十一假期与老同学聊天时了解到他也在做一个远程开关灯的小项目&#xff0c;所以就重新开始了WIFI远程开关灯的小项目。 本文使用…

光引擎、光模块、光器件之间的关系和区别

最近小编有收到一些用户问“光引擎、光模块、光器件之间的关系和区别&#xff1f;”&#xff0c;众所周知光通信技术一直在不断演进&#xff0c;为满足不断增长的数据传输需求提供了强大的解决方案。而光通信系统中&#xff0c;光引擎、光模块和光器件是关键的组成部分&#xf…

selenium-webdriver-Chrome新驱动地址(Chrome115及以上版本)

Chrome115、Chrome116、Chrome117&#xff0c;在旧的链接并没有 新地址&#xff1a;https://googlechromelabs.github.io/chrome-for-testing/ 参考学习链接&#xff08;我也是根据这个老师的链接学到的&#xff09;&#xff1a;https://www.cnblogs.com/wuxianfeng023/p/1765…

现代化战机之路:美国空军U-2侦察机基于Jenkins和k8s的CI/CD架构演进

▲ 点击上方"DevOps和k8s全栈技术"关注公众 华为北京研究所Q27大楼 随着技术的不断进步&#xff0c;军事领域也在积极采纳现代化工具来提高战备水平和效率。美国空军的U-2侦察机项目是一个鲜明的例子&#xff0c;它成功地借助Jenkins和Kubernetes&#xff08;k8s&…

蓝牙技术|Matter或能改变中国智能家居市场,蓝牙技术将得到进一步应用

近年来&#xff0c;智能家居开放协议标准Matter&#xff08;目前版本 1.1&#xff09;由连接标准联盟发布&#xff0c;该联盟是一个由数百家公司组成的全球性机构&#xff0c;旨在提供与物联网 (IoT) 相关的标准。例如&#xff0c;Matter 用于允许 Amazon Alexa、Apple Home、G…

ARM_汇编流水灯

ARM_汇编流水灯 .text .global _start _start: 设置GPIOE寄存器的时钟使能ldr r0,0x50000A28ldr r1,[r0] 从r0为起始地址的4字节数据取出存入r1orr r1,r1,#(0x01<<4) 第4位设置为1 表示开启时钟使能orr r1,r1,#(0x01<<5) 第5位设置为1 表示开启时钟使能str r1…

关于 打开虚拟机出现“...由VMware产品创建,但该产品与此版VMwareWorkstateion不兼容,因此无法使用” 的解决方法

文为原创文章&#xff0c;转载请注明原文出处 本文章博客地址&#xff1a;https://hpzwl.blog.csdn.net/article/details/133678951 红胖子(红模仿)的博文大全&#xff1a;开发技术集合&#xff08;包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软硬结…

【1++的Linux】之文件(一)

&#x1f44d;作者主页&#xff1a;进击的1 &#x1f929; 专栏链接&#xff1a;【1的Linux】 文章目录 一&#xff0c;初识文件二&#xff0c;文件接口 一&#xff0c;初识文件 文件就是文件内容属性。因此对文件的操作无非就是对文件内容的操作和对文件属性的操作。 我们访问…

数据结构--》解锁数据结构中树与二叉树的奥秘(一)

数据结构中的树与二叉树&#xff0c;是在建立非线性数据结构方面极为重要的两个概念。它们不仅能够模拟出生活中各种实际问题的复杂关系&#xff0c;还常被用于实现搜索、排序、查找等算法&#xff0c;甚至成为一些大型软件和系统中的基础设施。 无论你是初学者还是进阶者&…

遥感数据与作物模型同化:遥感数据、PROSAIL模型、DSSAT模型、参数敏感性分析、数据同化算法、模型耦合

查看原文>>>遥感数据与作物模型同化实践技术应用 基于过程的作物生长模拟模型DSSAT是现代农业系统研究的有力工具&#xff0c;可以定量描述作物生长发育和产量形成过程及其与气候因子、土壤环境、品种类型和技术措施之间的关系&#xff0c;为不同条件下作物生长发育及…

【目标检测】大图包括标签切分,并转换成txt格式

前言 遥感图像比较大&#xff0c;通常需要切分成小块再进行训练&#xff0c;之前写过一篇关于大图裁切和拼接的文章【目标检测】图像裁剪/标签可视化/图像拼接处理脚本&#xff0c;不过当时的工作流是先将大图切分成小图&#xff0c;再在小图上进行标注&#xff0c;于是就不考…

CentOS 7 使用Docker

参考资料 Docker命令大全 黑马程序员docker实操教程 &#xff08;黑马讲的真的不错 容器与虚拟机 安装 yum install -y docker Docker服务命令 启动服务 systemctl start docker停止服务 systemctl stop docker重启服务 systemctl restart docker查看docker服务状态 syste…

kafka的请求处理机制

目录 前言&#xff1a; kafak是如何处理请求的&#xff1f; 控制请求与数据类请求 参考资料 前言&#xff1a; 无论是 Kafka 客户端还是 Broker 端&#xff0c;它们之间的交互都是通过“请求 / 响应”的方式完成的。比如&#xff0c;客户端会通过网络发送消息生产请求给 B…

GBU808-ASEMI小功率开关电源GBU808

编辑&#xff1a;ll GBU808-ASEMI小功率开关电源GBU808 型号&#xff1a;GBU808 品牌&#xff1a;ASEMI 芯片个数&#xff1a;4 封装&#xff1a;GBU-4 恢复时间&#xff1a;&#xff1e;50ns 工作温度&#xff1a;-55C~150C 浪涌电流&#xff1a;200A 正向电流&#…