linux下的僵尸进程处理SIGCHLD信号

什么是僵尸进程

首先内核会释放终止进程(调用了exit系统调用)所使用的所有存储区,关闭所有打开的文件等,但内核为每一个终止子进程保存了一定量的信息。这些信息至少包括进程ID,进程的终止状态,以及该进程使用的CPU时间,所以当终止子进程的父进程调用waitwaitpid时就可以得到这些信息。

而僵尸进程就是指:一个进程执行了exit系统调用退出,而其父进程并没有为它收尸(调用waitwaitpid来获得它的结束状态)的进程。

任何一个子进程(init除外)exit后并非马上就消失,而是留下一个称外僵尸进程的数据结构,等待父进程处理。这是每个子进程都必需经历的阶段。另外子进程退出的时候会向其父进程发送一个SIGCHLD信号。

 

僵尸进程的目的?

设置僵死状态的目的是维护子进程的信息,以便父进程在以后某个时候获取。这些信息至少包括进程ID,进程的终止状态,以及该进程使用的CPU时间,所以当终止子进程的父进程调用waitwaitpid时就可以得到这些信息。如果一个进程终止,而该进程有子进程处于僵尸状态,那么它的所有僵尸子进程的父进程ID将被重置为1init进程)。继承这些子进程的init进程将清理它们(也就是说init进程将wait它们,从而去除它们的僵尸状态)。

 

如何避免僵尸进程?

  1. 通过signal(SIGCHLD, SIG_IGN)通知内核对子进程的结束不关心,由内核回收。如果不想让父进程挂起,可以在父进程中加入一条语句:signal(SIGCHLD,SIG_IGN);表示父进程忽略SIGCHLD信号,该信号是子进程退出的时候向父进程发送的。
  2. 父进程调用wait/waitpid等函数等待子进程结束,如果尚无子进程退出wait会导致父进程阻塞waitpid可以通过传递WNOHANG使父进程不阻塞立即返回
  3. 如果父进程很忙可以用signal注册信号处理函数,在信号处理函数调用wait/waitpid等待子进程退出。
  4. 通过两次调用fork。父进程首先调用fork创建一个子进程然后waitpid等待子进程退出,子进程再fork一个孙进程后退出。这样子进程退出后会被父进程等待回收,而对于孙子进程其父进程已经退出所以孙进程成为一个孤儿进程,孤儿进程由init进程接管,孙进程结束后,init会等待回收。

第一种方法忽略SIGCHLD信号,这常用于并发服务器的性能的一个技巧因为并发服务器常常fork很多子进程,子进程终结之后需要服务器进程去wait清理资源。如果将此信号的处理方式设为忽略,可让内核把僵尸子进程转交给init进程去处理,省去了大量僵尸进程占用系统资源。

 

僵尸进程处理办法

1 wait()函数

#include <sys/types.h>
#include <sys/wait.h>

pid_t wait(int *status);

进程一旦调用了wait,就立即阻塞自己,由wait自动分析是否当前进程的某个子进程已经退出,如果让它找到了这样一个已经变成僵尸的子进程,wait就会收集这个子进程的信息,并把它彻底销毁后返回;如果没有找到这样一个子进程,wait就会一直阻塞在这里,直到有一个出现为止。
参数status用来保存被收集进程退出时的一些状态,它是一个指向int类型的指针。但如果我们对这个子进程是如何死掉的毫不在意,只想把这个僵尸进程消灭掉,(事实上绝大多数情况下,我们都会这样想),我们就可以设定这个参数为NULL,就象下面这样:

  pid = wait(NULL);

如果成功,wait会返回被收集的子进程的进程ID,如果调用进程没有子进程,调用就会失败,此时wait返回-1,同时errno被置为ECHILD

  • wait系统调用会使父进程暂停执行,直到它的一个子进程结束为止。
  • 返回的是子进程的PID,它通常是结束的子进程
  • 状态信息允许父进程判定子进程的退出状态,即从子进程的main函数返回的值或子进程中exit语句的退出码。
  • 如果status不是一个空指针,状态信息将被写入它指向的位置

可以上述的一些宏判断子进程的退出情况:

 

2 waitpid()函数

#include <sys/types.h>
#include <sys/wait.h>

pid_t waitpid(pid_t pid, int *status, int options);

参数:

status:如果不是空,会把状态信息写到它指向的位置,与wait一样

options:允许改变waitpid的行为,最有用的一个选项是WNOHANG,它的作用是防止waitpid把调用者的执行挂起

The value of options is an OR of zero or more  of  the  following  con-
stants:

WNOHANG     return immediately if no child has exited.

WUNTRACED   also  return  if  a  child  has stopped (but not traced via
            ptrace(2)).  Status for traced children which have  stopped
            is provided even if this option is not specified.

WCONTINUED (since Linux 2.6.10)
            also return if a stopped child has been resumed by delivery
            of SIGCONT.

返回值:如果成功返回等待子进程的ID,失败返回-1

对于waitpidp i d参数的解释与其值有关:

pid == -1 等待任一子进程。于是在这一功能方面waitpidwait等效。

pid > 0 等待其进程I Dp i d相等的子进程。

pid == 0 等待其组I D等于调用进程的组I D的任一子进程。换句话说是与调用者进程同在一个组的进程。

pid < -1 等待其组I D等于p i d的绝对值的任一子进程

waitwaitpid区别:

  • 在一个子进程终止前, wait 使其调用者阻塞,而waitpid 有一选择项,可使调用者不阻塞。
  • waitpid并不等待第一个终止的子进程它有若干个选择项,可以控制它所等待的特定进程。
  • 实际上wait函数是waitpid函数的一个特例。waitpid(-1, &status, 0);

 

示例:

如以下代码会创建100个子进程,但是父进程并未等待它们结束,所以在父进程退出前会有100个僵尸进程。

#include <stdio.h>  

#include <unistd.h>  

   

int main() {  

   

  int i;  

  pid_t pid;  

   

  for(i=0; i<100; i++) {  

    pid = fork();  

    if(pid == 0)  

      break;  

  }  

   

  if(pid>0) {  

    printf("press Enter to exit...");  

    getchar();  

  }  

   

  return 0;  

}  

其中一个解决方法即是编写一个SIGCHLD信号处理程序来调用wait/waitpid来等待子进程返回。

 

#include <stdio.h>  

#include <unistd.h>  

#include <signal.h>  

#include <sys/types.h>  

#include <sys/wait.h>  

   

void wait4children(int signo) {  

   

  int status;  

  wait(&status);  

   

}  

   

int main() {  

   

  int i;  

  pid_t pid;  

   

  signal(SIGCHLD, wait4children);  

   

  for(i=0; i<100; i++) {  

    pid = fork();  

    if(pid == 0)  

      break;  

  }  

   

  if(pid>0) {  

    printf("press Enter to exit...");  

    getchar();  

  }  

   

  return 0;  

}  

但是通过运行程序发现还是会有僵尸进程,而且每次僵尸进程的数量都不定。这是为什么呢?其实主要是因为Linux的信号机制是不排队的,假如在某一时间段多个子进程退出后都会发出SIGCHLD信号,但父进程来不及一个一个地响应,所以最后父进程实际上只执行了一次信号处理函数。但执行一次信号处理函数只等待一个子进程退出,所以最后会有一些子进程依然是僵尸进程。

虽然这样但是有一点是明了的,就是收到SIGCHLD必然有子进程退出,而我们可以在信号处理函数里循环调用waitpid函数来等待所有的退出的子进程。至于为什么不用wait,主要原因是在wait在清理完所有僵尸进程后再次等待会阻塞。

 

所以最佳方案如下:

#include <stdio.h>  

#include <unistd.h>  

#include <signal.h>  

#include <errno.h>  

#include <sys/types.h>  

#include <sys/wait.h>  

   

void wait4children(int signo) {  

  int status;  

  while(waitpid(-1, &status, WNOHANG) > 0);  

}  

   

int main() {  

   

  int i;  

  pid_t pid;  

   

  signal(SIGCHLD, wait4children);  

   

  for(i=0; i<100; i++) {  

    pid = fork();  

    if(pid == 0)  

      break;  

  }  

   

  if(pid>0) {  

    printf("press Enter to exit...");  

    getchar();  

  }  

   

  return 0;  

}  

这里使用waitpid而不是使用wait的原因在于:我们在一个循环内调用waitpid,以获取所有已终止子进程的状态。我们必须指定WNOHANG选项,它告诉waitpid在有尚未终止的子进程在运行时不要阻塞。我们不能在循环内调用wait,因为没有办法防止wait在正运行的子进程尚有未终止时阻塞。



关于linux环境下信号SIGCHLD的排队机制 2006-05-31 11:38:35

分类: LINUX


一直对这个问题没有深入的思考过。最近由于项目的需要终于弄清了这个问题。
以下文字是抄袭+理解+估计:

linux系统中,子进程的正常/异常终止都会给父进程发送SIGCHLD的信号,当父进程接收到子进程(第一个)信号进行wait()waitpid()时,会屏蔽掉下一个的SIGCHLD信号,实际的效果就是在信号处理函数返回前不会重入。
那么当父进程在执行信号处理函数时,又有子进程(第二个)退出,那么信号会被阻塞并等待处理,假如(第三个)又来了,那么它是被抛弃的,后续的都会抛弃。。。
所以说信号是阻塞但不排队的。

如果子进程可能会同时退出,那么父进程需要这样来处理以防止僵尸进程的出现:
pid_t childpid;
while( (childpid = waitpid(-1, NULL, WNOHANG)) > 0)
{
 ...
}

这样,即使出现子进程同时退出的情况,SIGCHLD的信号被抛弃也没有关系。waitpid会收集所有当前已终止(实际就是处于僵尸状态)的子进程,直到没有这样的进程状态需要收集(返回0)。



Linux下线程退出时未释放资源的一个原因 (2012-03-26 21:17:25)

sg_trans.gif

转载

标签: linux多线程 释放资源 内存 it 分类: 专业

    有一个简单的多线程服务程序,运行时间一长,内存消耗特别大。这个问题困扰我很久,一直以为有的动态空间没有free,查到最后却发现是线程退出时没有释放系统资源。

    定位了问题,解决就简单了。创建线程时,需设置线程的分离状态。默认为PTHREAD_CREATE_JOINABLE,应调用函数将其设置为PTHREAD_CREATE_DETACHED

    pthread_attr_setdetachstate(&attr,PTHREAD_CREATE_DETACHED)

    一点教训,权为笔记。网上有很多示例代码,不再赘述。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/383267.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c++中的map容器

map/multimap基本概念 Map的特性是&#xff0c;所有元素都会根据元素的键值自动排序。Map所有的元素都是pair&#xff0c;同时拥有实值和键值&#xff0c;pair的第一元素被视为键值&#xff0c;第二元素被视为实值&#xff0c;map不允许两个元素有相同的键值我们可以通过map的…

mknod指令详解

mknod - make block or character special files mknod [OPTION]... NAME TYPE [MAJOR MINOR] option 有用的就是 -m 了 name 自定义 type 有 b 和 c 还有 p 主设备号 次设备号 主设备号是由linux/major.h定义的&#xff0c;如下定义了一个DOC设备&am…

c++中容器(STL)的共性与使用的时机

容器的共通能力 C模板是容器的概念 理论提高&#xff1a;所有容器提供的都是值&#xff08;value&#xff09;语意&#xff0c;而非引用&#xff08;reference&#xff09;语意。容器执 行插入元素的操作时&#xff0c;内部实施拷贝动作。所以 STL 容器内存储的元素必须能够被…

Qt Creator 窗体控件自适应窗口大小布局

常见的软件窗口大小改变&#xff08;最大化、手动改变时&#xff09;需要窗口的部件能够自适应布局&#xff0c;而在Qt的应用程序界面设计中&#xff0c;对于像我一样的初学者如何实现窗口自适应调整还是要绕点弯路的。网上百度了很多&#xff0c;多数说的很含糊&#xff0c;还…

c++中利用STL实现公司员工分组问题

#include<iostream>using namespace std; #include<vector> #include<string> #include<map> #include<ctime> /* 公司招聘了5个员工&#xff0c;5名员工进入公司之后&#xff0c;需要指派员工在那个部门工作 的人员信息&#xff1a;姓名 年龄 电…

c++中STL的常用算法--1(函数对象,谓词,内建函数对象)

函数对象 重载函数调用操作符的类&#xff0c;其对象常称为函数对象&#xff08;function object&#xff09;&#xff0c;即它们是行为类似函数的对象&#xff0c;也叫仿函数&#xff08;functor&#xff09;&#xff0c;其实就是重载"()"操作符&#xff0c;使得类…

QT子线程与主线程的信号槽通信

最近用QT做一个服务器&#xff0c;众所周知&#xff0c;QT的主线程必须保持畅通&#xff0c;才能刷新UI。所以&#xff0c;网络通信端采用新开线程的方式。在涉及到使用子线程更新Ui上的控件时遇到了点儿麻烦。网上提供了很多同一线程不同类间采用信号槽通信的方式&#xff0c;…

ubuntu14.04 通过PPA 安装ffmpeg

去ffmpeg的官网可以获取到最新的PPA信息 http://www.ffmpeg.org/download.html 根据系统选择对应的PPA 然后执行以下语句&#xff1a; sudo add-apt-repository ppa:mc3man/trusty-media sudo apt-get updatesudo apt-get install ffmpeg 如果在安装过程中发生了错误&#…

c++中的函数适配器

函数适配器 函数适配器概念 STL中定义了大量的函数对象&#xff0c;但是有时候需要对函数返回值进行进一步的简单计算&#xff0c;或者填上多余的参数&#xff0c;不能直接代入算法&#xff0c;函数适配器实现了这一功能&#xff0c;将一种函数对象转化为另一种符合要求的函数…

c++中STL的常用算法---2(遍历算法,查找算法)

算法概述 算法主要由头文件组成是所有STL头文件中最大的一个&#xff0c;其中常用的功能涉及到比较&#xff0c;交换&#xff0c;查找&#xff0c;遍历&#xff0c;复制&#xff0c;修改&#xff0c;反转&#xff0c;排序&#xff0c;合并等体积很小&#xff0c;只包括在几个序…

c++中的STL的常用算法---3(排序算法,拷贝和替换算法,算术生成算法,集合算法)

排序算法 merge() 以下是排序和通用算法&#xff1a;提供元素排序策略 merge: 合并两个有序序列&#xff0c;存放到另一个序列。 #include<iostream>using namespace std; #include<algorithm> #include<vector>void test01() {vector<int >v1;vecto…

c++中STL实现演讲比赛流程

演讲比赛流程 1&#xff09;某市举行一场演讲比赛&#xff0c;共有 24 个人参加&#xff0c;按参加顺序设置参赛号。比赛共三轮&#xff0c;前两 轮为淘汰赛&#xff0c;第三轮为决赛。 2&#xff09;比赛方式&#xff1a;分组比赛 第一轮分为 4 个小组&#xff0c;根据参赛号…

c++实现贪吃蛇

游戏中的实现元素 游戏中元素分为&#xff1a;墙壁&#xff0c;蛇&#xff0c;事物以及蛇的可行区域和右侧的版本号和游戏玩法提示 墙壁 *号表示&#xff0c;代表一个区域范围&#xff0c;也就是蛇的可移动区域&#xff0c;蛇如果碰到墙壁视为死亡&#xff0c; 蛇 分为蛇头&a…

Linux系统编程--1(进程和程序,CPU和MMU,PCB,进程状态)

进程相关概念 程序和进程 程序&#xff1a;是指编译好的二进制文件&#xff0c;在磁盘上&#xff0c;不占用系统资源(cpu、内存、打开的文件、设备、锁…) 进程&#xff1a;是一个抽象的概念&#xff0c;与操作系统原理联系紧密。进程是活跃的程序&#xff08;程序员角度&…

C++STL学习

1. STL介绍标准模板库STL是当今每个从事C编程的人需要掌握的技术&#xff0c;所有很有必要总结下本文将介绍STL并探讨它的三个主要概念&#xff1a;容器、迭代器、算法。STL的最大特点就是&#xff1a;数据结构和算法的分离&#xff0c;非面向对象本质。访问对象是通过象指针一…

Linux系统编程--2(环境变量,进程控制)

环境变量 环境变量 是指在操作系统中用来指定操作系统运行环境的一些参数 每个人用电脑的习惯不一样&#xff0c;比如一般把文件放到磁盘&#xff0c;怎么管理文件&#xff0c;用什么编译器&#xff0c;所以&#xff0c;环境变量就是根据每个人使用操作系统的习惯来规定一些参…

STL-vector

STL学习之二 序列容器&#xff08;vector&#xff09;一、C标准模板库提供了三种序列容器&#xff1a;vector、list、deque。类模板vector和deque都以数组为基础&#xff0c;类模板list实现了链表的数据结构。STL中最流行的是类模板vector&#xff0c;它是一种更健壮的数据类型…

套接字编程--1(UDP协议编程,端口号,传输层协议,网络字节序)

传输层的协议&#xff1a; ip地址&#xff1a; 在网络中唯一标识一台主机 IPV4&#xff1a;uint32_t DHCP NATIPV6 : uint8_t addr[16] —向前并不兼容IPV4 每一条数据都必须包含源地址和目的地址&#xff1a;因为每条网络中的数据都必须确定是从那个主机来到那个主机去 端…

ARP简单介绍

ARP简介 ARP&#xff08;Address Resolution Protocol&#xff09;用于将IP地址解析为MAC地址 1. ARP地址解析的必要性 IP地址不能直接用来进行通信&#xff0c;因为网络设备只能识别MAC地址。IP地址只是主机在网络层中的地址&#xff0c;如果要将网络层中传送的数据报交给…