#include <sys/wait.h>
#include <sys/types.h>
pid_t waitpid(pid_t pid, int *status, int options);
作用:同wait,但可指定pid进程清理,可以不阻塞。
waitpid函数的第二个参数int *status跟wait函数的形参一样,且都是利用相同的宏函数来进一步获取结束进程的状态和终止原因。
第一个形参pid:>0,则回收指定参数(pid)的PID进程;=-1,则回收该父进程的任意一个子进程,相当于wait函数;=0,则回收和当前调用waitpid函数一个组的任意子进程(即跟父进程在同一个组的所有子进程);<-1,则回收指定进程组内的任意子进程。因此,-1的范围最大,所有子进程;其次是小于-1和0,最后是指定具体的子进程。注意,wait函数和waitpid函数只能回收父进程自己的子进程,且一次wait或waitpid调用只能清理一个子进程,清理多个子进程应使用循环。在默认情况下,父进程fork后产生的子进程跟父进程在同一个进程组,因此参数为0时,在这种情况下,相当于回收fork产生的所有子进程。
再次强调:一次wait或waitpid调用只能回收一个子进程,如果回收的是多个子进程,则哪一个子进程先结束,则回收哪一个。如果都回收,则可以采用循环(for、while、do while等)。
第三个参数options:为0,则代表阻塞等待子进程结束,再回收,跟wait一样;为WNOHANG,则不再等待,如果要回收的子进程都在运行,则直接返回0,然后接着执行后续程序;为WUNTRACED,如果子进程由于被停止产生的SIGCHLD,waitpid则立即返回;为WCONTINUED,如果子进程由于被SIGCONT唤醒而产生的SIGCHLD,waitpid则立即返回。
对于waitpid的返回值:如果没有子进程或其它错误原因,则返回-1;如果成功回收子进程,则返回回收的那个子进程的ID;如果第三个参数为WNOHANG,且子进程都在运行,则返回0。
因此:waitpid( -1, NULL,0) 与 wait( NULL )是等效的,都是阻塞等待回收所有子进程。
//代码
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <sys/wait.h>int main(void)
{pid_t pid, pid2, wpid;int flg = 0;pid = fork();pid2 = fork(); //此时总共有4个进程(不包括shell)if(pid == -1){perror("fork error");exit(1);} else if(pid == 0){ //注意:pid=0的进程有两个,子进程和子进程的子进程printf("I'm process child, pid = %d\n", getpid());sleep(5);exit(4);} else { //注意:pid>0的进程有两个,父进程和子进程do {wpid = waitpid(pid, NULL, WNOHANG);printf("---wpid = %d--------%d\n", wpid, flg++);if(wpid == 0){printf("NO child exited\n");sleep(1);}} while (wpid == 0); //子进程不可回收if(wpid == pid){ //回收了指定子进程printf("I'm parent, I catched child process,""pid = %d\n", wpid);} else {printf("other...\n");}}return 0;
}
[root@localhost wait]# ./waitpid
---wpid = 0--------0
NO child exited
I'm process child, pid = 33493
---wpid = -1--------0
I'm process child, pid = 33495
other...
---wpid = 0--------1
NO child exited
---wpid = 0--------2
NO child exited
---wpid = 0--------3
NO child exited
---wpid = 0--------4
NO child exited
---wpid = 33493--------5
I'm parent, I catched child process,pid = 33493
//代码:阻塞回收一个子进程
#include <unistd.h>
#include <stdlib.h>
#include <sys/wait.h>
#include <sys/types.h>int main(int argc, char *argv[])
{int n = 5, i; //默认创建5个子进程pid_t p, q;if(argc == 2) {n = atoi(argv[1]); //将字符串转化为整数}for(i = 0; i < n; i++) {//出口1,父进程专用出口p = fork();if(p == 0)break; //出口2,子进程出口,i不自增else if (i == 3){q = p; //将第4个子进程的ID保存在q中}}if(n == i){sleep(n);printf("I am parent, pid = %d\n", getpid());pid_t pid = waitpid(-1,NULL,0); //等价于 pid_t pid = wait(NULL);if( pid == -1){perror("waitpid");exit(1);}while(1); //让父进程陷入死循环,防止子进程被init回收} else {sleep(i);printf("I'm %dth child, pid = %d\n", i+1, getpid());}return 0;
}
//代码:阻塞回收指定的进程(第4个子进程)if(n == i){sleep(n);printf("I am parent, pid = %d\n", getpid());//pid_t pid = waitpid(-1,NULL,0); //等价于 pid_t pid = wait(NULL);pid_t pid = waitpid(q,NULL,0);
if( pid == -1){perror("waitpid");exit(1);}while(1); //让父进程陷入死循环,防止子进程被init回收} else {sleep(i);printf("I'm %dth child, pid = %d\n", i+1, getpid());}//代码:阻塞回收所有的子进程if(n == i){sleep(n);printf("I am parent, pid = %d\n", getpid());//pid_t pid = waitpid(-1,NULL,0); //等价于 pid_t pid = wait(NULL);//pid_t pid = waitpid(q,NULL,0);while(waitpid(-1,NULL,0)); // 等价于while(wait(NULL));while(1); //让父进程陷入死循环,防止子进程被init回收
认回收} else {sleep(i);printf("I'm %dth child, pid = %d\n", i+1, getpid());}//代码:非阻塞(WNOHANG)回收所有的子进程if(n == i){sleep(n);printf("I am parent, pid = %d\n", getpid());//pid_t pid = waitpid(-1,NULL,0); //等价于 pid_t pid = wait(NULL);//pid_t pid = waitpid(q,NULL,0);//while(waitpid(-1,NULL,0)); // 等价于while(wait(NULL));do{
pid_t pid = waitpid(-1,NULL,WNOHANG);if ( pid > 0 )n--;}while( n > 0 )while(1); //让父进程陷入死循环,防止子进程被init回收} else {sleep(i);printf("I'm %dth child, pid = %d\n", i+1, getpid());}
[root@localhost wait]# ps aux
root 34224 57.1 0.0 4164 356 pts/0 R+ 22:58 0:06 ./loop_fork
root 34230 0.0 0.0 123360 1380 pts/2 R+ 22:58 0:00 ps aux
可以看到,所有子进程都被回收,没有僵尸进程。
当第一个参数为-1时,为指定进程组:
[root@localhost wait]# ps ajx
PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND
0 2 0 0 ? -1 S 0 0:00 [kthreadd]
ps ajx指令:PPID为父进程ID;PID为进程ID;PGID为进程组ID。SID为会话ID。
[root@localhost wait]# cat | cat | cat | cat //执行这个命令,然后查看进程组ID
[root@localhost wait]# ps ajx
29904 34326 34326 29904 pts/0 34326 S+ 0 0:00 cat
29904 34327 34326 29904 pts/0 34326 S+ 0 0:00 cat
29904 34328 34326 29904 pts/0 34326 S+ 0 0:00 cat
29904 34329 34326 29904 pts/0 34326 S+ 0 0:00 cat
可以看到这四个进程的进程组ID都一样,属于同一个进程组,为34326。因此要回收这四个子进程,第一个参数为:-34326。 要杀死这四个进程: kill -34326或kill -9 -34326
练习作业:父进程fork 3 个子进程,三个子进程一个调用ps命令, 一个调用自定义程序1(正常),一个调用自定义程序2(会出段错误)。父进程使用waitpid对其子进程进行回收,并指出其状态和退出的原因。