上文讲了《Linux进程在内核眼中是什么样子的?》,可以理解内核关于进程线程的所有管理就通过一个结构体 —— task_struct。知道了内核眼中进程的描述,本文通过三个例子站在用户态看下进程线程是如何创建的,不同的创建方式又有哪些优劣?
fork例子
先看一个例子:
#include#include#includeint main() { pid_t pid; int cnt = 0; pid = fork(); if(pid<0) printf("error in fork!\n"); else if(pid == 0) { cnt++; printf("cnt=%d\n",cnt); printf("I am the child process,ID is %d\n",getpid()); } else { cnt++; printf("cnt=%d\n",cnt); printf("I am the parent process,ID is %d\n",getpid()); } return 0; }
运行结果为:cnt=1I am the parent process,ID is 15247cnt=1I am the child process,ID is 15248
注意,第二个cnt并不是2,为什么会这个结果呢?因为子进程是父进程的副本,它将获得父进程数据空间、堆、栈等资源的副本。这意味着父子进程间不共享这些存储空间。内核将复制父进程的地址空间内容给子进程,因此,子进程有了独立的地址空间。由于在复制时复制了父进程的堆栈段,所以两个进程都停留在fork函数中,等待返回。因此fork函数会返回两次,一次是在父进程中返回,另一次是在子进程中返回,这两次的返回值是不一样的。调用fork之后,数据、堆栈有两份,但是代码段仍然为一份,这个代码段是两个进程的共享代码段,都从fork函数中返回。当父子进程有一个想要修改数据或者堆栈时,两个进程真正分裂。
fork有两个特点:- “调用一次,返回两次”,在父进程中调用一次,在父进程和子进程中各返回一次。
- 所有由父进程打开的描述符都被复制到子进程中。父、子进程中相同编号的文件描述符在内核中指向同一个file结构体,也就是说,file结构体的引用计数要增加。
vfork例子
把上面程序中的fork改成vfork,运行结果是什么样子的呢?
cnt=1I am the child process,ID is 15385cnt=-486109114I am the parent process,ID is 15384a.out: cxa_atexit.c:100: __new_exitfn: Assertion `l != NULL' failed.Aborted (core dumped)
咦?为什么会有段错误?这是因为没有调用exec函数,vfork()保证子进程先运行,在它调用exec或exit之后父进程才可能被调度运行。我们把上面的程序修改如下:#include#include#includeint main() { pid_t pid; int cnt = 0; pid = vfork(); if(pid<0) printf("error in fork!\n"); else if(pid == 0) { cnt++; printf("cnt=%d\n",cnt); printf("I am the child process,ID is %d\n",getpid()); _exit(0); } else { cnt++; printf("cnt=%d\n",cnt); printf("I am the parent process,ID is %d\n",getpid()); } return 0; }
运行结果如下:cnt=1I am the child process,ID is 15524cnt=2I am the parent process,ID is 15523
可见成功执行了,并且cnt是2。因为调用了exec,使得子进程退出,父进程执行,这样else 后的语句就会被父进程执行,又因在子进程调用exec或exit之前与父进程数据是共享的, 所以子进程退出后把父进程的数据段count改成1 了,子进程退出后,父进程又执行,最终就将cnt变成了2。fork 和 vfork的一些思考
根据上面的例子我们知道 fork 和 vfork 各有优劣,可以用下图大概描述。
图片来自网络fork 要多拷贝一次内存,vfork 用起来又麻烦而且有风险,讲真,并不鼓励用 vfork。那么有没有办法对 fork 做个优化,答案是肯定的。目前内核对 fork 做了写时拷贝(COW)的优化。也就是说,对于fork后并不是立马拷贝内存,而是只有你在需要改变的时候,才会从父进程中拷贝到子进程中,这样fork 后立马执行 exec 的成本就非常小了。clone 创建线程
现在我们知道了创建进程有两种方式:fork,vfork。那么创建线程呢?
首先得知道什么是进程,什么是线程。有句名言 “进程是资源管理的最小单位,线程是程序执行的最小单位。” 在操作系统设计上,从进程演化出线程,最主要的目的就是减小多进程上下文切换开销。
因此进程之间共享代码段,文件描述符,信号处理,全局变量等的话就称为线程,如果不共享,就是我们所说的进程。
线程的创建接口是用 clone,或者经常用的 pthread_create。进程线程创建总图
我们先站在上帝视角以一张图来看下进程线程创建的大体框架,具体的实现下文见。
添加极客助手微信,加入技术交流群
长按,扫码,关注公众号