在 Windows 平台下,我们可以通过双击运行可执行程序,让这个可执行程序成为一个进程;而在 Linux 平台,我们可以通过 ./ 运行,让一个可执行程序成为一个进程。
但是,如果我们本来就运行着一个程序(进程),我们如何在这个进程内部启动一个外部程序,由内核将这个外部程序读入内存,使其执行起来成为一个进程呢?这里我们通过 exec 函数族实现。
exec 函数族,顾名思义,就是一簇函数,在 Linux 中,并不存在 exec() 函数,exec 指的是一组函数,一共有 6 个:
#include <unistd.h>
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char * const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
其中只有execve()是真正意义上的系统调用,其它都是在此基础上经过包装的库函数。
exec 函数族提供了六种在进程中启动另一个程序的方法。exec 函数族的作用是根据指定的文件名或目录名找到可执行文件,并用它来取代调用进程的内容,换句话说,就是在调用进程内部执行一个可执行文件。
进程调用一种 exec 函数时,该进程完全由新程序替换,而新程序则从其 main 函数开始执行。因为调用 exec 并不创建新进程,所以前后的进程 ID (当然还有父进程号、进程组号、当前工作目录……)并未改变。exec 只是用另一个新程序替换了当前进程的正文、数据、堆和栈段(进程替换)。
exec 函数族的 6 个函数看起来似乎很复杂,但实际上无论是作用还是用法都非常相似,只有很微小的差别。
l(list):参数地址列表,以空指针结尾。
v(vector):存有各参数地址的指针数组的地址。
p(path):按 PATH 环境变量指定的目录搜索可执行文件。
e(environment):存有环境变量字符串地址的指针数组的地址。
exec 函数族装入并运行可执行程序 path/file,并将参数 arg0 ( arg1, arg2, argv[], envp[] ) 传递给此程序。
exec 函数族与一般的函数不同,exec 函数族中的函数执行成功后不会返回,而且,exec 函数族下面的代码执行不到。只有调用失败了,它们才会返回 -1,失败后从原程序的调用点接着往下执行。
需要C/C++ Linux服务器架构师学习资料加qun获取(资料包括C/C++,Linux,golang技术,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,TCP/IP,协程,DPDK,ffmpeg等),免费分享
execl() 示例代码:
#include <stdio.h>
#include <unistd.h>int main(int argc, char *argv[])
{printf("before execnn");/* /bin/ls:外部程序,这里是/bin目录的 ls 可执行程序,必须带上路径(相对或绝对)ls:没有意义,如果需要给这个外部程序传参,这里必须要写上字符串,至于字符串内容任意-a,-l,-h:给外部程序 ls 传的参数NULL:这个必须写上,代表给外部程序 ls 传参结束*/execl("/bin/ls", "ls", "-a", "-l", "-h", NULL);// 如果 execl() 执行成功,下面执行不到,因为当前进程已经被执行的 ls 替换了perror("execl");printf("after execnn");return 0;
}
运行结果如下:
execv()示例代码:
execv() 和 execl() 的用法基本是一样的,无非将列表传参,改为用指针数组。
#include <stdio.h>
#include <unistd.h>int main(int argc, char *argv[])
{// execv() 和 execl() 的用法基本是一样的,无非将列表传参,改为用指针数组// execl("/bin/ls", "ls", "-a", "-l", "-h", NULL);/* 指针数组ls:没有意义,如果需要给这个外部程序传参,这里必须要写上字符串,至于字符串内容任意-a,-l,-h:给外部程序 ls 传的参数NULL:这个必须写上,代表给外部程序 ls 传参结束*/char *arg[]={"ls", "-a", "-l", "-h", NULL};// /bin/ls:外部程序,这里是/bin目录的 ls 可执行程序,必须带上路径(相对或绝对)// arg: 上面定义的指针数组地址execv("/bin/ls", arg);perror("execv");return 0;
}
execlp() 或 execvp() 示例代码:
execlp() 和 execl() 的区别在于,execlp() 指定的可执行程序可以不带路径名,如果不带路径名的话,会在环境变量 PATH指定的目录里寻找这个可执行程序,而 execl() 指定的可执行程序,必须带上路径名。
#include <stdio.h>
#include <unistd.h>int main(int argc, char *argv[])
{// 第一个参数 "ls",没有带路径名,在环境变量 PATH 里寻找这个可执行程序// 其它参数用法和 execl() 一样execlp("ls", "ls", "-a", "-l", "-h", NULL);/*char *arg[]={"ls", "-a", "-l", "-h", NULL};execvp("ls", arg);*/perror("execlp");return 0;
}
execle() 或 execve() 示例代码:
execle() 和 execve() 改变的是 exec 启动的程序的环境变量(只会改变进程的环境变量,不会影响系统的环境变量),其他四个函数启动的程序则使用默认系统环境变量。
execle()示例代码:
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h> // getenv()int main(int argc, char *argv[])
{// getenv() 获取指定环境变量的值printf("before exec:USER=%s, HOME=%sn", getenv("USER"), getenv("HOME"));// 指针数据char *env[]={"USER=MIKE", "HOME=/tmp", NULL};/* ./mike:外部程序,当前路径的 mike 程序,通过 gcc mike.c -o mike 编译mike:这里没有意义NULL:给 mike 程序传参结束env:改变 mike 程序的环境变量,正确来说,让 mike 程序只保留 env 的环境变量*/execle("./mike", "mike", NULL, env);/*char *arg[]={"mike", NULL}; execve("./mike", arg, env); */perror("execle");return 0;
}
外部程序,mike.c 示例代码:
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>int main(int argc, char *argv[])
{printf("nin the mike fun, after exec: n");printf("USER=%sn", getenv("USER"));printf("HOME=%sn", getenv("HOME"));return 0;
}
运行结果如下: