进程的程序替换详解exec函数【Linux】
- 程序替换的原理
- exec系列函数
- 函数理解
- 命令理解(助记)
- 关于程序替换中环境变量的解释
- exec函数之间的关系
- exec函数的使用
- execl
- execlp
- execle
- execv
程序替换的原理
进程的程序替换就是让子进程执行新程序, 执行全新的代码和数据,不再和父进程有瓜葛。
替换原理
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。
- 也就是说程序替换的作用是为了完成一些特定的任务,需要去执行其他的程序。
- 使用exec系列函数可以达到程序替换的目的。
- 程序替换会重新创建虚拟地址,页表,然后将磁盘中的文件加载进物理内存。
- 程序替换会自动释放原来的进程虚拟内存和页表。
- 程序替换时, 虚拟地址空间和页表的映射会变化,PCB里的优先级等信息不变。
exec系列函数
以下函数的参数末尾都一定需要带上一个==“NULL”==。
#include <unistd.h>// path是要替换的程序文件路径+文件名,main函数的argv参数中是什么,这里就怎么写。
int execl(const char *path, const char *arg, ...);// 会自动到环境变量PATH中根据file寻找新程序的文件,所以file可以直接写成文件名即可。
int execlp(const char *file, const char *arg, ...);// 自己可以维护环境变量
int execle(const char *path, const char *arg, ...,char *const envp[]);// 将命令装入数组中,下面的三个函数其余的跟上面的三个函数都是一样的。
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
函数理解
- 这些函数执行成功的话,则加载进新的程序,启动新程序并且从新程序的的开头开始执行,不再返回。
- 如果执行成功,原程序中的后续代码将不再执行,因为eip(程序计数器),已经改变到新程序处。
- 如果调用出错则返回-1.
- 所以exec只有出错的返回值没有成功的返回。毕竟成功的返回值是无意义的。
- 除了系统文件,也可以替换成自定义文件,如: .sh,python,java都可以调用。
命令理解(助记)
-
l(list) : 表示参数采用列表
-
v(vector) : 参数用数组
-
p(path) : 有p自动搜索环境变量PATH
-
e(env) : 表示自己维护环境变量
关于程序替换中环境变量的解释
- 当进行程序替换时,子进程对应的原始环境变量是从父进程中来的,bash拥有最原始的环境变量,后代进程可在其基础上添加并继承自己的父进程的环境变量。
- 环境变量被继承是一种默认行为,不受程序替换的影响。(程序替换只替换代码和数据,不替换环境变量)因为创建子进程都以父进程为模板,父子进程的环境变量指向同一块物理地址,所以一样。
- 如何让子进程获得环境变量。
- 将父进程的环境变量原封不动的传递给子进程(1. 直接用。 2. 直接传)。
- 想传递自己的环境变量,可以直接构建环境变量表,给子进程传递(是覆盖原来环境变量式的传递)
- 新增传递(可以利用putenv()函数)。
exec函数之间的关系
事实上,只有execve是真正的系统调用,其它五个函数最终都调用 execve,所以execve, man手册 第2节,其它函数在man手册第3节。这些函数之间的关系如下图所示。
下图exec函数族 一个完整的例子:
exec函数的使用
execl
int execl(const char *path, const char *arg, ...);
// test.cpp:
#include <iostream>
#include <unistd.h>
int main()
{pid_t fd = fork();if (fd == 0){// childexecl("/root/Y23_12_28/t", "t", "-start", NULL);}return 0;
}
#include <stdio.h>int main(int argc, char *argv[])
{printf("%s %s\n", argv[0], argv[1]);printf("我是t.cpp进程\n");return 0;
}
execlp
int execlp(const char *file, const char *arg, ...);
此时我们打印环境变量PATH:
#include <stdio.h>
#include <unistd.h>
#include <cstdlib>
int main(int argc, char *argv[])
{printf("%s", getenv("PATH"));return 0;
}
打印当前的文件路径cwd:
对比会发现PATH中没有cwd,若是直接使用execlp的话一定会报错。我们来试一下:
#include <stdio.h>
#include <unistd.h>
int main()
{pid_t fd = fork();if (fd == 0){// childint ret = execlp("t", "t", "-start", NULL);if (ret < 0){printf("execpl错误\n");}}return 0;
}
果然报错了,原因是PATH中没有cwd,无法自动找到文件位置。所以我们需要添加环境变量,使用putenv()函数,使用这个函数需要注意的是,会将原来的PATH内容全部清除,然后再添加新的PATH。
//test.cpp:
#include <stdio.h>
#include <unistd.h>
#include <cstdlib>
int main()
{pid_t fd = fork();if (fd == 0){char *old_PATH = getenv("PATH");char new_PATH[] = ":/root/Y23_12_28";char new1[1000];sprintf(new1, "PATH=%s%s", old_PATH, new_PATH);putenv(new1);// childint ret = execlp("t", "t", "-start", NULL);if (ret < 0){printf("execpl错误\n");}}return 0;
}
//t.cpp:
#include <stdio.h>
#include <cstdlib>
#include <unistd.h>
#include <string.h>
int main(int argc, char *argv[])
{printf("%s %s\n", argv[0], argv[1]);printf("我是t.cpp进程\n");return 0;
}
这里有一个需要注意的地方,就是合并新老PATH时,一定不要忘记PATH=%s%s
的PATH=
execle
int execle(const char *path, const char *arg, ...,char *const envp[]);
多出来的这个e表明了可以自己设定环境变量:
// test.cpp
#include <stdio.h>
#include <unistd.h>
#include <cstdlib>
int main()
{pid_t fd = fork();if (fd == 0){char *const envp[] = {"PATH=/root/Y23_12_28", "NULL"};// childint ret = execle("t", "t", "-start", NULL);if (ret < 0){printf("execpl错误\n");}}return 0;
}
execv
int execv(const char *path, char *const argv[]);
v表示使用数组来装载命令, 而不是vector;
#include <stdio.h>
#include <unistd.h>
#include <cstdlib>int main()
{pid_t fd = fork();if (fd == 0){// childchar *arg[3] = {"t", "-start", "NULL"};int ret = execv("/root/Y23_12_28/t", arg);if (ret < 0){printf("execpl错误\n");}}return 0;
}
至于execvp和execve在这里就不过多赘述了。
😄 创作不易,你的点赞和关注都是对我莫大的鼓励,再次感谢您的观看😄