Linux:进程控制(三)——进程程序替换

目录

一、概念

二、使用

1.单进程程序替换

2.多进程程序替换

3.exec接口

4.execle 


一、概念

  • 背景

        当前进程在运行的时候,所执行的代码来自于自己的源文件。使用fork创建子进程后,子进程执行的程序中代码内容和父进程是相同的,如果子进程想要执行其他程序的代码呢?

  • 概念

        子进程通过调用一类exec接口来执行另一个程序,这种操作称为程序替换

  • 原理

        如下是一个进程的信息蓝图。

        现在,这个进程想要执行其他程序。

        调用exec这类函数所做的工作就是,将其他程序的代码和数据覆盖式的写入到之前这个程序代码和数据的物理内存空间中,也可能开辟新的空间用来存储,或许还会修改页表的映射关系,总之,这个操作的结果就是,发生替换后,CPU在执行这个进程的时候,代码和数据已经是其他程序的。

  • 程序替换而不是进程替换

        程序替换过程中,只是将程序的代码和数据做了替换,并不是替换进程,所以,这个过程并没有创建新的进程,进程的PID不会发生变化

二、使用

        程序替换过程需要从外设加载数据到内存,因此程序替换这个工作一定是由操作系统来执行的,所以程序替换必然会使用系统调用,先介绍一下相关的接口函数。

        查看man手册,发现有6个接口是语言函数。

man execl
EXEC(3)              Linux Programmer's Manual                                              NAMEexecl, execlp, execle, execv, execvp, execvpe - execute a fileSYNOPSIS#include <unistd.h>extern char **environ;int execl(const char *pathname, const char *arg, .../* (char  *) NULL */);int execlp(const char *file, const char *arg, .../* (char  *) NULL */);int execle(const char *pathname, const char *arg, .../*, (char *) NULL, char *const envp[] */);int execv(const char *pathname, char *const argv[]);int execvp(const char *file, char *const argv[]);int execvpe(const char *file, char *const argv[],char *const envp[]);

        在man手册中查找系统调用,发现还有一个接口是系统调用。

man execve
EXECVE(2)         Linux Programmer's Manual                                                 NAMEexecve - execute programSYNOPSIS#include <unistd.h>int execve(const char *pathname, char *const argv[],char *const envp[]);

1.单进程程序替换

        以这个函数举例:

int execl(const char *pathname, const char *arg, ... (char  *) NULL);
//第一个参数是待执行程序的路径
//第二个参数是const char * arg
//第三个参数是···即可变参数
//第二个参数和第三个参数(不止一个)是程序的执行选项,传参方式类似于命令行传参
//比如指令 ls -a -l -n
//传参为 "ls","-a","-l","-n"
//注意,参数最终以NULL结尾,不是"NULL"

        编写源文件如下。

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <stdlib.h>int main()
{printf("exec Before\n");execl("/usr/bin/ls","ls","-l","-a","-n",NULL);printf("exec End\n");return 0;
}	
exec Before
总计 36
drwxrwxr-x  2 1000 1000  4096 10月  9 16:30 .
drwxrwxr-x 13 1000 1000  4096 10月  9 10:23 ..
-rw-rw-r--  1 1000 1000    85 10月  9 10:23 Makefile
-rwxrwxr-x  1 1000 1000 17224 10月  9 16:30 myprocess
-rw-rw-r--  1 1000 1000   207 10月  9 16:15 myprocess.c
  • 疑问,程序中最后一行没有打印,原因是什么?

        调用exec类函数完成程序替换后,当前程序的剩余代码都不会再被执行,因为此时执行的代码已经是另外一个程序的。

  • 关于exec这类函数的返回值

        程序替换成功,则没有返回值,转而执行另外的程序。只有程序替换失败时,才会返回-1,并且设置错误码,如此,调用exec函数后可以直接加一行退出程序的代码,因为程序替换失败时当前程序的运行必然不合预期。

RETURN VALUEThe exec() functions return only if an error has occurred.  The return value is -1, and errno is set to indicate the error.
execl("/usr/bin/ls","ls","-l","-a","-n",NULL);
exit(1);
  • 验证程序替换不会创建新进程

        编写代码如下:

utocoo@utocoo-virtual-machine:~/Desktop/linux/241009$ ll
总计 16
drwxrwxr-x  2 utocoo utocoo 4096 10月 10 10:21 ./
drwxrwxr-x 13 utocoo utocoo 4096 10月  9 10:23 ../
-rw-rw-r--  1 utocoo utocoo   85 10月  9 10:23 Makefile
-rw-rw-r--  1 utocoo utocoo  259 10月 10 10:21 myprocess.c
//myprocess.c
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <stdlib.h>int main()
{printf("exec Before\n");printf("I am process,PID:%d\n",getpid());sleep(5);execl("/usr/bin/top","top",NULL);exit(1);printf("exec End\n");return 0;
}	

      执行如下这条指令,在监视窗口观察PID。

while :; do ps ajx | head -1 && ps ajx | grep myprocess | grep -v grep;sleep 1; done

        编译运行可执行程序myprocess,监视窗口打印结果如下。

   PPID     PID    PGID     SID TTY        TPGID STAT   UID   TIME COMMANDPPID     PID    PGID     SID TTY        TPGID STAT   UID   TIME COMMANDPPID     PID    PGID     SID TTY        TPGID STAT   UID   TIME COMMAND2295    3476    3476    2295 pts/0       3476 S+    1000   0:00 ./myprocessPPID     PID    PGID     SID TTY        TPGID STAT   UID   TIME COMMAND2295    3476    3476    2295 pts/0       3476 S+    1000   0:00 ./myprocessPPID     PID    PGID     SID TTY        TPGID STAT   UID   TIME COMMAND2295    3476    3476    2295 pts/0       3476 S+    1000   0:00 ./myprocessPPID     PID    PGID     SID TTY        TPGID STAT   UID   TIME COMMAND2295    3476    3476    2295 pts/0       3476 S+    1000   0:00 ./myprocessPPID     PID    PGID     SID TTY        TPGID STAT   UID   TIME COMMANDPPID     PID    PGID     SID TTY        TPGID STAT   UID   TIME COMMANDPPID     PID    PGID     SID TTY        TPGID STAT   UID   TIME COMMAND

        PID为3476,但是在程序替换后,捕捉不到PID了,原因是可执行程序的名字发生了变化,执行这条语句再来对比PID。

while :; do ps ajx | head -1 && ps ajx | grep top | grep -v grep;sleep 1; done
PPID     PID    PGID     SID TTY        TPGID STAT   UID   TIME COMMAND 
2295    3476    3476    2295 pts/0       3476 S+    1000   0:00 top

        结果符合预期,PID并未发生变化,即没有创建新的进程。

  • 创建一个进程时,先创建PCB、进程地址空间、页表等内容,再将磁盘中的代码和数据加载到内存中。

        程序替换时,由于并不需要创建新的进程,所以只需要将新的程序代码和数据加载到内存中即可。于是,更进一步理解,操作系统在将程序的代码和数据加载到内存中时,是通过程序替换完成的。

2.多进程程序替换

  • 操作举例

        编写代码如下。

int main()
{pid_t id = fork();if(id == 0){printf("exec Before\n");printf("I am child process,PID:%d\n",getpid());sleep(3);execl("/usr/bin/ls","ls","-l",NULL);exit(1);printf("exec End\n");}sleep(1);pid_t rid = waitpid(id,NULL,0);if(rid>0){printf("wait success!\n");}return 0;}

        程序替换的场景,更多的是创建子进程作程序替换,原因很简单,父进程可以获取到程序替换的结果。

        当子进程作程序替换时,此时子进程共享的还是父进程的代码数据,因此发生写时拷贝,不仅是数据发生改变,代码也会发生变化

  • Shell是如何运行指令的?

        指令即一个程序,Shell正在运行时,输入指令后,创建一个子进程,Shell等待子进程(waitpid),子进程此时共享Shell的代码,子进程作程序替换,替换的目标程序就是输入的指令,执行完毕,同时Shell也能获取到子进程的执行结果。

3.exec接口

        前面已经说明了,exec类接口中,语言函数6个,而系统调用只有一个,不难总结出来,函数内部都是封装了系统调用的。

        这些接口的功能大致类似,都是完成程序替换,只是用法传参有所差异。

        先来介绍一下6个接口函数。

int execl(const char *pathname, const char *arg, .../* (char  *) NULL */);
int execlp(const char *file, const char *arg, .../* (char  *) NULL */);
int execle(const char *pathname, const char *arg, .../*, (char *) NULL, char *const envp[] */);
int execv(const char *pathname, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execvpe(const char *file, char *const argv[],char *const envp[]);

        它们都以exec*开头,只是后缀有所区别,有l 、p、e、v

        在介绍函数用法之前,先来区分它们后缀,因为不同的后缀就表示了它们不同的用法。

l(list) : 表示参数采用列表
v(vector) : 参数用数组
p(path) : 有p自动搜索环境变量PATH
e(env) : 表示自己维护环境变量

        你可能对这些后缀的意义不明所以,下面来看用法。

  • execlp
int execlp(const char *file, const char *arg, ... /* (char  *) NULL */);

        这个函数包含两个后缀l、p

        包含p,说明带环境变量,在程序替换时,目标程序可以只给出名字,不用给出全部路径,因为环境变量已经包含了一部分,比如系统的指令。

        list则说明需要列表式的传参。

execlp("ls","ls","-l","-a",NULL);

        值得一提的是,前两个参数一模一样,但是并不冲突,二者的意义不一样,第一个参数表示目标程序,第二个参数(不止一个)表示执行目标程序的方式,其他参数"-l"、"-a"含义上也是第二个参数。

  • execv
int execv(const char *pathname, char *const argv[]);

        关于argv这个指针数组,这一文中Linux:环境变量介绍main函数的参数时也提到了。这个数组的元素是一个个的指针,每一个指针指向一个字符串,这些字符串其实就是原来使用execl传参时的字符串。

char* const argv[]={(char*)"ls",(char*)"-l",(char*)"-a",NULL};
execv("/usr/bin/ls",argv);
  • execvp
int execvp(const char *file, char *const argv[]);
execvp("ls",argv);

4.execle 

int execle(const char *pathname, const char *arg, ...
/*, (char *) NULL, char *const envp[] */);

        在介绍这个函数用法之前,要给出一个结论:exec*类函数,可以替换系统的指令,也可以替换任何程序,比如cpp、python、java程序。(C++程序的源文件后缀有.cc、.cpp、.cxx)

        即,程序替换可能发生的情况:使用C语言程序运行的进程,创建子进程后,子进程程序可能被替换为Java程序,等等类似的情况,从这一层面看,程序替换的意义重大!!!

        发生上面所述情况的原因只有一个,就是无论是何种语言编写的程序,在运行之后,都是由操作系统统一管理的进程!!!

        在替换这一层,只有被区分为代码和数据的二进程内容,没有语言的差异,因此替换只是二进制文本被替换。

        使用Makefile文件时,由于make指令只生成第一个可执行程序,因此,想要一次编译链接多个源文件,可以使用下面这样的方式。

.PHONY:all
all:mytest myprocessmytest:mytest.ccg++ -o $@ $^ -g -std=c++11
myprocess:myprocess.cgcc -o $@ $^ -g -std=c99
.PHONY:clean
clean:rm -f myprocess

        在 Linux:环境变量一文中,总结出环境变量可以被子进程继承,环境变量具备了全局属性

        现在将这些联系起来,操作系统启动Bash程序,等待命令行输入,命令行输入指令,Bash将输入的指令字符串作为exec函数的参数,然后子进程作程序替换,这些参数传给了目标程序的main函数。

        但是环境变量并不是通过传参这样的方式传递的


        编写代码如下,子进程程序被替换为由mytest.cc生成的C++程序,在mytest.cc中打印环境变量,得到结果符合预期。但是在替换程序时调用exec函数时并没有传环境变量的参数

//myprocess.c程序替换时没有传环境变量的参数
execl("./mytest","mytest",NULL);
//mytest.cc打印环境变量
#include <iostream>
#include <unistd.h>
using namespace std;
int main()
{for(int i =0;environ[i];++i){cout <<"environ["<< i << "]" << ":"<< environ[i] << endl;}return 0;
}
//打印结果是有环境变量的
exec Before
I am process,PID:2819
environ[0]:SHELL=/bin/bash
environ[1]:SESSION_MANAGER=local/utocoo-virtual-machine:@/tmp/.ICE-unix/1578,unix/utocoo-virtual-machine:/tmp/.ICE-unix/1578
environ[2]:QT_ACCESSIBILITY=1
environ[3]:COLORTERM=truecolor
······

        在Linux:地址分区一文中,我有写到,命令行参数、环境变量在虚拟地址空间中的大致位置。

        一个进程的PCB信息包含着虚拟地址空间、页表等内容。当子进程由父进程创建后,子进程有着自己的PCB、虚拟地址空间等,而程序替换不会将物理内存中的环境变量数据替换,因此,子进程是通过继承虚拟地址空间的方式继承全局环境变量


  • 拥有自己的环境变量

        当前进程myprocess想要拥有一个自己的环境变量,可以用函数putenv来实现,这个环境变量会被myprocess的子进程继承,但是它的父进程bash则不包含这个环境变量。

        在myprocess.c的源文件中添加下面一行代码用来导出环境变量。

putenv("NewENV=~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~");

        在命令行中查看是否有环境变量NewENV,打印结果说明bash(myprocess的父进程)没有这个环境变量。

utocoo@utocoo-virtual-machine:~/Desktop/linux/241009$ echo $NewEnvutocoo@utocoo-virtual-machine:~/Desktop/linux/241009$ 

       运行myprocess后,做程序替换操作,打印环境变量,发现子进程会继承环境变量。

······
environ[53]:LC_NUMERIC=zh_CN.UTF-8
environ[54]:_=./myprocess
environ[55]:OLDPWD=/home/utocoo/Desktop/linux
environ[56]:NewENV=~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

        新增环境变量会被子进程继承,但不影响父进程的环境变量


        现在我们清楚的知道,每一个进程的环境变量都会继承于父进程,如果现在要求新建的一个子进程拥有全新的环境变量,不继承父进程的环境变量,要如何做呢?

        使用带e的exec*接口

        编写代码如下。

//myprocess.c
int main()
{printf("I am process,PID:%d\n",getpid());sleep(3);char* const env[]={(char*)"1+1=2",(char*)"2+2=3",NULL};pid_t id = fork();if(id ==0){printf("exec Before\n");execle("./mytest","mytest",NULL,env);exit(1);printf("exec End\n");}pid_t rid = waitpid(id,NULL,0);return 0;
}

        程序运行结果如下,结果显示子进程没有继承父进程的环境变量。

utocoo@utocoo-virtual-machine:~/Desktop/linux/241009$ ./myprocess 
I am process,PID:3353
exec Before
environ[0]:1+1=2
environ[1]:2+2=3

        这就是带e的exec接口的使用场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/56392.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python基础语法条件

注释 注释的作用 通过用自己熟悉的语言&#xff0c;在程序中对某些代码进行标注说明&#xff0c;这就是注释的作用&#xff0c;能够大大增强程序的可读性。 注释的分类及语法 注释分为两类&#xff1a;单行注释 和 多行注释。 单行注释 只能注释一行内容&#xff0c;语法如下…

跟着小土堆学习pytorch(一)——Dataset

文章目录 一、前言二、dataset三、代码展示 一、前言 pytorch也是鸽了很久了&#xff0c;确定了下&#xff0c;还是用小土堆的教程。 kaggle获取数据集 二、dataset dateset&#xff1a;数据集——提供一种方式去获取数据及其标签 如何获取数据及其标签以及总共多少个数据…

PostgreSQL学习笔记六:模式SCHEMA

模式&#xff08;Schema&#xff09; PostgreSQL中的模式&#xff08;Schema&#xff09;是一个命名的数据库对象集合&#xff0c;包括表、视图、索引、数据类型、函数、存储过程和操作符等。模式的主要作用是组织和命名空间数据库对象&#xff0c;使得同一个数据库中可以包含…

基于gewechat制作第一个微信聊天机器人

Gewe 个微框架 GeWe&#xff08;个微框架&#xff09;是一个创新性的软件开发框架&#xff0c;为个人微信号以及企业信息安全提供了强大的功能和保障。GeWe的设计旨在简化开发过程&#xff0c;使开发者能够高效、灵活地构建和定制通信协议&#xff0c;以满足不同应用场景的需求…

JavaScript object(2)

这样的话&#xff0c;就变成只读了。

外包干了5天,技术明显退步

我是一名本科生&#xff0c;自2019年起&#xff0c;我便在南京某软件公司担任功能测试的工作。这份工作虽然稳定&#xff0c;但日复一日的重复性工作让我逐渐陷入了舒适区&#xff0c;失去了前进的动力。两年的时光匆匆流逝&#xff0c;我却在原地踏步&#xff0c;技术没有丝毫…

Qualitor checkAcesso.php 任意文件上传漏洞复现(CVE-2024-44849)

0x01 漏洞概述 Qualitor 8.24及之前版本存在任意文件上传漏洞,未经身份验证远程攻击者可利用该漏洞代码执行,写入WebShell,进一步控制服务器权限。 0x02 复现环境 FOFA:app="Qualitor-Web" 0x03 漏洞复现 PoC POST /html/ad/adfilestorage/request/checkAcess…

【IC验证】随机约束

1.约束 &#xff08;1&#xff09;注意 一般随机约束只能在类中使用&#xff1b; &#xff08;2&#xff09;实现步骤 在定义变量时&#xff0c;用rand/randc关键字进行修饰&#xff1b; 定义约束&#xff1b; 创建并实例化类后&#xff0c;调用随机约束方法&#xff1b; &am…

光平面标定代码

本篇文章主要给出光平面标定代码&#xff0c;鉴于自身水平所限&#xff0c;如有错误&#xff0c;欢迎批评指正。&#xff08;欢迎进Q群交流&#xff1a;874653199&#xff09; 数据分为棋盘格数据和激光条数据&#xff0c;激光条数据为在第22个位姿至第26个位姿下打在棋盘格标定…

初识Linux之指令(二)

一&#xff1a;head指令 head 与 tail 就像它的名字一样的浅显易懂&#xff0c;它是用来显示开头或结尾某个数量的文字区块&#xff0c;head 用来显示档案的 开头至标准输出中&#xff0c;而 tail 想当然尔就是看档案的结尾。 语法&#xff1a;head 【参数】 【文件】 功能&…

開發 meshtastic 聊天機器人(2)

利用 Web 串接主機附近周邊藍芽(含 meshtastic client) pip install bleak (這個比較簡單) ----另外一個為 pybluez2 (pybluez) 2.程式 import streamlit as st import asyncio from bleak import BleakScannerasync def fetch_data():devices await BleakScanner.discover(…

京存非编存储走进中央民族大学

中央民族大学是一所具有鲜明民族特色的综合性全国重点大学&#xff0c;是国家民委、教育部、北京市共建高校。学校前身为1941年成立的延安民族学院。新中国成立后&#xff0c;经中央政府批准&#xff0c;1951年在北京成立中央民族学院&#xff0c;1993年11月更名为中央民族大学…

【量化交易】聚宽安装

安装JQData 更换源&#xff1a; 如果使用的是pip默认的PyPI源&#xff0c;可以尝试更换为一个更快的国内镜像源。例如阿里云、豆瓣等提供的PyPI镜像。 更改方法可以通过设置环境变量或者在pip命令中直接指定&#xff1a; PS C:\Users\bilirjs\Documents> pip config set …

No.13 笔记 | 网络安全防护指南:从法律法规到技术防御

一、法律法规 《中华人民共和国网络安全法》要点 遵守法律&#xff1a;所有个人和组织在使用网络时&#xff0c;必须遵守宪法和法律&#xff0c;不得利用网络从事危害国家安全等活动。 个人信息保护&#xff1a;禁止非法获取、出售或提供个人信息。若违反但未构成犯罪&#x…

Karmada核心概念

以下内容为翻译&#xff0c;原文地址 Karmada 是什么&#xff1f; | karmada 一、Karmada核心概念 一&#xff09;什么是Karmada 1、Karmada&#xff1a;开放&#xff0c;多云&#xff0c;多集群Kubernetes业务流程 Karmada (Kubernetes Armada)是一个Kubernetes管理系统&…

【NTN 卫星通信】卫星通信的专利

1 概述 好久没有看书了&#xff0c;最近买了本讲低轨卫星专利的书&#xff0c;也可以说是一个分析报告。推荐给喜欢的朋友。 2 书籍截图 图1 封面 图2 波音低轨卫星专利演进 图3 低轨卫星关键技术专利发展阶段 图4 第一页 3 参考文献 产业专利分析报告–低轨卫星通信技术

apisix云原生网关

定义 企业级网关通过域名、路由将请求分发到对应的应用上&#xff0c;通常承载数千个服务的流量&#xff0c;对稳定性有较高要求。 CNCF全景图 选型 Kubernetes抽象出两个核心概念&#xff1a;Service&#xff0c;为多个Pod提供统一的访问入口&#xff1b;Ingress&#xff…

【火山引擎】调用火山大模型的方法 | SDK安装 | 配置 | 客户端初始化 | 设置

豆包 (Doubao) 是字节跳动研发的大规模预训练语言模型。 目录 1 安装 2 配置访问凭证 3 客户端初始化 4 设置地域和访问域名 5 设置超时/重试次数 1 安装 通过pip安装PYTHON SDK。 pip install volcengine-python-sdk[ark] 2 配置访问凭证 获取 API Key 访问凭证具体步…

docker容器运行一段时间提示Failed to initialize NVML: Unknown Error

情况描述 服务器使用docker启动容器。启动以后一切正常也能跑程序。但是&#xff0c;在运行一段时间&#xff08;2天左右不等&#xff09;&#xff0c;会发现gpu掉了。输入nvidia-smi提示 Failed to initialize NVML: Unknown Error 主要发生条件是&#xff0c;docker启动的…

Oracle-19g数据库的安装

简介 Oracle是一家全球领先的数据库和云解决方案提供商。他们提供了一套完整的技术和产品&#xff0c;包括数据库管理系统、企业级应用程序、人工智能和机器学习工具等。Oracle的数据库管理系统是业界最受欢迎和广泛使用的数据库之一&#xff0c;它可以管理和存储大量结构化和…