【Linux】进程的进一步认识

目录

进程的创建

fork函数初步认识

fork函数的返回值

写时拷贝

操作系统怎么知道什么时候要写时拷贝的呢?

fork的常规用法

fork调用失败的原因

进程终止

进程的退出场景

进程常见退出方法

正常终止(可以通过 echo $? 查看进程退出码):

main中使用return

_exit函数

exit函数

异常退出:

退出码vs错误码

退出码(Exit Code):

错误码(Error Code):

进程等待

什么是进程等待

进程等待的必要性

wait和waitpid

wait函数

waitpid函数

获取子进程的status

代码实例

除了手动得到退出码和状态码之外的方式

子进程退出会做什么

为什么不用全局变量获取Status

进程等待的方式

进程等待的代码实现

进程程序替换

替换原理

替换函数

函数解释

函数名的解释

exec_调用实例

程序替换的相关知识

预告,下一篇博客将会模拟实现一个


进程的创建

  • 之前我写的初识进程中提到过使用fork函数来创建进程,这次我们来详细的展示fork的使用

fork函数初步认识

  • 在linux中fork函数时非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。

#include <unistd.h>
pid_t fork(void);
//返回值:自进程中返回0,父进程返回子进程id,出错返回-1
  • 进程调用fork,当控制转移到内核中的fork代码后,内核做下面的工作:

  1. 分配新的内存块和内核数据结构给子进程

  2. 将父进程部分数据结构内容拷贝至子进程

  3. 添加子进程到系统进程列表当中

  4. fork返回,开始调度器调度

  • 当一个进程调用fork之后,就有两个二进制代码相同的进程。而且它们都运行到相同的地方。但每个进程都将可以开始它们自己的旅程,看如下程序

int main( void )
{pid_t pid;printf("Before: pid is %d\n", getpid());if ( (pid=fork()) == -1 )perror("fork()"),exit(1);printf("After:pid is %d, fork return %d\n", getpid(), pid);sleep(1);return 0;
}
  • 运行结果:看到了三行输出,一行before,两行after,其中10517既有before又有after,但10518却没有,为什么呢?因为fork之前,父进程独立执行,fork之后,父子进程两个执行流分别执行,但执行的先后顺序取决于调度器

fork函数的返回值

  • 子进程的返回值为0

  • 父进程的返回值为子进程的pid

写时拷贝

  • 通常,父子代码共享,父子再不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副本。具体见下图:

操作系统怎么知道什么时候要写时拷贝的呢?

  • 首先将自己的读写权限改成只读,然后再创建子进程,但用户不知道这个过程!用户可能对某一批数据进行写入,这时页表便会因为权限问题出错,这时操作系统便可以介入了

  • 出错的情况可能有两种:一种是真错了,第二种是误判,这种错误会触发重新申请内存

fork的常规用法

  • 一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子进程来处理请求。

  • 一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数

fork调用失败的原因

  • 系统中有太多的进程

  • 实际用户的进程数超过了限制

进程终止

进程的退出场景

  • 代码运行完毕,结果正确

  • 代码运行完毕,结果不正确

  • 代码异常终止

进程常见退出方法

正常终止(可以通过 echo $? 查看进程退出码):

  1. 从main返回:main函数的返回值一般有三种:第一是代码运行完毕,结果正确,第二是代码运行完毕,结果错误,三是代码异常终止

  2. 调用exit

  3. _exit

main中使用return
  • return退出:return是一种更常见的退出进程方法。执行return n等同于执行exit(n),因为调用main的运行时函数会将main的返回值当做 exit的参数

_exit函数
  • 参数:status 定义了进程的终止状态,父进程通过wait来获取该值。ps:虽然status是int,但仅有低8位可以被父进程所用。所以_exit(-1)时,在终端执行$?发现返回值是255。

exit函数
  • exit最后也会调用exit, 但在调用exit之前,还做了其他工作:

  1. 执行用户通过 atexit或on_exit定义的清理函数。

  2. 关闭所有打开的流,所有的缓存数据均被写入

  3. 调用_exit

异常退出:

  • ctrl + c,信号终止

退出码vs错误码

  • 总的来说,退出码主要用于表示程序或命令的执行结果状态,而错误码则用于标识程序执行中的具体错误类型。退出码通常是整数值,用于表示成功或失败,而错误码则是用来描述错误的具体性质和原因。在实际编程中,这两个概念经常同时使用,以便更好地管理和处理程序执行过程中可能出现的各种情况。

退出码(Exit Code):

  • 退出码是一个整数值,用来表示一个程序或命令在执行完毕后的状态。

  • 在 Unix/Linux 系统中,程序执行完毕后会返回一个退出码。通常情况下,0 表示成功完成,而其他非零值则表示出现了某种错误或异常情况。

  • 退出码可以用来告诉调用者程序执行的结果,以便后续的处理或判断。比如在 Shell 脚本中可以根据不同的退出码进行条件判断和处理。

错误码(Error Code):

  • 错误码是用来表示程序执行中发生错误或异常情况时的特定代码或值,通常用于标识和区分不同类型的错误。

  • 错误码可以是预定义的常量、枚举值,也可以是系统提供的标准错误码。通过错误码,程序可以更精确地了解发生的错误类型,从而进行相应的处理。

  • 错误码通常用来指示具体的错误原因,帮助开发人员诊断和调试程序中的问题。

进程等待

什么是进程等待

  • 通过wait/waitpid函数让父进程(一般)对子进程进行资源回收的等待

进程等待的必要性

  • 之前讲过,子进程退出,父进程如果不管不顾,就可能造成‘僵尸进程’的问题,进而造成内存泄漏。

  • 另外,进程一旦变成僵尸状态,那就刀枪不入,“杀人不眨眼”的kill -9 也无能为力,因为谁也没有办法杀死一个已经死去的进程。

  • 最后,父进程派给子进程的任务完成的如何,我们需要知道。如,子进程运行完成,结果对还是不对,或者是否正常退出。

  • 父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息。父进程创建子进程,是为了让子进程来完成任务,而子进程将任务的完成的情况要想让父进程知道,要通过进程等待的方式,获取子进程的退出信息(信号编号、退出码)

wait和waitpid

  • 如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并且释放资源,获得子进程退出信息。

  • 如果在任意时刻调用wait/waitpid,子进程存在且正常运行,则进程可能阻塞。

  • 如果不存在该子进程,则立即出错返回。

wait函数

#include<sys/types.h>
#include<sys/wait.h>
pid_t wait(int*status);
返回值:成功返回被等待进程pid,失败返回-1。
参数:输出型参数,获取子进程退出状态,不关心则可以设置成为NULL

waitpid函数

pid_ t waitpid(pid_t pid, int *status, int options);
返回值:当正常返回的时候waitpid返回收集到的子进程的进程ID;如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0;如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;
参数:pid:Pid=-1,等待任一个子进程。与wait等效。Pid>0.等待其进程ID与pid相等的子进程。status:WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)options:WNOHANG: 若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的ID。

获取子进程的status

  • wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。

  • 如果传递NULL,表示不关心子进程的退出状态信息。

  • 否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。

  • status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特位)

  • 当一个进程因为收到信号退出了,看退出码便没有意义了

  • 怎么判断是否因为信号退出?看退出码是否为零

  • 如果手动杀掉子进程,也会反馈退出码

代码实例

#include <sys/wait.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>
int main( void )
{pid_t pid;if ( (pid=fork()) == -1 )perror("fork"),exit(1);if ( pid == 0 ){sleep(20);exit(10);} else {int st;int ret = wait(&st);if ( ret > 0 && ( st & 0X7F ) == 0 ){ // 正常退出printf("child exit code:%d\n", (st>>8)&0XFF);} else if( ret > 0 ) { // 异常退出printf("sig code : %d\n", st&0X7F );}}
}
  • 正常退出

  • 手动杀掉进程

除了手动得到退出码和状态码之外的方式

子进程退出会做什么

  • 子进程退出的后,要修改进程状态为Z,并将子进程退出信号和退出码写入PCB中

为什么不用全局变量获取Status

  • 因为进程之间具有独立性(不要觉得写在一份代码里就会混在一起),父进程无法直接获取子进程的退出信息

进程等待的方式

  • 阻塞式:子进程不退出,wait/waitpid不返回

  • 非阻塞式:如果等待的条件不满足,wait/waitpid不阻塞,而是立即返回

  • 常常使用轮询+非阻塞方案进行进程等待。好处是在等待的过程中可以顺便做一下自己手上占据时间并不多的事情。

进程等待的代码实现

  • wait/waitpid等待方式的选择(原谅机翻)

  • 进程的阻塞等待方式

#include <sys/wait.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>
int main()
{pid_t pid;pid = fork();if(pid < 0){printf("%s fork error\n",__FUNCTION__);return 1;} else if( pid == 0 ){ //childprintf("child is run, pid is : %d\n",getpid());sleep(5);exit(257);} else{int status = 0;pid_t ret = waitpid(-1, &status, 0);//阻塞式等待,等待5Sprintf("this is test for wait\n");if( WIFEXITED(status) && ret == pid ){printf("wait child 5s success, child return code is :%d.\n",WEXITSTATUS(status));}else{printf("wait child failed, return.\n");return 1;}}return 0;
}

  • 进程的非阻塞式等待

#include <stdio.h> 
#include <unistd.h>
#include <stdlib.h>
#include <sys/wait.h>
int main()
{pid_t pid;pid = fork();if(pid < 0){printf("%s fork error\n",__FUNCTION__);return 1;}else if( pid == 0 ){ //childprintf("child is run, pid is : %d\n",getpid());sleep(5);exit(1);} else{int status = 0;pid_t ret = 0;do{ret = waitpid(-1, &status, WNOHANG);//非阻塞式等待if( ret == 0 ){printf("child is running\n");}sleep(1);}while(ret == 0);if( WIFEXITED(status) && ret == pid ){printf("wait child 5s success, child return code is :%d.\n",WEXITSTATUS(status));}else{printf("wait child failed, return.\n");return 1;}}return 0;
}
  • 三种返回值:大于零代表成功;等于零代表等待成功,但对方还没退出;小于零代表等待失败

进程程序替换

  • 我们所创建的子进程所执行的代码都是父进程的一部分,如果我们想让子进程执行新的代码和访问新的数据呢?这就需要进程程序替换

替换原理

  • 用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。

替换函数

  • 其实有六种以exec开头的函数,统称exec函数

#include <unistd.h>`
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ...,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
<!--StartFragment-->int execve\(const char \*path, char \*const argv\[\], char \*const envp\[\]\);<!--EndFragment-->

函数解释

  • 这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回。

  • 如果调用出错则返回-1

  • 所以exec函数只有出错的返回值而没有成功的返回值。

函数名的解释

  • l(list) : 表示参数采用列表

  • v(vector) : 参数用数组

  • p(path) : 有p自动搜索环境变量PATH

  • e(env) : 表示自己维护环境变量

exec_调用实例

#include <unistd.h>
int main()
{char *const argv[] = {"ps", "-ef", NULL};char *const envp[] = {"PATH=/bin:/usr/bin", "TERM=console", NULL};execl("/bin/ps", "ps", "-ef", NULL);// 带p的,可以使用环境变量PATH,无需写全路径execlp("ps", "ps", "-ef", NULL);// 带e的,需要自己组装环境变量execle("ps", "ps", "-ef", NULL, envp);execv("/bin/ps", argv);// 带p的,可以使用环境变量PATH,无需写全路径execvp("ps", argv);// 带e的,需要自己组装环境变量execve("/bin/ps", argv, envp);exit(0);
}
  • 事实上,只有execve是真正的系统调用,其它五个函数最终都调用 execve,所以execve在man手册 第2节,其它函数在man手册第3节。这些函数之间的关系如下图所示

程序替换的相关知识

  • 当我们进行程序替换的时候,子进程对应的环境变量是可以直接从父进程中来的

  • 父进程的环境变脸来自于bash

  • 环境变量被子进程继承下去是一种默认的行为,不受程序替换的影响。并且是通过地址空间来让子进程继承父进程的环境变量

预告,下一篇博客将会模拟实现一个

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/767017.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot从入门到实战

课程介绍 本课程从SpringBoot的最基础的安装、配置开始到SpringBoot的日志管理、Web业务开发、数据存储、数据缓存&#xff0c;安全控制及相关企业级应用&#xff0c;全程案例贯穿&#xff0c;案例每一步的都会讲解实现思路&#xff0c;全程手敲代码实现。让你不仅能够掌Sprin…

【Linux操作系统】:进程控制

目录 一、程序地址空间 1.C/C中的程序地址空间 2.进程地址空间 进程地址空间概念 什么是地址空间&#xff1f;什么是区域划分&#xff1f; 为啥要有地址空间&#xff1f; 地址空间的补充 二、进程创建 1.fork函数 2.写时拷贝 3.fork常规用法 4.fork调用失败的原因 …

Android冷启动优化

一、应用启动的三种状态 冷启动&#xff1a;系统不存在App进程&#xff08;APP首次启动或APP被完全杀死&#xff09;时启动APP&#xff0c;此时&#xff0c;APP的启动将经历两个阶段&#xff1a; 1、创建app进程&#xff1a;系统启动应用程序进程和虚拟机&#xff0c;创建app…

多线程(8)为什么需要Runnable接口

Runnable接口在Java中的多线程编程中起着关键作用&#xff0c;它提供了一种将执行代码与线程机制分离的方式。我们将通过分析Runnable接口的定义&#xff0c;以及如何与Thread类一起工作来详细解释它的必要性。 Runnable接口的定义&#xff1a; 在Java中&#xff0c;Runnable…

Linux 常用命令 1

Tips&#xff1a;终端热键ctrl shift 放大终端窗口的字体 ctrl - 缩小终端窗口的字体 注意区分大小写 查阅命令帮助信息&#xff1a; 1&#xff09;--help command –help(两个减号) 显示command命令的帮助信息 2&#xff09;man man command 查阅command命令的使…

MyEclipse打开文件跳转到notepad打开问题

问题描述 windows系统打开README.md文件&#xff0c;每次都需要右键选择notepad打开&#xff0c;感觉很麻烦&#xff0c;然后就把README.md文件打开方式默认选择了notepad&#xff0c;这样每次双击就能打开&#xff0c;感觉很方便。 然后某天使用MyEclipse时&#xff0c;双击RE…

分布式详解

文章目录 概述分布式开发优点和缺点分布式存在的作用分布式和集群的区别集群的特点集群脑裂BASE 理论BASE 理论的三要素CAP理论二段式满足cap理论的哪两个理论 分析下分布式强一致性、弱一致性、最终一致性衡量分布式系统的指标分布式下down机的处理⽅案分布式系统设计paxos和r…

matlab实现神经网络检测手写数字

一、要求 1.计算sigmoid函数的梯度&#xff1b; 2&#xff0e;随机初始化网络权重&#xff1b; 3.编写网络的代价函数。 二、算法介绍 神经网络结构&#xff1a; 不正则化的神经网络的代价函数&#xff1a; 正则化&#xff1a; S型函数求导&#xff1a; 反向传播算法&…

【Linux】Linux工具学习之git

&#x1f525;博客主页&#xff1a; 小羊失眠啦. &#x1f3a5;系列专栏&#xff1a;《C语言》 《数据结构》 《C》 《Linux》 《Cpolar》 ❤️感谢大家点赞&#x1f44d;收藏⭐评论✍️ 文章目录 前言一、账号注册1.1 GitHub与Gitee 二、构建仓库三、安装git 四、配置git五、克…

详解库和程序运行过程

我最近开了几个专栏&#xff0c;诚信互三&#xff01; > |||《算法专栏》&#xff1a;&#xff1a;刷题教程来自网站《代码随想录》。||| > |||《C专栏》&#xff1a;&#xff1a;记录我学习C的经历&#xff0c;看完你一定会有收获。||| > |||《Linux专栏》&#xff1…

lvgl 窗口 windows lv_port_win_visual_studio 版本 已解决

不知道的东西&#xff0c;不知道lvgl窗口。一切从未知开始 lv_port_win_visual_studio 主分支 对应的分支 v7版本更新git submodule update --init --recursive同步 lvgl代码随后打开 visualSudio 打开.sln 文件 编译 release模式 允许 一切正常代码部分

perl:获取同花顺数据--业绩预告,送股派息

perldoc LWP::UserAgent 如果没有安装&#xff0c;则安装模块&#xff0c;运行 cpanm LWP::UserAgent 。 编写 get_yjyg_10jqka.pl 如下 #!/usr/bin/perl # perl 获取同花顺数据--业绩预告 use LWP::UserAgent; use Encode qw(decode encode); use POSIX; use Data::Dump…

JavaWeb——Servlet

请求转发是一次转发请求转发URL地址不会发生变化&#xff0c;会保留当前Servlet的资源访问路径共享同一个Request作用域&#xff0c;可用于多页面之间传递数据 getServletContext() 返回一个ServletContext()对象 获取请求头信息 getHeader(String key)根据key获取value 例如 r…

Element UI el-dialog自由拖动功能

1.创建drag .js文件 /*** 拖拽移动* param {elementObjct} bar 鼠标点击控制拖拽的元素* param {elementObjct} target 移动的元素* param {function} callback 移动后的回调*/ export function startDrag(bar, target, callback) {var params {top: 0,left: 0,currentX: …

学习资料记录

http://interview.wzcu.com/Golang/%E4%BB%A3%E7%A0%81%E8%80%83%E9%A2%98.html map底层 https://zhuanlan.zhihu.com/p/616979764 go修养 https://www.yuque.com/aceld/golang/ga6pb1#4b19dba5 https://golang.dbwu.tech/performance/map_pre_alloc/ https://juejin.cn/pos…

C++11新特性:sizeof... 运算符

在 C11 及其后续版本中&#xff0c;引入了一项新的语言特性——sizeof...运算符&#xff0c;这是一个与模板编程紧密相关的特性。 你没看错&#xff0c;sizeof 后面是三个点&#xff1a;sizeof... sizeof...运算符用于计算变参模板&#xff08;variadic template&#xff09;…

考研数学基础差,跟宋浩?

宋浩老师的课程我大一的时候听过&#xff0c;是我大一高数的救命恩人&#xff01; 不过&#xff0c;考研的针对性很强&#xff0c;基础差听宋浩老师的课程不如直接听汤家凤老师的课程&#xff0c;因为汤家凤老师的课程是专门为考研数学设计的&#xff0c;针对性很强。 汤家凤老…

K8S之DaemonSet控制器

DaemonSet控制器 概念、原理解读、应用场景概述工作原理典型的应用场景介绍DaemonSet 与 Deployment 的区别 解读资源清单文件实践案例 概念、原理解读、应用场景 概述 DaemonSet控制器能够确保K8S集群所有的节点都分别运行一个相同的pod副本&#xff1b; 当集群中增加node节…

Django之Celery篇(一)

一、介绍 Celery是由Python开发、简单、灵活、可靠的分布式任务队列,是一个处理异步任务的框架,其本质是生产者消费者模型,生产者发送任务到消息队列,消费者负责处理任务。 Celery侧重于实时操作,但对调度支持也很好,其每天可以处理数以百万计的任务。特点: 简单:熟悉…

监控系统Prometheus--入门

文章目录 Prometheus特点易于管理监控服务的内部运行状态强大的数据模型强大的查询语言PromQL高效可扩展易于集成可视化开放性 Prometheus架构Prometheus 生态圈组件架构理解 Prometheus的安装安装Prometheus Server上传安装包解压安装包修改配置文件 prometheus.yml 安装Pushg…