个人主页:点我进入主页
专栏分类:C语言初阶 C语言进阶 数据结构初阶 Linux C++初阶 算法
欢迎大家点赞,评论,收藏。
一起努力,一起奔赴大厂
一.程序的地址空间
1.1程序的地址空间的引入
我们知道frok可以创建子进程,子进程会继承父进程的大部分属性,如果我们我们给出一个g_val,在子进程和父进程中输入g_val的值以及g_val的地址,会是怎样的结果呢?我们看下面代码:
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>int main()
{int g_val=100;pid_t id=fork();if(id==0){int cnt=5;while(cnt--){printf("I an child process,g_val=%d,&g_val=%p,pid=%d, ppid=%d\n",g_val,&g_val,getpid(),getppid());sleep(1);}}else if(id>0){while(1){printf("I an father process,g_val=%d,&g_val=%p,pid=%d, ppid=%d\n",g_val,&g_val,getpid(),getppid());sleep(1);}}return 0;
}
我们运行后可以看到
父进程的g_val的地址和子进程的g_val的地址相同 ,如果我们,我们将子进程的代码修改,每次让g_val的值加1,会是怎样的结果?我们可以看到一下
g_val的值不同,但是g_val的地址却一样,这是为什么呢?在c语言时我们知道一个地址对应一个值,为什么在这里会出现一个地址对应两个值?这打破了我们的常规认知,其实不然,在以前我们写的都是一个进程,在这里是两个进程,这其中自然有一些差别,那这是如何实现的呢?这与程序的地址空间有关,这里的地址也不是物理地址,是虚拟地址。
1.2程序地址空间概图
1.2.1不修改值时
程序的地址空间是怎样的呢?我们可以看下面的图
父进程有一个g_val虚拟地址是0x7ffe258b87bc,在父进程的地址空间中会有个初始化数据,里面的g_val地址也是虚拟地址,同时还有一个页表,页表有两部分,一部分是虚拟地址,一部分是物理地址,它相当于一个映射进程的虚拟地址对应者相应的物理地址。由于子进程会继承父进程的代码和数据以及大部分属性,所以子进程会继承父进程的task_struct,继承父进程的地址空间,父进程的页表,也就是说会进程一次浅拷贝。
1.2.2修改值时
在上面我们有一个修改g_val的值,那它和上面的过程一样吗?事实上是类似的,当我们想要修改值时,会发生一次写时拷贝,写时拷贝是什么呢?写的时候再进程修改,我们看下面的图
子进程会将父进程的代码。数据。mm_struct,task_struct进行拷贝,在物理空间中重新开辟一次g_val进行写。
1.3理解地址空间
进程有独立的地址空间,独立的页表,如果父进程和子进程不写,一个全局变量(类似于g_val的变量),默认会被子进程和父进程共享(只读)。那为什么这样干呢?如果我们不采用写时拷贝,只要有一个子进程就会在物理内存上开辟一块空间,这样有一定的缺点,有时候我们并不会修改值,会造成没有意义的空间开辟,那我们采用写时拷贝会不会很慢呢?当然不会,我们开辟的时候就拷贝,和用的时候再拷贝,我们采用写时拷贝还会减少拷贝的次数,效率更快,更节省空间,写时拷贝就是我都你不会用。
1.3.1为什么要有地址空间(地址空间的优点)
首先页表和地址空间可以将无序变为有序,我们知道我们开辟的空间是随机开辟的,通过页表的映射关系可以有效的将空间变得有序。其次可以将进程管理模块(页表和地址空间)和内存模块(物理空间)解耦,在程序进程检测时它检测到地址空间有就可以进行执行,因此我们只在地址空间上申请内存,填写页表的左侧,用的时候再在物理空间上开辟内存,这样也是可以的,还有一种情况我们先看下面的图:
假如 我们有2MB的内存,我们映射到物理空间上后,可以先执行1MB的内存,当者1MB执行完后可以先将这1MB内存释放,删除页表的关系,但是地址空间不变,这样我们看着还是2MB。最后访问越界时,如果页表中查不到这个地址,os就会阻止这个请求,实现对物理内存的保护,例如我们一个数组a[10],我们访问a[200]就会被os拦截。
1.3.2进一步理解页表和写时拷贝
在页表中不仅仅有虚拟地址和物理地址这两部分,还有一个检测是否在内存中以及权限,我们先说是否在内存中,它用一个0个1来表示0不在内存中,1在内存中,那什么时候会显示0呢?
当内存不足时,会将一部分页表的内容唤出到磁盘中,还记得我们进程挂起的swap分区吗,这里和那个类似,当被唤出到磁盘中后这里就会显示为0 。
当我们创建子进程后父进程和子进程中 权限都会被修改为r,当我们想要修改时发生写时拷贝,权限修改为w。当操作系统检测到错误时会先进行检测是否不在物理内存中(缺页中断,也就是页表中为0),然后检测是否需要发生写时拷贝(检测权限是否为r),都不是才进程异常处理。
二.进程的终止
2.1进程终止的3中状态
2.1.1代码跑完结果正确
我们先运行下面代码
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>int main()
{printf("pid=%d,ppid=%d\n",getpid(),getppid());return 0;
}
运行后输入指令
echo $?
echo $?是返回我们前一个程序的返回码,我们将上面代码return 100然后运行然后输入指令echo$?可以看到
当我们再执行一次ehco $?可以看到
这是输出echo $?的退出码。
2.2.1代码跑完,结果错误
在这里我们需要先知道退出码有什么作用,在一个父进程中我们需要知道子进程的退出状态,是成功还是失败?失败的原因是什么?所以出现了退出码这个概念。退出码有很多我们需要知道每一个退出码是什么吗?其实不需要,我们有一个函数可以知道每个退出码是什么意思,我们看下面代码
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
#include<string.h>int main()
{for(int errorcode=0;errorcode<=255;errorcode++){printf("errorcode=%d->%s\n",errorcode,strerror(errorcode));}printf("pid:%d,ppid=%d\n",getpid(),getppid());return 0;
}
我们运行代码
2.2.3出现异常
运行时,进程崩溃了,os会将进程杀掉一旦出现了异常退出码就没有意义了,为什么出现异常原因是进程出现了异常,本质说os进程发出信号。例如我们运行下面代码:
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
#include<string.h>int main()
{while(1){printf("pid=%d,ppid=%d\n",getpid(),getppid());sleep(1);}return 0;
}
我们输入指令
kill -9 pid
可以看到
我们可以输入指令
kill -11 pid
2.2检测进程终止顺序
首先检测进程是否出现异常,出现异常就不用管退出码,如果出现退出码,代码一定跑完了,再看退出码,异常后退出码是什么都没有任何意义。所以衡量一个进程退出我们只需要知道程序的退出码和推出信号。在进程的task_struct中有一个退出码和一个推出信号,当进程结束时会将这个给父进程。
2.3进程如何终止(exit和_exit)
首先可以通过return实现进程终止。也可以通过exit来实现进程终止,exit在结束时会冲刷一次缓冲区,我们运行下面代码
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
#include<stdlib.h>
#include<string.h>int main()
{printf("hello process.exe\n");printf("exit");exit(0);
}
运行后可以看到
两个都输出了。
还有一种是_exit函数,我们看下面代码
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
#include<stdlib.h>
#include<string.h>int main()
{printf("hello process.exe\n");printf("exit");_exit(0);
}
运行后
我们可以看到exit会冲刷一次缓冲区,_exit不会冲刷缓冲区。