Linux_理解程序地址空间和页表

目录

1、进程地址空间示意图 

2、验证进程地址空间的结构

3、验证进程地址空间是虚拟地址 

4、页表-虚拟地址与物理地址

5、什么是进程地址空间

6、进程地址空间和页表的存在意义

6.1 原因一(效率性)

6.2 原因二(安全性)

6.3 原因三(解耦)

7、页表的使用

8、页表的权限 

9、页表的缺页中断 

10、页表的好处 

结语


前言:

        每一个进程都有属于自己的进程地址空间,进程地址空间又叫虚拟内存、虚拟地址空间,从“虚拟二字”可以判断进程地址空间并不是真实的物理空间,他只是物理空间的一个映射表,具体是通过页表作为媒介来建立他们之间的映射关系,所以我们在程序中定义的一系列变量,这些变量的地址都只是该进程的进程地址空间上的地址数,并不是真实的物理地址数。

        注意:本文物理空间和物理内存指的是一个概念。

1、进程地址空间示意图 

        我们所说的代码段(正文代码,包括字符常量区)、数据段(已初始化数据区)、BSS段(未初始化数据区)、堆区、共享区、栈区实际上都是在进程地址空间中的概念,物理内存上根本不存在上面这些划分,所以可以得出进程地址空间是在对物理内存进行管理。

        进程地址空间一般分为两个部分:用户空间、内核空间,用户空间就是上面所说的堆、栈区域,而内核空间拥有比用户空间更高的权限级别,他主要是系统内部进行进程管理、内存管理、设备驱动、文件系统、网络系统等相关工作,对外只会暴露接口给到程序员使用。进程地址空间示意图如下:

2、验证进程地址空间的结构

        从上图可以发现,进程地址空间的地址数是从下往上增大的,即在32位平台下,最低处代码段的地址是0x0000 0000,而最高处内核空间的地址是0xffff ffff,因此可以通过代码打印在不同区域所出创建的各种变量的地址,来观察他们的地址数就能验证进程地址空间的结构组织。

        代码如下: 

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>int g_val_1;
int g_val_2 = 100;int main(int argc, char *argv[], char *env[])
{printf("main函数地址: %p\n", main);const char *str = "hello world";printf("代码段 %p\n", str);printf("数据段 %p\n", &g_val_2);printf("BSS段  %p\n", &g_val_1);char *mem = (char*)malloc(100);char *mem1 = (char*)malloc(100);char *mem2 = (char*)malloc(100);printf("堆区: %p\n", mem);printf("堆区: %p\n", mem1);printf("堆区: %p\n", mem2);printf("栈区: %p\n", &str);printf("栈区: %p\n", &mem);static int a = 0;static int a1;int b;int c;printf("数据段: %p\n", &a);printf("BSS段: %p\n", &a1);printf("栈区: %p\n", &b);printf("栈区: %p\n", &c);int i = 0;for(; argv[i]; i++)printf("命令行参数:argv[%d]: %p\n", i, argv[i]);for(i=0; i<10; i++)printf("环境变量:env[%d]: %p\n", i, env[i]);return 0;
}

        运行结果:

        从上图的测试结果可以发现,地址数的大小确实按照了进程地址空间的排布来打印,但是这里有必要说明一点:BSS段的地址数大部分场景下是比数据段的地址数要高的,但是BSS段的变量地址不一定就比数据段的变量地址要高,具体根据程序实现和操作系统加载机制有关。

3、验证进程地址空间是虚拟地址 

        若要验证进程地址空间里的地址数是虚拟地址,则需要用fork函数创建子进程来完成,具体思路:定义一个全局变量g_val,目的是让父子进程都能看到,然后在子进程中对g_val进行修改,发现父进程里看到的g_val还是原值,但是父子进程看到g_val的地址却还是一样的。即现象是:同一个地址下看到不同的值。 

        测试代码如下:

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>int g_val = 100;int main()
{pid_t id = fork();if(id == 0){int cnt = 3;// 子进程while(1){//观察g_val的值和地址printf("i am child, pid : %d, ppid : %d, g_val: \%d, &g_val: %p\n", getpid(), getppid(), g_val, &g_val);sleep(1);if(cnt) cnt--;else {g_val=200;printf("子进程change g_val : 100->200\n");cnt--;}}}else{// 父进程while(1){//观察g_val的值和地址printf("i am parent, pid : %d, ppid : %d, g_val: \%d, &g_val: %p\n", getpid(), getppid(), g_val, &g_val);sleep(1);}}return 0;
}

        运行结果:

        通过进程相关概念可以得知,当父子进程修改同一份资源时,会发生写时拷贝,即修改资源的进程会拷贝一份资源到该进程的空间地址中进行修改,这样一来修改的资源不会影响另一个进程所看到的资源,保证了进程的独立性。

        但是从测试结果可以发现,虽然发生了写时拷贝,但是他们的地址却是一样的,如果进程地址空间的地址数就是真实物理内存的地址数,那么这里所看到的g_val的地址肯定是不一样的,因为同一个地址只能记录一个值,因此可以推断进程地址空间上的地址数是虚拟的(即我们平常打印出来的地址数都是虚拟的)。他们和物理内存的关系图如下:

4、页表-虚拟地址与物理地址

        从上图可以发现虚拟地址和物理地址不一定是一一对应的,即虚拟地址的具体值在物理地址上可能指向的是另一个地址,那么要完成这个转换动作就必须有一个转换器,这个转换器就是页表,页表中记录了虚拟地址和物理地址的对应关系,其实发生写时拷贝的时候,虚拟地址在页表中对应的物理地址就已经是另一个地址数了,只是虚拟地址不关心物理地址的变化,并且程序员也无需关心,因为虚拟地址到物理地址的转换是由操作系统自动完成,操作系统只需要保证程序员访问虚拟地址时可以拿到正确的值即可。

        页表结构图:

        小结:每一个进程都会有一个进程地址空间的蓝图,即进程的进程地址空间是独立的,子进程会将父进程的PCB和进程地址空间和页表深拷贝一份给自己使用(除了一些子进程自带的特性字段不拷贝,比如子进程自己的pid,其他的内容都会拷贝一份),这也就解释了父子进程代码共享,所以创建一个进程的消耗是很大的,因为需要维护进程本身的结构体PCB还要维护地址空间、页表等。   

        有了上述的认知,就能理解fork创建子进程的细节了,因为fork返回值是一个写入,所以会发生写时拷贝,则子进程会在物理空间上开辟一块新空间存放子进程的id(此时子进程的页表的物理地址会被更改,但是虚拟地址不变),然后父进程和子进程通过查找自己的虚拟地址映射到不同的物理地址处,所以用于保存fork返回值的变量就会显示两个值。

5、什么是进程地址空间

         我们知道物理内存中的地址是由32根地址总线经过不同的排列组合得来的(32位平台下),所以在32位平台下,物理内存的大小是2^32 = 4GB,而进程地址空间是物理内存的映射,即进程地址空间也是有自己的大小,但是他的大小不可能和物理内存一样大,前面虽说进程地址空间的大小是4GB,其实只是一个地址范围而不是真正的大小,记录一个范围只需要两个int类型的变量即可,例子示意图如下:

        所以进程地址空间的堆、栈这些部分,其实只是用两个变量来维护的,这样一来只需多个变量就可以描述进程地址空间的结构了,所以进程地址空间本质是一个描述线性内存可视范围的结构体,该结构体内的成员变量的含义就是用来划分不同的区域板块。


        比如可以用以下结构体来描述进程地址空间(进程PCB结构体中有一个指向地址空间的指针): 

        每个进程的进程地址空间的范围都是一样的,所以对于每个进程而言,仿佛都可以申请到3G的物理内存空间,但是实际上并不如此,因为一个进程不可能用掉3G的物理空间,当物理内存快被消耗殆尽了,则系统肯定会发出警告,所以进程地址空间的结构体就像是操作系统给进程画的一个大饼,因为该结构体让进程以为物理空间内有很多的空间,但实际上可能没剩下多少空间了,但是进程只要向系统申请空间则物理空间就会分给该进程,若物理空间不足则申请失败。 

6、进程地址空间和页表的存在意义

6.1 原因一(效率性)

         因为若没有进程地址空间,则进程直接在物理内存上进行数据的存放,此时如果进程的状态变成挂起状态,为了节省物理内存则该进程原本存放在物理内存的数据可能就要被移到磁盘中,下一次该进程进入内存时要重新摆放数据至物理内存中,并且还要重新修改PCB的内容了,太麻烦了效率又低。

        有了进程地址空间后就无需关心进程在物理空间内的数据摆放的位置了,因为数据在物理内存中的存放顺序我们不关心,系统会帮我们建立页表和物理内存的映射关心,我们只要按照页表的虚拟地址进行寻址即可,所以可以把进程地址空间看成是进程和物理内存之间的桥梁、转换器。

        以统一视角来看待内存,做到了一致性,让进程对内存的分配和控制更加方便了。 

6.2 原因二(安全性)

        进程如果直接访问物理内存,会有可能更改其他用户的内容,而如果进程先访问虚拟地址空间和页表,若发生了修改其他用户内容的情况,则虚拟地址空间和页表会直接反馈并拒绝这个动作,达到保护物理内存的效果。 

        并且对于代码的结构也做了明确的功能划分,比如代码段的数据不可更改,保护了代码。

6.3 原因三(解耦)

        将进程管理模块和内存管理模块进行了解耦,具体示意图如下:

7、页表的使用

        从上文得知,若要使用进程地址空间,则在PCB结构体中的pmm指针就能找到进程地址空间,但是该如何找到并使用页表呢? 

        使用页表的示意图如下:

        总结而来就是进程PCB中间接的包含了找到页表的方法。 

8、页表的权限 

        页表实际上还有一列用于显示权限,示意图如下:

         页表会记录虚拟地址对应的物理地址是否为文字常量区,若为文字常量区而进程还要修改该地址的内容,则页表直接会报错并且终止这个进程,这也是为什么代码段的数据不可被修改,原因就是所有的访问都要通过页表这个媒介,页表会判断虚拟地址然后对权限做出相关改变。

9、页表的缺页中断 

        当进程被挂起时就表示缺页中断,该进程的代码会被从内存移至磁盘,页表中还有一列是专门记录代码是否还存放在内存中,因为若把进程的所有代码都从磁盘加载至内存中,有些代码还没使用到就会浪费内存的资源,因此进程的调度遵循着“分批加载-惰性加载” ,而页表的缺页中断就是为了让cpu知道目前哪些代码已经被加载进内存中哪些代码还在磁盘上。

        页表中用于记录当前是否为缺页中断的标识符示意图如下:

         进程的挂起实际上就是页表中断,他的底层是将进程的代码都拿走放到磁盘中,然后页表中的物理内存地址也清空,并且把内容标志位为0,这时候就是进程挂起了。挂起结束时就会根据内再将磁盘中的代码重新拿到内存中,然后把内容标志位从0置为1,表示缺页中断结束,并且页表中的物理内存地址填上加载后新的地址,这个过程虚拟地址是不需要改变的。

10、页表的好处 

        当把可执行程序加载到内存时,可以不考虑在内存的摆放顺序,因为有页表的存在,我们只需要关心页表中的虚拟地址就能判断出哪些数据只能读哪些地址只能写了,而且必须要用统一的视角看待内存,因为只有用统一的视角看待内存才能让内存的无序摆放对于进程来说是有序的。

结语

        以上就是关于进程地址空间一级页表的讲解,理解进程地址空间和页表是理解进程管理的重要一环,他属于进程管理中较为细节的一部分。

        最后希望本文可以给你带来更多的收获,如果本文对你起到了帮助,希望可以动动小指头帮忙点赞👍+关注😎+收藏👌!如果有遗漏或者有误的地方欢迎大家在评论区补充,谢谢大家!!  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/854619.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

DOS INT 21H中断 2号功能暗改AL

注意此时AX0200&#xff0c;DX0057 执行INT 21H之后&#xff1a; 可以看到执行完“??? [BXSI]”之后&#xff0c;AL就变为了57H&#xff0c;和DL相同。 部分INT 21H功能表&#xff1a; 所以究竟是什么原因呢&#xff1f; -------------------------------------------…

MDK 代码烧录到RAM区运行

MDK 代码烧录到RAM区运行 环境配置设置分散加载文件启动文件修改设置外部调试器烧录 建立函数入口半主机问题导致BKPT 0xAB 有一个需求&#xff0c;除了IAR以及GCC的版本工程还需要MDK版本&#xff0c;为了实现最小的工程环境&#xff0c;flash烧录算法也没有&#xff0c;这时需…

【C++】:list容器的基本使用

目录 &#x1f680;前言一&#xff0c;list的介绍二&#xff0c;list的基本使用2.1 list的构造2.2 list迭代器的使用2.3 list的头插&#xff0c;头删&#xff0c;尾插和尾删2.4 list的插入和删除2.5 list 的 resize/swap/clear &#x1f680;前言 list中的接口比较多&#xff…

SpringBootWeb 篇-入门了解 Apache POI 使用方法

&#x1f525;博客主页&#xff1a; 【小扳_-CSDN博客】 ❤感谢大家点赞&#x1f44d;收藏⭐评论✍ 文章目录 1.0 Apache POI 概述 2.0 使用 Apache POI 读写 Excel 文件 2.1 写入 Excel 文件 2.2 写入 Excel 文件代码演示 2.3 读取 Excel 文件 2.4 读取 Excel 文件代码演示 1.…

使用Multipass编译OpenHarmony工程

Multipass 是一个轻量级虚拟机管理器&#xff0c;支持 Linux、Windows 与 macOS&#xff0c;这是为希望使用单个命令提供全新 Ubuntu 环境的开发人员而设计的。使用 Linux 上的 KVM、Windows 上的 Hyper-V 和 macOS 上的 HyperKit 来以最小的开销运行 VM&#xff0c;同时它还可…

【网络安全学习】使用Kali做渗透情报收集-02-<指纹识别+目录扫描>

1.指纹识别 指纹识别是指通过一些特征或特定文件来识别目标网站或系统的类型、版本、组件等信息&#xff0c;以便寻找相应的漏洞或攻击方法。 主动指纹识别 通过向目标系统发送正常和异常的请求以及对文件内容的查找&#xff0c;记录响应方式&#xff0c;然后与指纹库进行对比…

【系统架构设计师】一、计算机系统基础知识(指令系统|存储系统|输入输出技术|总线结构)

目录 一、指令系统 1.1 计算机指令 1.2 指令寻址方式 1.3 CISC 与 RISC 1.4 指令流水线 二、存储系统 2.1 分级存储体系 2.2 地址映射 2.3 替换算法 2.4 磁盘 2.4.1 磁盘结构和参数 2.4.2 磁盘调度算法 三、输入输出技术 四、总线结构 五、考试真题练习 一、指令…

12.1 Go 测试的概念

&#x1f49d;&#x1f49d;&#x1f49d;欢迎莅临我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…

VM4.3 二次开发02 方案加载、执行及显示

效果 这是二次开发的第二个文章&#xff0c;所以不重复说明环境配置相关的内容。如果不懂的可以看本专栏的上一个文章。 海康视觉算法平台VisionMaster 4.3.0 C# 二次开发01 加载方案并获取结果-CSDN博客 界面代码 <Window x:Class"VmTestWpf.App.MainWindow"x…

element-plus的Tour 漫游式引导怎么去绑定Cascader 级联选择器

首先官方例子是用的button 官方.$el这个log出来是&#xff1a; 知道是以元素为准就拿对应的元素就行 级联选择器.$el是这样的&#xff1a; 你可以移入这个元素部分去看看是哪个要用的&#xff08;好像火狐直接放上去就可以看到元素表示&#xff0c;谷歌要双击或者右键选择去看…

手机ip地址怎么换成成都的

随着互联网的快速发展&#xff0c;我们越来越依赖于网络进行各种操作。而在某些情况下&#xff0c;为了更好地享受网络服务或保护个人隐私&#xff0c;我们可能需要改变手机的IP地址。本文将详细介绍如何将手机IP地址换成成都的&#xff0c;同时提醒大家在操作过程中需要注意的…

【AI开发】CRAG、Self-RAG、Adaptive-RAG

先放一张基础RAG的流程图 https://blog.langchain.dev/agentic-rag-with-langgraph/ 再放一个CRAG和self-RAG的LangChain官方博客 Corrective RAG(CRAG) 首先需要知道的是CRAG的特色发生在retrieval阶段的最后开始&#xff0c;即当我们获得到了近似的document&#xff08;或者…

(day1)数据类型详解及DML语句入门

一、数据类型 1、整型类型 &#xff08;1&#xff09;创建数据库 CREATE DATABASE ql_linux&#xff1b; CREATE SCHEMA IF NOT EXISTS ql_linux&#xff1b; //IF NOT EXISTS如果没有表就创建 SHOW DATABASE; //查看数据库 &#xff08;2&#xff09;创建表 C…

【Git】-- 添加公钥到 github 或者gitlab上

仅针对系统&#xff1a;mac os 、 unix、linux 1、检查是否有 id_rsa.pub $ cd ~ $ ls -al ~/.ssh 注意&#xff1a;若已有 id_rsa.pub&#xff0c;则必要执行 第二步&#xff0c;避免覆盖掉原有正常的公钥。 配置多个 git 账号请参考&#xff1a;同一台电脑配置多个git账…

每日一题——Python实现PAT甲级1132 Cut Integer(举一反三+思想解读+逐步优化)五千字好文

一个认为一切根源都是“自己不够强”的INTJ 个人主页&#xff1a;用哲学编程-CSDN博客专栏&#xff1a;每日一题——举一反三Python编程学习Python内置函数 Python-3.12.0文档解读 目录 我的写法 正确性和功能性 时间复杂度 空间复杂度 其他点评 总结 我要更强 优化后…

黑马苍穹外卖1 Git+Nginx反向代理+员工登录表加密+Swagger

整体结构 前端 &#xff1a;管理端Web/用户端(小程序) 后端&#xff1a;后端服务&#xff08;java&#xff09; 1 直接使用前端环境 2后端环境搭建 3 完善登录功能 后端环境搭建基于Maven&#xff0c;分模块开发 common公共类&#xff1a;constant常量类、、、、 pijo类:实…

SQL:按用户名复制权限

生产系统中有一个模块是管理用户及菜单权限&#xff0c;它们是由3个数据表组成&#xff0c;关系及字段如下&#xff1a; 原来为每个用户添加菜单的访问权限时都是一个一个添加&#xff0c;但今天遇到有个新来的员工&#xff0c;需要具有与另一个员工相同的权限。新建一个用户后…

vue3 中实现 验证码发送 刷新不变倒计时

今天实现一个倒计时的功能 在平常开发前端的功能的时候 不管是 移动端还是web端 我们都会有注册 登录 中的发送验证码功能 实现绑定以及注册功能。今天我主要分享一下当前的验证码实现原理。 有两种做法(我目前认为以及看到的) ① 做一个简单的倒计时 ② 实时监测倒计时 刷…

今日AI资讯-20240615

1. Follow Your Emoji 一键让照片变表情包 腾讯混元联合港科大、清华大学联合推出肖像动画生成框架Follow Your Emoji&#xff0c;可以通过人脸骨架信息生成任意风格的脸部动画&#xff0c;一键创建表情包。基于算法革新和数据积累&#xff0c;Follow Your Emoji可以支持对脸部…

中电金信:银行业数据中心何去何从

20多年前&#xff0c;计算机走进国内大众视野&#xff0c;计算机行业迎来在国内的高速发展时代。银行业是最早使用计算机的行业之一&#xff0c;也是计算机技术应用最广泛、最深入的行业之一。近年来&#xff0c;随着银行竞争加剧&#xff0c;科技如何引领业务、金融科技如何发…