地址空间
- 内存空间示意图
- 虚拟地址空间
- 虚拟地址
- 进程地址空间生命周期图解
- 为什么要有地址空间呢?
- 小结
内存空间示意图
进程是在内存中运行的,为了便于管理,不同的数据会存储在不同的区域,因此内存就被分为几部分,如下图所示:
而这些区域都存什么东西呢?我们有下面一段程序:
#include<stdio.h>2 #include<stdlib.h>3 4 int un_g_val;5 int g_val = 2;6 7 8 int main(int argc, char* argv[], char* env[])9 {10 printf("adress: %p\n",main);11 printf("init: %p\n",&g_val);12 printf("uninit: %p\n",&un_g_val);13 char *p1 = (char*)malloc(10);14 char *p2 = (char*)malloc(10);15 char *p3 = (char*)malloc(10); 16 17 printf("heap_p1: %p\n",p1); // 堆地址18 printf("heap_p2: %p\n",p2);19 printf("heap_p3: %p\n",p3);20 printf("stack_p1: %p\n",&p1); //栈地址21 printf("stack_p2: %p\n",&p2);22 printf("stack_p3: %p\n",&p3);23 24 int i = 0;25 for(i=0;i<argc;i++)26 {27 printf("argv[%d]:%p\n",i,argv[i]);28 }29 30 for(i=0;env[i];i++)31 { 32 printf("env[%d]:%p\n",i,env[i]);33 } 34 return 0; }
这个程序打印了各种变量的地址,印证了地址空间是确实存在的!
我们再看这个代码能编过吗?
11 //常量 12 "hello world"; 13 50; 14 'xxxx;
可以编译过,并且该东西是字符常量它会硬编码进代码(因为代码也不可更改),所以字符常量会在代码区。
虚拟地址空间
看下面一段代码:该程序创建了一个子线程,共享父进程的全局变量,子进程会更改全局变量。
1 #include<stdio.h>2 #include<stdlib.h>3 #include<unistd.h>4 int g_val = 2;5 6 7 int main()8 {9 pid_t id = fork();10 11 if(id == 0)12 {13 //child14 int cnt = 0;15 while(1)16 {17 printf("I am a child, pid_id:%d, ppid_id:%d , g_val:%d, &g_val:%p\n",getpid(),getppid(), g_val,&g_val);18 19 sleep(1);20 cnt++;21 if(cnt==5)22 {23 g_val = 200;24 printf("child chamge g_val 2 -> 200 success\n");25 }26 }27 }28 else29 { 30 //father31 while(1)32 {33 sleep(1);34 printf("I am a father, pid_id:%d, ppid_id:%d , g_val:%d, &g_val:%p\n",getpid(),getppid(), g_val,&g_val);35 }36 }
I am a child, pid_id:20414, ppid_id:20413 , g_val:2, &g_val:0x60105c
I am a father, pid_id:20413, ppid_id:18692 , g_val:2, &g_val:0x60105c
child chamge g_val 2 -> 200 success
I am a child, pid_id:20414, ppid_id:20413 , g_val:200, &g_val:0x60105c
I am a father, pid_id:20413, ppid_id:18692 , g_val:2, &g_val:0x60105c
我们从运行的结果可以看出来,子进程修改全局变量后,子进程的值改变,父进程的值没变,但是全局变量的地址空间一样!!!
为什么会产生这种情况呢??
我们大胆猜测,程序打印的地址,一定不是物理地址,因为同一地址不可能存储两个不一样的值 。因为打印出来的是虚拟地址!!!
虚拟地址
每一个程序都有自己的虚拟地址空间,就像PCB一样,每一个程序都有一个属于自己的虚拟地址空间,记录着各种数据的位置,供操作系统使用。
如下图所示:代码在准备执行时,会编译成可执行程序,此时程序里面,即代码与代码是有地址的(这个地址就是虚拟地址),程序被加载到内存后:
- 首先系统会创建PCB
- PCB会有一个指针,指向程序虚拟内存
- 根据虚拟内存的地址所对应的物理内存地址,填充页表,完成映射。
页表 :页表的作用就是完成虚拟地址到物理地址的转换
下图是解释上面代码例子的虚拟空间问题:子进程创建后,获得父进程一模一样的地址空间,当触发写时拷贝时,才复制资源。这样会节省空间。
进程地址空间生命周期图解
-
程序被读进内存的过程
-
程序执行的流程
为什么要有地址空间呢?
1.为了保护物理内存,页表将各个进程隔离起来了。因为地址空间和页表是OS创建并且维护的,意味着想要使用地址空间和页表映射,必须在OS的监管之下进行访问。因此保证了进程之间的独立性,互不影响。
-
因为有地址空间和页表的存在,OS可以实现,对未来的数据进行任意位置的加载,只需根据页表即可找找到杂乱无章的数据。这样物理内存的分配和进程的管理就可以分开进行管理。内存管理模块和进程管理模块就完成了解耦合。
-
如果我申请了物理空间,但是我不立马使用,我会造成空间的浪费!但是如果我在虚拟空间上申请,当我没使用时,也没有为我开物理空间 。当我使用时,OS才帮我开辟空间,这样可以保证内存的使用率是100%。
-
物理内存上的数据理论上可以在任意位置加载,这会导致物理内存上的所有数据都是乱序的。但是有VA+页表的存在,我们可以方便的直接找到各种数据,在进程的视角,数据是那么的竟然有序!因此,可以将内存分布有序化!
小结
OS的系统是深而庞杂的,此文章只是浅显的谈论了以下内存空间的概念及其分布。更详细的内容,还请读者自行查阅。