进程地址空间(Linux)

进程地址空间

  • 一、引入概念
    • 1. 程序的地址分布
    • 2. 线性地址和物理地址
  • 二、进程地址空间
    • 1. 初步认识
    • 2. 地址空间和物理内存的联系
    • 3. 区域划分
    • 4. 拓展——关于“线”
  • 三、进一步理解进程地址空间
  • 四、页表
  • 总结

一、引入概念

1. 程序的地址分布

测试代码:

#include <stdio.h>                                                                                                                                                                                                                          
#include <stdlib.h>    //已初始化全局数据区    
int d = 0;    //未初始化全局数据区    
int c;    int main(int argc, char* argv[], char* env[])    
{    //栈区    int a = 0;    //堆区    int* p = (int*)malloc(sizeof(int));    //已初始化静态区    static int b = 0;    //未初始化静态区    static int e;    //常量区    const char* str = "hello Linux";    printf("stack addr: %p\n", &a);    printf("heap addr: %p\n", p);    printf("uninit g_val addr: %p\n", &c);    printf("init g_val addr: %p\n", &d);    printf("uninit static val:%p\n", &e);    printf("init static val:%p\n", &b);    printf("read only string addr: %p\n",str);    printf("code addr: %p\n", main);    int i = 0;    for(; argv[i]; i++)    {    printf("argv[%d]:%p\n", i, argv[i]);    }    for(i = 0; env[i]; i++)    {    printf("env[%d]:%p\n", i, env[i]);    }    return 0;    
} 

测试结果分析:
测试结果分析

注:根据系统的不同,可能得到的结果有一定的区别,就如同上面初始化数据区和未初始化数据区位置的结果有出入的原因分析一样。

2. 线性地址和物理地址

物理地址: 指计算机中实际的硬件内存地址,它是由硬件设备(如内存控制器)直接生成的。物理地址是一个唯一的标识符,用于访问计算机的物理内存。
物理地址与虚拟地址是不同的概念。虚拟地址是进程地址空间中的地址,它是由操作系统分配给进程的,并且可以通过地址转换机制映射到物理地址。

测试代码和结果:
测试和结果

结论:

  1. 变量的内容不一样,所以父子进程输出的不是同一个变量
  2. 地址值是一样的,说明该地址绝对不是物理地址。
  3. 所以, 在Linux地址下,这种地址叫做虚拟地址(线性地址)。在C/C++语言所看到的地址,全部都是虚拟地址,物理地址用户看不到,由OS统一管理。OS负责把虚拟地址转换成物理地址。

注: 回顾之前的知识有个问题没解决,就是fork创建子进程。如果fork成功,给父进程返回子进程的pid,给子进程返回0。 其中我们没有说一个变量id是如何存储两个值的,那么现在就可以理解了,因为不是同一个物理地址。
根据上面的结论,就可以得出:在使用fork函数的时候,返回值有两个分别是0和子进程的PID。得出如何一个变量(id)存在两个值。

二、进程地址空间

1. 初步认识

这里我们要进一步认识 ———— 进程地址空间

进程地址空间的地址就是虚拟地址
图例:和第一个例子的C/C++中程序内存区域划分那个图一致,都是抽象的进程地址空间。
进程地址空间

认识:

  1. 程序员在写代码中访问的指针的地址就是这个虚拟地址。而虚拟地址需要通过地址转换机制(也就是页表,后面讲)映射到物理地址上。
  2. 每个进程系统都会提供一个进程地址空间。实际是系统对该进程创建的结构体对象(后面讲)

2. 地址空间和物理内存的联系

解读fork创建进程那段代码,我们来认识进程地址空间、页表和物理地址空间的关系

#include <stdio.h>    
#include <unistd.h>    int main()    
{    pid_t id = fork();    if(id < 0)    {    perror("fork");    return 0;    }    else if(id == 0)    {    //child    printf("child proc: fork return:%d  &id: %p\n", id, &id);    }    else    {    //father    printf("father proc: fork return:%d &id: %p\n", id, &id);                                                                                                                                                                           }    return 0;    
} 

解析:

  1. fork函数创建完子进程未返回时(此时id还没有存两个值)

图解

  • 父进程会复制自身的所有资源(包括代码、数据、打开的文件等)给子进程,并为子进程分配一个独立的进程ID。
    此时进程id指向同一个物理地址

注: OS为了提高效率,在创建子进程时会使用写时拷贝(Copy-on-Write)技术。这意味着在创建子进程时,并不会立即复制父进程的所有资源,而是共享父进程的资源。只有当子进程或父进程试图修改这些共享资源时,操作系统才会进行实际的复制操作。
当父进程创建子进程时,操作系统会将父进程的页表项指向相同的物理内存页。这样,子进程和父进程共享相同的物理内存页,包括代码、数据和只读的共享库等。当子进程或父进程试图修改这些共享的资源时,操作系统会将被修改的页复制一份,然后将新的页分配给修改进程,使得修改进程有自己的独立副本。只有在需要修改资源时才进行复制,其他未被修改的页仍然是共享的,可以被多个进程共享使用

  1. fork创建完子进程并返回,给父进程返回子进程的pid,给子进程返回0(所以此时id就是两个值)

图解

  • OS给更改后的变量重新申请空间,使用写时拷贝技术。对子进程的页表修改部分进行拷贝,将修改后新的页再分配给子进程。

小结:同一个变量,地址相同,其实也只是虚拟地址相同,内容不同,其实就是被映射到不同的物理地址

3. 区域划分

在引入概念中的程序的地址分布中,说到栈,堆等区域的划分。

区域划分: 好处

  1. 防止越界,空间分配合理
  2. 访问的范围越界,直接进行报错
  3. 进程地址空间中的代码区、常量区和数据区在编译时就确定了其大小和位置。堆区和栈区是随着运行时变量的开辟和销毁,堆区和栈区的边界会动态变化
    堆区和栈区是在运行时动态分配和释放内存的。堆区用于存放动态分配的内存,由程序员手动申请和释放,其边界由操作系统维护。栈区用于存放局部变量和函数调用的上下文信息,由编译器自动分配和释放,其边界由编译器维护。

操作系统内部进程地址空间的结构体:

struct mm_struct 
{//....unsigned long total_vm, locked_vm, shared_vm, exec_vm;unsigned long stack_vm, reserved_vm, def_flags, nr_ptes;unsigned long start_code, end_code, start_data, end_data;     /*维护代码区和数据区的字段*/unsigned long start_brk, brk, start_stack;       /*维护堆区和栈区的字段*/unsigned long arg_start, arg_end, env_start, env_end;  /*命令行参数的起始地址和尾地址,环境变量的起始地址和尾地址*///....
};

认识:

  1. 在上面初步认识进程地址空间这一知识点最后,我们说到,进程地址空间实际就是系统对该进程创建的结构体对象。
  2. 所谓的进程地址空间,本质是一个描述进程可视范围的大小。存在各种的区域划分,而这种对线性地址划分,只需要start,end即可

在这里插入图片描述

4. 拓展——关于“线”

问题1:CPU,内存,输入输出设备如何交互?

  • 通过“线”进行交互
  • 线细分为:地址总线,数据总线,控制总线
  • 也可以分成两种:CPU内存连的线叫系统总线。内存和输入输出设备连的线叫IO总线

注:

  1. 地址总线(Address Bus):是用于传输内存地址的一组物理线路。它的作用是将CPU发出的内存地址信号传递给内存或其他外部设备。
  2. 数据总线(Data Bus):是用于传输数据的一组物理线路。它的作用是将CPU和内存、输入输出设备之间的数据进行传输。
  3. 控制总线(Control Bus):是用于传输控制信号的一组物理线路。它的作用是传递CPU发出的各种控制信号,如读写控制、时钟信号、中断请求等。

三者的联系:共同构成了计算机的总线系统,用于实现CPU与内存、输入输出设备之间的数据传输和控制。CPU通过地址总线发送内存地址,通过数据总线进行数据的读取和写入,通过控制总线发送各种控制信号。内存和外部设备通过这些总线接口与CPU进行通信。地址总线和数据总线的宽度决定了计算机的寻址能力和数据传输带宽,而控制总线则负责传递各种控制信号,协调计算机的工作。三种总线共同完成计算机的数据传输和控制操作,保证计算机的正常运行。

  1. 系统总线(System Bus):是用于连接CPU、内存和其他主要组件的一组总线。系统总线扮演着连接CPU和内存之间的桥梁,用于传输指令、数据和控制信号。
  2. IO总线(I/O Bus):是用于连接CPU和输入输出设备的一组总线。它是系统总线的一个扩展,专门用于处理输入输出操作。

两者的联系:都是计算机中用于数据传输和控制的总线系统。系统总线主要用于连接CPU、内存和其他主要组件,用于处理计算机的主要运算和数据传输。而IO总线则专门用于连接CPU和输入输出设备,用于处理输入输出操作。系统总线和IO总线都包括地址总线、数据总线和控制总线,共同构成了计算机的总线系统。系统总线和IO总线的宽度决定了计算机的寻址能力和数据传输带宽。

问题2:线是什么,为什么用线?
线是指用于传输电信号或数据的物理连接。线通常由导体(如金属)制成,用于连接不同的组件或设备,主要是以便它们之间进行数据传输和通信
线的使用具有以下优点:

  1. 传输速度快
  2. 可靠性高:线能够提供稳定的物理连接,确保数据的可靠传输,减少数据传输中的错误和丢失。

三、进一步理解进程地址空间

为什么有进程地址空间?

  1. 让所有的进程以统一的视角看待内存结构。
    • 如果没有:在PCB中记录代码和数据在物理内存的某个地址处,从哪里开始到那里结束等等,而且每一个进程都要做。可能有存在进程挂起,代码和数据要换出换入,就又要更改PCB。总而言之,如果没有,就显得冗余,不便于管理
  2. 增加进程虚拟地址空间,可以让我们访问内存的时候,增加一个转换的过程,在这个过程可以对我们的寻址请求进行审查,所以一旦异常访问,就可以直接拦截,该请求不会到物理内存,就可以保护物理内存。
  3. 因为有地址空间和页表的存在,将进程管理模块和内存管理模块进行解耦合。

进程的独立性理解
每个进程都有自己独立的内存空间、寄存器集合和执行上下文,彼此不会相互干扰或影响。
从以下几个方面理解进程独立性:

  1. 内存隔离:每个进程都有自己独立的进程地址空间,进程之间的内存是相互隔离的。进程在申请内存时,本质上是OS申请的,由OS决定是否分配给进程空间,而进程在申请内存之间没有联系。
  2. 寄存器隔离:每个进程都有自己的寄存器集合,用于保存进程的执行上下文和临时数据。不同进程之间的寄存器是相互独立的,一个进程的寄存器状态不会影响其他进程的执行。
  3. 进程间通信:虽然进程具有独立性,但有时候进程之间需要进行通信和协作。操作系统提供了一些机制,如管道、消息队列、共享内存等,用于实现进程间的通信。通过这些机制,进程可以安全地进行数据交换和共享,而不会破坏彼此的独立性。
  4. 调度和资源管理:操作系统负责对进程进行调度和资源管理,确保每个进程都能够公平地获得CPU时间和其他资源。每个进程都有自己的调度优先级和资源限制,操作系统根据这些信息来进行调度和资源分配,保证进程的独立性和公平性。

注: 物理地址实际上也是由操作系统进行分配与管理的,由于页表的存在,建立了映射关系,可以将虚拟地址与物理地址联系起来,但进程与操作系统还是各管各的,只不过通过页表的修改而将虚拟地址与物理地址统一起来。

四、页表

页表

认识:

  1. 页表记录的信息包括权限,让修改到一些只读的权限时,会报错
  2. 页表的地址是物理地址,进程加载到CPU上,页表进行加载时,页表的地址会放到cr3寄存器中,属于进程上下文
  3. 在子进程拷贝父进程的页表时,栈区的地址权限可能会发生转变。通常,父进程的栈区是可写的,它需要在运行时动态地分配和修改栈帧。但是,在子进程中,为了保证进程的独立性和隔离性,OS可能会将栈区的权限设置为只读或不可访问。目的是防止子进程修改父进程的栈数据,如果子进程需要修改栈区,OS帮子进程申请一块空间,并更改物理地址和页表相应的权限。
  4. 页表中有存不存在内存中的问题,1表示存在0表示不存在

页表的当前权限和实际权限发生冲突时,就会触发缺页中断
页表的执行时不存在也会发生冲突时,就会触发缺页中断

注:
惰性加载:惰性加载(按需加载)是一种内存管理策略。它的核心思想是在需要使用数据或代码时才将其加载到内存中,而不是一次性将所有内容都加载进内存。当进程访问虚拟地址时,OS会先检查页表中对应的物理地址是否已经在内存中。如果不在,OS会触发缺页中断,表示所需的数据或代码当前不在内存中。在缺页中断处理过程中,OS会将缺失的页面从磁盘或其他存储介质中加载到内存中,并更新页表中的映射关系。然后进程继续执行,并使用已加载到内存中的数据或代码。

总结

进程 = 内核数据结构(task_struct&&mm_struct&&页表)+ 程序的代码和数据

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/650667.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nginx安装以及具体应用

文章目录 Centos7安装NginxNginx命令Nginx具体应用反向代理 location指令说明负载均衡动静分离 Nginx.conf配置详解 Centos7安装Nginx 下载地址&#xff1a;nginx: download 中间这个就是tar.gz包 Centos7安装Nginx 下载nginx-1.16.1.tar.gz上传到Centos7中的/user/local目…

java8 流到底是什么呢?

引入背景&#xff1a; 1、想像写SQL那样操作集合 2、为了提高性能&#xff0c;需要并行处理&#xff0c;并利用多核架构 流到底是什么呢&#xff1f; 流是Java API的新成员&#xff0c;它允许你 以声明性方式处理数据集合&#xff08;通过查询语句来表达&#xff0c;而不是临时…

springboot+vue3组合,对接支付宝付款第一节:内网穿透

springbootvue3组合,对接支付宝付款第一节:内网穿透&#xff01;接下来会为大家展示&#xff0c;使用java的springboot搭建一个简单的后台。提供业务接口。实现在线下单&#xff0c;支付。支付宝付款的案例。 前端页面布局我们使用vue3element-plus来实现绘制。 今天是第一个…

海康实时监控预览视频流接入web

我们采取的方案是后端获取视频流返回给前端&#xff0c;然后前端播放 海康开放平台海康威视合作生态致力打造一个能力开放体系、两个生态圈&#xff0c;Hikvision AI Cloud开放平台是能力开放体系的核心内容。它是海康威视基于多年在视频及物联网核心技术积累之上&#xff0c;…

Jmeter连接数据库报错Cannot load JDBC driver class‘com.mysql.jdbc.Driver’解决

问题产生: 我在用jmeter连接数据库查询我的接口是否添加数据成功时,结果树响应Cannot load JDBC driver class com.mysql.jdbc.Driver 产生原因: 1、连接数据库的用户密码等信息使用的变量我放在了下面,导致没有取到用户名密码IP等信息,导致连接失败 2、jmeter没有JDB…

CodeGPT--(Visual )

GitCode - 开发者的代码家园 gitcode.com/ inscode.csdn.net/liujiaping/java_1706242128563/edit?openFileMain.java&editTypelite marketplace.visualstudio.com/items?itemNameCSDN.csdn-codegpt&spm1018.2226.3001.9836&extra%5Butm_source%5Dvip_chatgpt_c…

Elasticsearch介绍以及基本操作

目录 一、Elasticsearch介绍 二、关于Elasticsearch的基本操作 &#xff08;1&#xff09;索引操作 &#xff08;2&#xff09;文档操作 三、域的属性 &#xff08;1&#xff09;index &#xff08;2&#xff09;type &#xff08;3&#xff09;store 一、Elasticsearc…

使用Go语言编写安全的HTTP代理服务器

构建一个安全的HTTP代理服务器是至关重要的&#xff0c;因为这可以保护用户的数据和隐私。让我们来看看如何使用Go语言编写一个安全的HTTP代理服务器。 首先&#xff0c;确保你的代理服务器使用HTTPS协议进行通信。HTTPS使用SSL/TLS加密来保护数据传输&#xff0c;可以确保数据…

源聚达科技:抖店的专营店怎么开

在数字化浪潮的推动下&#xff0c;抖音平台不仅为人们提供了丰富的娱乐内容&#xff0c;也成为了电商的新战场。不少创业者和品牌商纷纷选择在抖音上开设自己的专营店&#xff0c;以此抓住流量红利&#xff0c;拓宽销售渠道。那么&#xff0c;如何在抖音平台上成功开设一家专营…

每日一题——LeetCode1346.检查整数及其两倍数是否存在

方法一 循环查找 用indexOf查找每个元素的两倍是否存在在数组中&#xff0c;找到了就直接return true&#xff0c;循环结束还没找到就return false var checkIfExist function(arr) {for(let i0;i<arr.length;i){let index arr.indexOf(arr[i]*2)if(index>0 &&…

听力下降为什么会影响到言语感知?

一、听力障碍对阈值、听觉频率范围和分辨能力的影响 听力障碍使得听障者的听敏度降低&#xff0c;提高了阈值&#xff0c;不利于言语信号的接收。听障者听力阈值的变化在不同频率并不相同&#xff0c;一般而言&#xff0c;高频部分的听力损失往往大于低频部分&#xff0c;而言…

fatal error:require():Failed opening required

今天部署网站遇到了个错误 fatal error:require():Failed opening required 这个错误经常遇到 大多是网站 是开启了 open_basedir 但今天这个错误很神奇 先说解决方法 1. 检测一下是不是真的 不存在这个文件 即使100%确定 也建议你再仔细看一下 这个文件存不存在 今天我遇…

Linux:利用匿名管道构建进程池

文章目录 进程池实现进程池创建信道和进程发送任务释放资源 进程池代码总结 本篇的主题是借助前面所学的基础管道实现一个进程池&#xff0c;那么在实现进程池前先了解进程池是什么&#xff0c;进程池有什么意义&#xff0c;进而对于进程池有一个基本的把握 进程池 给定一个进…

学习笔记-李沐动手学深度学习(四)(12-13,权重衰退、L2正则化、Dropout)

总结 【trick】过拟合及正则化项参数的理解 实际数据都有噪音&#xff0c;一般有噪音后&#xff0c;模型实际学习到的权重w就会比 理论上w的最优解&#xff08;即没有噪音时&#xff09;大。&#xff08;QA中讲的&#xff09; 【好问题】 &#xff08;1&#xff09;不使用正…

svg 属性详解:填充与边框

svg 属性详解&#xff1a;填充与边框 1 颜色和透明度2 填充规则 fill-rule3 边框样式3.1 stroke-width3.2 stroke-linecap3.3 stroke-linejoin3.4 stroke-dasharray 1 颜色和透明度 图像都有颜色&#xff0c;svg 中可以使用属性 fill 和 stroke 来修改图形的颜色。fill 属性设置…

九州金榜|家庭教育中孩子厌学原因及解决办法

作为家长我们希望自己的孩子热爱学习&#xff0c;并取得优异成绩。但是&#xff0c;在现实中&#xff0c;孩子往往会出现厌学情绪&#xff0c;作为家长为此感到非常困扰。如何帮助孩子克服厌学情绪&#xff0c;九州金榜家庭教育将会带大家找出背后的原因&#xff0c;并寻找有效…

Tortoise-tts Better speech synthesis through scaling——TTS论文阅读

笔记地址&#xff1a;https://flowus.cn/share/a79f6286-b48f-42be-8425-2b5d0880c648 【FlowUs 息流】tortoise 论文地址&#xff1a; Better speech synthesis through scaling Abstract: 自回归变换器和DDPM&#xff1a;自回归变换器&#xff08;autoregressive transfo…

SpringSecurity(15)——OAuth2密码模式

工作流程 将用户和密码传过去&#xff0c;直接获取access_token&#xff0c;用户同意授权动作是在第三方应用上完成&#xff0c;而不是在认证服务器&#xff0c;第三方应用申请令牌时&#xff0c;直接带用户名和密码去向认证服务器申请令牌。这种方式认证服务器无法判断用户是…

网站服务器中毒或是被入侵该怎么办?

随着互联网的普及和发展&#xff0c;网站服务器已经成为了企业和个人存储数据、展示信息的重要平台。然而&#xff0c;网络安全问题也日益突出&#xff0c;其中网站服务器中毒或被入侵的事件时有发生。一旦发生这种情况&#xff0c;不仅会导致网站无法正常运行&#xff0c;还可…

阿里云负载均衡对接

1 、开通负载均衡产品 2 、ALB / NLB / CLB ALB&#xff1a; 应用型负载均衡 &#xff0c; 给定对应服务域名与当前实例DNS绑定之后即可使用 支持&#xff1a; HTTP/HTTPS/QUIC等应用层流量协议 NLB&#xff1a; 网络型负载均衡 支持&#xff1a; TCP / UDP / TCPSSL C…