计算虚拟化2——内存虚拟化

目录

物理机内存访问过程

虚拟地址VA和物理地址PA概念

MUU实现VA到PA所使用的映射表

内存虚拟化类型

内存软件辅助虚拟化

内存硬件辅助虚拟化

内存虚拟化-内存超分配

内存共享

内存置换

内存气泡


物理机内存访问过程

内存的基本知识

内存都是从物理地址0开始的,n结束

内存都是连续的

MMU(Memory Management Unit)内存管理单元,主要功能为将内存虚拟地址到物理地址的转换、内存保护、中央告诉缓存的控制等

虚拟地址VA和物理地址PA概念

为什么提出虚拟地址VA

我们知道一个服务器的物理内存是固定的,从0开始,到n结束;当有多个应用程序要使用内存时,每个应用程序都认为自己使用的内存地址是从0开始,到x结束(x≤n),此时某个进程的内存区就可能会被别的进程覆盖;为了解决此问题就提出了虚拟内存的概念,也就是虚拟内存地址VA的概念(应用程序通过此地址无法直接访问内存),通过MMU内存管理单元来把每个应用程序使用的VA虚拟地址转为具体的对应的物理内存地址PA

虚拟地址VA和物理地址PA的转换

虚拟地址VA由虚拟页面号VPN和虚拟地址偏移VA Offset组成;物理地址PA由物理页帧号PFN和物理地址偏移PA Offset组成(通常PA Offset等于VA Offset)

当虚拟地址VA转为物理地址时,需要将VPN转为PFN,然后在加上VA Offset(即 PA=PFN+VA Offset)

VA和PA地址转换的大致工作原理如下

实际上应用程序在往内存中读写数据时,需要先将请求发往CPU,再由CPU发往内存

所以应用程序将自己需要访问的虚拟内存地址VA发往CPU,CPU将VA虚拟地址发给MMU

由,MMU通过映射表将VA虚拟地址转为PA物理内存地址,然后交给内存完成内存的读写

MUU实现VA到PA所使用的映射表

MMU将VA转为PA的两种映射表:页表(慢表)、TLB传输后备缓冲器(快表)

页表(慢表)基本概念

MMU没有自己的存储空间,所以最开始映射表存储在内存中,名字叫页表

MMU如何知道页表在内存的具体地址呢?

通常CPU会提供一个页表基址寄存器给操作系统使用,用于给MMU指示页表的基地址(不同处理器架构对应的寄存器不一样,x86的寄存器为CR3、ARM-v8的寄存器为TTBR、RISC-V的寄存区为SATP);寄存器存储了第一级页表的基地址,由于在实际使用中都是使用多级页表来存储虚拟地址和物理地址的映射关系,所以需要寄存器找到第一级页表的基地址,然后依次查找后续级别的页表知道找到VA对应的真正的物理内存地址

不同多级页表涉及的表项

二级页表

分为页全局目录PGD(page global directory)和页表入口PTE(page table entry)

其中PGD来存储下一级页表的基地址,PTE来存储真正的物理地址

共有PGD、PTE二级目录

三级页表

在PGD和PTE之间新加了页中间目录PMD(page middle directory)

共有PGD、PMD、PTE三级目录

四级页表

在PGD和PMD之间新增了页上级目录PUD(page upper directory)

共有PGD、PUD、PMD、PTE四级目录

常见系统使用多级页表的类型

未开启PAE物理地址扩展的32位系统只使用二级页表;开启PAE物理地址扩展的32位系统使用三级页表;64位系统使用四级页表或三级页表

具体使用多少级页表、虚拟地址、物理地址等的格式与是32位系统还是64位系统有关、也与处理器的架构有关;但是MMU管理的工作原理都是一致的,不管是二级页表、三级还是四级,都是通过第一级找到第二级,第二级找到第三级等,最终找到其它物理地址

使用三级页表的工作原理

由于使用三级页表来存放VA与PA之间的关系,此时VA地址也被分为4部分VPN1、VPN2、VPN3、VA Offset

应用程序将VA发给CPU,CPU将VA发给MMU,MMU访问页表基址寄存器,得到一级页表PGD的基地址,再结合虚拟地址中的VPN1(PGD index)找到下一级页表PMD的基地址;得到了PMD的基地址,再结合虚拟地址中的VPN2(PMD index)得到再下一级PTE的基地址,结合虚拟地址中的VPN3(PTE index)的到最终的PFN,然后通过PFN+VA offset得到真实的物理地址,然后MMU将VA转为PA,最后通过PA地址访问内存

CPU→MMU→寄存器→读取内存中的页表→MMU将VA转为PA→内存(整个流程访问了两次内存)

TLB传输后备缓冲器(快表)

TLB存放在CPU缓存中(CPU缓存的速率高于内存),并且能够直接通过VA的VPN来获取到PA地址的PFN,进而获得PA地址

TLB如何通过VA找到PA地址

TLB表根据虚拟地址VA的高20位(此20位是针对x86架构的,不同架构的值不同)来查找表项,找对对应的物理地址PA

TLB工作流程

应用程序将VA地址发给CPU,CPU将VA发给MMU,MMU将存放在CPU缓存的TLB读取出来,然后MMU将VA转为PA,最后通过PA地址访问内存

CPU→MMU→读取CPU缓存中的TLB表→MMU将VA转为PA→内存

有些VA地址在TLB中没有映射怎么办?

根据VA的高20位地址,在TLB中查找对应的PA地址,如果没有对应表项就返回TLB Miss,此时MMU就去读取内存的页表,通过页表来实现VA到PA的转换


内存虚拟化类型

内存半虚拟化主要是Xen厂商使用,此处不做介绍

提前了解的概念

GVA        虚拟机访问内存的虚拟内存地址

GPA        虚拟机访问内存的物理内存地址

HVA        物理机访问内存的虚拟内存地址

HPA        物理机访问内存的物理内存地址

虚拟机内存虚拟化的核心

虚拟机的内存虚拟化类似于物理机的虚拟内存,虚拟机的内存虚拟化通过引入一层新的地址空间(GPA),使得虚拟机以为自己运行在真实的物理地址中,实际上它是通过VMM访问真实的物理地址的

内存软件辅助虚拟化

常用的软件辅助全虚拟化通过“影子页表(shadow page table)”技术来实现

虚拟机设计的每个映射表的作用

虚拟机的页表/TLB表维护GVA到虚拟机物理地址GPA的映射关系

VMM定义的映射表维护GPA到HVA的映射表

物理机的页表/TLB表维护HVA到HPA的映射表

VMM的影子页表维护GVA到HPA的映射表(影子页表由VMM维护)

虚拟机的页表和影子页表会通过一个哈希表建立关联(也有其他的关联方式),可以完成GPA到HPA的映射

影子映射表的作用

VMM为每个虚拟机都维护一个影子页表,影子页表维护GVA到HPA的映射表,简化了地址转换的过程,实现了虚拟机的虚拟内存地址GVA到物理机的真实内存地址HPA的直接映射

具体工作原理

当虚拟机通过虚拟机CR3寄存器来获取到自己虚拟机的页表或获取TLB表时,都会被VMM捕获,通过影子页表直接将GVP转为HPA,完成内存的访问

如果影子页表没有相应的GVP表项如何做

虚拟机的应用程序访问内存,CPU将GVA地址发给虚拟机的MMU,虚拟机的MMU通过页表或TLB表得到GPA;然后再通过VMM查找GPA对应的HVA,最后通过物理主机的页表或TLB表查HVA对应的HPA(如果没有HPA则为HVA分配对应的HPA),最终得到GPA对应的HPA关系,然后将其对应关系填充到影子页表;

VMM如何感知到虚拟机对自己的页表做出了一些更改

VMM将虚拟机对应影子页表的物理内存区域标记为只读状态,当虚拟机想要更改自己的页表时,就会对该物理内存区域做出更改的操作,此时就会抛出CPU的异常,触发一个VM Exit,这个时候就退出到VMM中,VMM就知道了虚拟机在更改页表

此时VMM代替虚拟机操作系统修改虚拟机页表,然后更新自身的影子页表中GVA到HPA的映射关系

存在的问题

每次触发VM exit的话开销很高

VMM承担太多影子页表的维护工作

内存硬件辅助虚拟化

常见的内存硬件虚拟化技术

Inter的EPT(Extend Page Table)扩展页表技术

AMD的RVI(Rapid Virtualization Index)快速虚拟化索引技术

两者细节方面有所不同,但是设计理念完全一致,把影子页表中依靠软件实现的过程改为硬件实现(GVP到GPA的转换没有变化,只是GPA到HPA的转化是由硬件来完成)

EPT页表的工作原理

EPT页表存放在CPU中

当应用程序访问内存时,将GVA交给虚拟机CPU,虚拟机CPU会通过访问虚拟机中的页表来完成GVA到GPA的转换;接着CPU通过EPT页表来实现GPA到HPA的转换

如果EPT页表没有GPA对应的HPA地址,如何解决

如果HPA为空,则CPU会抛出EPT Violation异常,触发一个vm exit让VMM来处理,此时VMM会根据GPA地址将其映射到对应的HVA地址,然后通过物理页表找到此HVA地址对应的HPA(如果没有HPA则为HVA分配对应的HPA),最后再更新EPT表项

如果EPT页表中没有GPA地址,如何解决?

如果GPA地址为空(即缺页),则CPU产生缺页异常,发生缺页中断(如果是软件实现方式,则会产生vm exit)但是硬件实现方式下,并不会产生VM-exit,而是交给虚拟机内核的中断处理程序处理;在中断处理程序中会产生EXIT_REASON_EPT_VIOLATION,虚拟机退出,VMM截获到该异常后,为虚拟机分配新的物理地址HPA,并建立新的GPA到HPA的映射关系,保存到EPT中,这样在下一次访问的时候就可以完成GPA到HPA的转换


内存虚拟化-内存超分配

虚拟机内存和物理机内存之间并不是一一对应的,物理机可以通过内存超分配来超额分配内存给虚拟机

内存超分配实现分配给虚拟机的内存总数大于实际可用的物理内存总数

实现内存超分配主要通过内存复用技术实现的

而内存复用通过内存共享、内存置换、内存气泡三大技术来对内存进行分时复用,实现内存超分配

内存复用=共享,气泡,置换共同作用

内存共享

虚拟机之间共享同一物理内存空间(蓝色部分),并且该共享的物理内存为只读权限(多个虚拟机内存中保存的多份相同数据,在物理内存中只保留一份数据)

当某个虚拟机需要写入数据到共享内存空间时,此时就通过写时复制技术,另开辟一块内存空间使用,并修改映射表

内存置换

虚拟机长时间未访问的内存内容置换放到硬盘中,并建立映射表,释放内存

当虚拟机再次访问该内存时再置换回来

内存气泡

将较为空间的虚拟机内存释放给内存使用率较高的虚拟机(即:把虚拟机2的空闲内存分给虚拟机1使用);内存的回收和分配为系统动态执行,虚拟机上的应用无感知

提升了内存利用率;不过需要保证所有虚拟机正在使用的内存总量不能超过物理机的物理内存总量

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/129858.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

golang工程——opentelemetry简介、架构、概念、追踪原理

opentelemetry 简介 OpenTelemetry,简称OTel,是一个与供应商无关的开源可观测性框架,用于检测、生成、收集和导出 遥测数据,如轨迹、度量、日志。OTel的目标是提供一套标准化的供应商无关SDK、API和工具,用于接 收、…

阿里云免费服务器

文章目录 最近的阿里云活动By the way在云服务器ECS上搭建个人网站正文补充:定期释放补充:不知道阿里云服务器的密码怎么办?成果补充:怎么找到实例操作的后台?补充:怎么查看服务器到期时间? 究竟白嫖了多少?最后&…

[论文笔记]RetroMAE

引言 RetroMAE,中文题目为 通过掩码自编码器预训练面向检索的语言模型。 尽管现在已经在许多重要的自然语言处理任务上进行了预训练,但对于密集检索来说,仍然需要探索有效的预训练策略。 本篇工作,作者提出RetroMAE,一个新的基于掩码自编码器(Masked Auto-Encoder,MAE)…

【leetcode】17.04 消失的数字

目录 1. 思路2. 代码 题目链接:leetcode 17.04.消失的数字 题目描述: 1. 思路 要求算法复杂度为O(n),有两种方式: (1)利用异或交换律 与nums所有元素异或一遍;与0-n的值异或,n…

开源 | 30余套STM32单片机、嵌入式Linux、物联网、人工智能项目(开发板+教程+视频)

文末免费领取! 30余套综合项目案例 STM32单片机、嵌入式、物联网、人工智能 项目文档源码视频 高校教学、学生毕设、个人项目练手 嵌入式实战项目推荐 15个嵌入式LinuxQt综合应用项目,涉及家居、医疗、农业等多种应用领域,案例中使用了嵌…

Linux高级命令(扩展)二

一、Linux下用户管理 1、用户概念以及基本作用 用户:指的是Linux操作系统中用于管理系统或者服务的人 一问:管理系统到底在管理什么? 答:Linux下一切皆文件,所以用户管理的是相应的文件 二问:如何管理…

【自用】vmware workstation建立主机window与虚拟机ubuntu之间的共享文件夹

1.在windows中建立1个文件夹 在vmware中设置为共享文件夹 参考博文: https://zhuanlan.zhihu.com/p/650638983 2.解决: (1)fuse: mountpoint is not empty (2)普通用户也能使用共享目录 参考博文&#x…

大模型 其他方案的进度

Llama2 1、中文提问,英文的回答,对于中文不友好 2、网上还没有看到很详细的微调教程 3、虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍,但是中文预训练数据的比例依然非常少,仅占0.13%,这也导致了原始Llama2的中…

多模态大模型最全综述

由微软7位华人研究员撰写--多模态基础模型已经从专用走向通用 它从目前已经完善的和还处于最前沿的两类多模态大模型研究方向出发,全面总结了五个具体研究主题: 视觉理解视觉生成统一视觉模型LLM加持的多模态大模型多模态agent 1、谁适合阅读这份综述&…

Vue3问题:如何实现组件拖拽实时预览功能?

前端功能问题系列文章,点击上方合集↑ 序言 大家好,我是大澈! 本文约3000字,整篇阅读大约需要5分钟。 本文主要内容分三部分,第一部分是需求分析,第二部分是实现步骤,第三部分是问题详解。 …

运维基础-Docker容器命令部署

Docker基础知识 安装问题-有podmanCentos8使用yum install docker -y时,默认安装的是podman-docker软件安装docker yum list installed | grep dockeryum -y remove xxxxDocker安装配置下载安装docker启动docker,并设置开机启动下载所需镜像 centos镜像进…

【报错】错误 C1004 :发现意外的文件尾

文章目录 情景在现出错原因解决方案问题解决 情景在现 出错原因 这个错误通常是由于您在源文件中漏写了某些括号或者分号,导致编译器在处理到文件末尾时发现没有遇到预期的符号。 解决方案 解决这个错误的方法是,打开您的源文件,仔细检查是否…

EMC Unity存储系统如何查看SSD的使用寿命

为什么要写这个博客? 客户对老的EMC unity的存储系统要扩容,如何确定SSD磁盘是全新的还是拆机二手的?很多时候客户还有一个奇葩的要求,就是要和5年前的磁盘PN一致,甚至要求固件版本一致,最关键的还要求是全…

大数据(十):数据可视化(二)

专栏介绍 结合自身经验和内部资料总结的Python教程,每天3-5章,最短1个月就能全方位的完成Python的学习并进行实战开发,学完了定能成为大佬!加油吧!卷起来! 全部文章请访问专栏:《Python全栈教…

Redis Sentinel 哨兵模式

Sentinel 哨兵模式 Redis Sentinel 官网 Redis 的 Sentinel 文档 -- Redis中国用户组(CRUG) Sentinel Redis 命令参考(红色) Sentinel 通过监控的方式获取主机的工作状态是否正常,当主机发生故障时, Senti…

校验验证码是否过期(定时刷新验证码)

需求: 我们在登录的时候会遇到通过接口请求验证码的操作,这里的验证码会有过期的时间,当我们验证码过期了,我们要进行重新刷新验证码。 我们这里根据后端返回的当前时间和过期时间判断,过期的时间超过了当前时间的时候…

vuepress使用及拓展(骚操作)

官网 文章目录 背景问题思考方案思索实现方案实现结果存在问题 背景 当前开放平台文件静态保存在前端项目,每次修改都需要通过修改文件发版的方式,很不便利。 1、需要前端手动维护 2、每次小的修改都要发版 随着对接业务的增多,对接文档的变…

ch0_OSI 七层网络协议介绍

目录 概述 1、三网融合的概念 三网:电信网络、有线电视网络、计算机网络 概念:把上述三种网络融合成一种网络 2、计算机网络的定义、分类 定义:计算机网络是将地理位置不同的独立计算机系统,通过传输介质链接起来&#xff0c…

开发一款直播弹幕游戏需要多少钱?

开发一款直播弹幕游戏需要多少钱?有好多朋友在咨询过弹幕游戏的开发价格后,都会比较吃惊,一款体量这么小的游戏为什么动辄就要几万块甚至十几万? 我来给你们说分析一下原因,这种游戏如果脱离开直播间,可以…

45基于matlab的ARIMA:AutoregressiveIntegratedMovingAverage model。

基于matlab的ARIMA:AutoregressiveIntegratedMovingAverage model。自回归差分移动平均模型(p,d,q),AR自回归模型,MA移动平均模型,时间序列模型步骤包括:1. 数据平稳性检验;2. 确定模型参数;3. …