14 [虚拟化] 虚存抽象；Linux进程的地址空间

南京大学操作系统课蒋炎岩老师网络课程笔记。

视频：https://www.bilibili.com/video/BV1N741177F5?p=14
讲义：http://jyywiki.cn/OS/2021/slides/10.slides#/

本讲概述

程序 = 状态机；进程 = 状态机的执行（路径）

状态机的状态由内存和寄存器（M，R）决定
- 寄存器会在发生中断之后保存到进程的内存（内核栈）中
- 内存呢？

虚存抽象：

进程的地址空间
分页机制
分页机制和虚拟存储

进程的地址空间

进程的地址空间中有什么

进程的地址空间 = 内存中若干连续的 “段”，每一段是可访问的（读/写/执行）的内存，可能映射到某个文件和 / 或在进程间共享。

进程执行指令需要代码、数据、堆栈：

代码（如main，%rip会从此处取出待执行的指令）
数据（如static int x）
堆栈（如int y）

地址空间中还有：

动态链接库
运行时分配的内存

以上这些都可以直接用指针访问。

那么，这个地址空间是怎么创建的呢？创建之后，我们还可以修改它吗？肯定是能的，如动态链接库可以动态地加载。

管理进程地址空间的系统调用

// 映射
void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t offset);
int munmap(void *addr, size_t length);// 修改映射权限
int mprotect(void *addr, size_t length, int prot);

mmap的作用就是把磁盘文件的一部分直接映射到进程的内存中

说人话：在状态机上增加或者删除一段可访问的内存。

把文件映射到地址空间？

它们好像的确没什么区别：

文件 = 字节序列
内存 = 字节序列
操作系统允许这样映射好像挺合理的，下一课中，ELF loader用mmap非常容易实现，解析出要加载哪部分到内存，然后直接mmap就完了。

查看进程的地址空间

pmap

pmap命令可以查看某个进程的地址空间：

pmap [PID]

动态链接 / 静态链接的地址空间

我们准备一个死循环C程序：

int main(){while (1);
}

分别用动态链接和静态链接的方式来编译它：

gcc test.c -o test_d.out
gcc -static test.c -o test_s.out

分别把得到的test_d.out和test_s.out后台执行并用pmap来查看它们的地址空间：

$ ./test_d.out &
[1] 5002
$ ./test_s.out &
[2] 5015pmap 5002
pmap 5015

分别得到动态链接和静态链接的pmap如下：

5002:   ./test_d.out
000055cfab135000      4K r-x-- test_d.out
000055cfab335000      4K r---- test_d.out
000055cfab336000      4K rw--- test_d.out
00007f26750a9000   1948K r-x-- libc-2.27.so
00007f2675290000   2048K ----- libc-2.27.so
00007f2675490000     16K r---- libc-2.27.so
00007f2675494000      8K rw--- libc-2.27.so
00007f2675496000     16K rw---   [ anon ]
00007f267549a000    164K r-x-- ld-2.27.so
00007f2675691000      8K rw---   [ anon ]
00007f26756c3000      4K r---- ld-2.27.so
00007f26756c4000      4K rw--- ld-2.27.so
00007f26756c5000      4K rw---   [ anon ]
00007fff1d64d000    132K rw---   [ stack ]
00007fff1d6cd000     12K r----   [ anon ]
00007fff1d6d0000      4K r-x--   [ anon ]
ffffffffff600000      4K --x--   [ anon ]total             4384K

5015:   ./test_s.out
0000000000400000    728K r-x-- test_s.out
00000000006b6000     24K rw--- test_s.out
00000000006bc000      4K rw---   [ anon ]
0000000000e17000    140K rw---   [ anon ]
00007fff1bf5b000    132K rw---   [ stack ]
00007fff1bfc5000     12K r----   [ anon ]
00007fff1bfc8000      4K r-x--   [ anon ]
ffffffffff600000      4K --x--   [ anon ]total             1048K

可以看到动态链接比静态链接多了很多动态链接库.so，占用的内存空间也较大。而通过ls -l命令，我们发现动态链接生成的可执行文件所占的磁盘空间更小。

pmap的实现

我们不禁好奇pmap是怎样实现的，可以通过追踪系统调用的strace工具来查看：

strace pmap 5002

实际上，我们多次强调过的一个概念：程序就是一个状态机，而这样一个状态机想要得到操作系统里的任何东西，都要通过系统调用，所以当我们想知道pmap这样的程序是怎样实现的，最好的办法就是去看一下它执行了哪些系统调用，因此说追踪系统调用的strace工具是十分有用的。

言归正传，上述pmap指令的输出中最关键的是这一句：

openat(AT_FDCWD, "/proc/5002/maps", O_RDONLY) = 3

我们看到，pmap是去读/proc文件中相关进程号的内存信息maps。（关于/proc：linux /proc 详解）

我们发现了什么宝藏？

我们直接看一下上面动态链接的可执行文件的进程：

cat /proc/5--2/maps

输出：

55cfab135000-55cfab136000 r-xp 00000000 103:02 28869833                  /home/song/CppProjects/test_d.out
55cfab335000-55cfab336000 r--p 00000000 103:02 28869833                  /home/song/CppProjects/test_d.out
55cfab336000-55cfab337000 rw-p 00001000 103:02 28869833                  /home/song/CppProjects/test_d.out
7f26750a9000-7f2675290000 r-xp 00000000 103:02 8393695                   /lib/x86_64-linux-gnu/libc-2.27.so
7f2675290000-7f2675490000 ---p 001e7000 103:02 8393695                   /lib/x86_64-linux-gnu/libc-2.27.so
7f2675490000-7f2675494000 r--p 001e7000 103:02 8393695                   /lib/x86_64-linux-gnu/libc-2.27.so
7f2675494000-7f2675496000 rw-p 001eb000 103:02 8393695                   /lib/x86_64-linux-gnu/libc-2.27.so
7f2675496000-7f267549a000 rw-p 00000000 00:00 0
7f267549a000-7f26754c3000 r-xp 00000000 103:02 8393690                   /lib/x86_64-linux-gnu/ld-2.27.so
7f2675691000-7f2675693000 rw-p 00000000 00:00 0
7f26756c3000-7f26756c4000 r--p 00029000 103:02 8393690                   /lib/x86_64-linux-gnu/ld-2.27.so
7f26756c4000-7f26756c5000 rw-p 0002a000 103:02 8393690                   /lib/x86_64-linux-gnu/ld-2.27.so
7f26756c5000-7f26756c6000 rw-p 00000000 00:00 0
7fff1d64d000-7fff1d66e000 rw-p 00000000 00:00 0                          [stack]
7fff1d6cd000-7fff1d6d0000 r--p 00000000 00:00 0                          [vvar]
7fff1d6d0000-7fff1d6d1000 r-xp 00000000 00:00 0                          [vdso]
ffffffffff600000-ffffffffff601000 --xp 00000000 00:00 0                  [vsyscall]

前面都好理解，是我们进程执行时的代码、数据、堆栈、动态链接库等，但是最后那三个：vvar、vdso、vsyscall是什么鬼？