一、目标文件
-
首先目标文件的构成,Linux下就是.o 文件
编译器编译源码后生成的文件叫目标文件(Object File)。
目标文件和可执行文件一般采用同一种格式,这种存储格式为 ELF。 -
目前文件的内容至少有编译后的机器指令代码和数据,除了这些,目标文件中还包含了链接时所必须的一些信息,比如符号表、调试信息、字符串等。
般目标文件将这些信息按照不同的属性,以段(segment)的形式存储。
代码段(.text):源代码编译过后的机器指令。
数据段(.data):全局变量和局部静态变量被放在数据段。
只读数据段(.rodata):const 修饰的变量和其他字符串常量。
bss 段:为未初始化的符号,预留足够的空间。未初始化的变量在 bss 段。
其他段。
如下:
ELF文件头
ELF 文件开头是一个头文件,它描述的是整个文件的属性,包括:文件的类型、目标硬件、目标操作系统等信息。
段
代码段;数据段;BSS段等
代码段
C 语言编译后的机器指令,都保存在代码段(.text)。
将代码段反汇编我们可以发现机器(汇编指令):
数据段
数据段(.data)保存的是哪些已经初始化(非零)的全局变量(静态变量和非静态变量)和局部静态变量。
只读数据段
只读数据段(.rodata),保存的是只读数据。一般是程序中 const 修饰的只读变量 和字符串常量(包括 printf 函数中的格式化字符串%d)。
BSS段
bss 段(.bss),用来记录所有未初始化的全局变量(或者零初始化)和局部静态变量大小总和,然后为其预留位置。
未初始化的全局变量(或者零初始化)和局部静态变量,因为都是 0,所以在.data 段开辟存储空间存储 0 是没有必要的。
二、应用程序的组成
2.1组成
那么站在高级语言的角度我们将一个程序主要分为如下的段:
代码段
数据段 (变量常量等)
BSS 段(未初始化)
栈
堆
一个可执行程序至少包含:代码段 + 数据段 + BSS 段。也就是说在存储时(没有加载到内存运行),至少拥有三个部分,分别是代码段(text)、数据段(data)、和BSS 段。
当应用程序运行时(运行态),此时需要另外两个域:堆和栈。正在运行的程序:代码段 + 数据段 + BSS 段 + 堆 + 栈。
2.2 内存管理
在将应用程序加载到内存空间执行时,操作系统负责代码段、数据段和 BSS 段的加载,并在内存中为这些段分配空间。栈也由操作系统管理,不需要程序员显示的管理;堆段需要程序员自己管理,显示的申请和释放。
- 动态分配
在运行时执行动态分配。需要程序员显示管理,通过 malloc 申请,并且需要手动 free 掉,否则会造成内存泄漏。
- 静态分配
在编译时就已经决定好了分配多少 Text+Data+Bss+Stack(静态分配)。
静态分配的内存在进程结束后由系统释放(Text+Data),Stack 堆上的数据则在退出函数后立即被销毁。
三、各段说明
3.1 栈
栈保存函数的局部变量(不包括 static 修饰的变量),参数以及返回值。是一种后进先出(LIFO)的数据结构。
在调用函数或过程后,系统会清除栈上保存的局部变量、函数调用信息及其他信息。
栈的另外一个重要特征是,它的地址空间 向下减少,即当栈上保存的数据越多,栈的地址越低。静态内存分配。
注意,由于栈的空间通常比较小,一般 linux 程序只有几 M,故局部变量,函数入参应该避免出现超大栈内存使用,比如超大结构体,数组等,避免出现 stack overflow。
3.2 堆
堆保存函数内部动态分配(malloc 或 new)的内存,是另外一种用来保存程序信息的数据结构。
堆是先进先出(FIFO)数据结构。堆的地址空间是向上增加,即当堆上保存的数据越多,堆的地址越高。动态内存分配。
注意:堆内存需要程序员手动管理内存,通常适用于较大的内存分配,如频繁的分配较小的内存,容易导致内存碎片化。
3.3 BSS
bss 是英文 Block by Symbol 的简称。通常用来存放程序中未初始化和初始化为 0的全局变量的一块内存区域,在程序载入时由内核清零。数据段属于静态内存分配
3.4 数据段
通常用来存放程序中已初始化的(非 0)全局变量和静态局部变量。数据段的起始位置由链接定位文件确认,大小在编译链接时自动分配。数据段属于静态内存分配
3.4 代码段
代码段在内存中被映射为只读。它是由编译器在编译链接时自动计算的。通常是用来存放程序执行的指令。代码段输入静态内存分配。
总结:
参考:
https://zhuanlan.zhihu.com/p/347262004