ARM学习(25)链接装载高阶认识

ARM学习(25)链接装载高阶认识

1、例子引出

笔者先引入几个编译链接的例子来介绍一下:

  • 声明无效:declared implicitly?,属于编译错误还是链接错误?
    在这里插入图片描述
    编译阶段的错误,属于编译错误,因为编译器发现这个函数没有声明,声明异常

  • 标识符/符号找不到:xxxx is undefined? undefined xxxxx? 无法解析的外部符号?属于编译错误还是链接错误?
    在这里插入图片描述在这里插入图片描述
    在这里插入图片描述
    第一个是结构体找不到,属于编译阶段错误,相当于类型找不到。
    第二个和第三个属于链接错误,找不到对应的函数符号

  • 只编译不实现:会出现什么情况? 编译可以通过?链接可以通过?
    编译通过,链接不过,因为链接会关心函数的大小和实现。
    补充例子图。

  • 如何骗过编译器/链接器

    • 骗过编译器:让编译器认为我们写的代码是OK的, 可以编译通过。
    • 骗过链接器:让链接器认为我们代码正常,可以链接成完整的可执行文件,比如axf。
    • 通常来说,我们为了让代码运行,可以会编译链接出一个完整的axf,此时需要快速解决一些编译问题和链接问题,就需要让编译器和链接器认为我们代码是OK的,就需要快速适配,即“骗过”。
    • 比如编译到一个函数test_speed(),找不到对应的函数,test_speed,此时就需要声明一下函数,然后就可以编译过**(下图1)**。
    • 然后到链接的时候,发现找不到符号,Error: L6218E: Undefined symbol test_speed (referred from main.o)。(下图2)那么只有声明不行,需要定义一下,所以再加上一个空函数就行,此时就可以链接过。(下图3)
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
  • 编译链接学习的意义:

    • 帮助理解代码执行过程
    • 提升代码质量 (熟悉处理编译等警告)
    • 优化代码性能 (了解编译优化)
    • 更好的跨平台开发 (各个平台编译差异)
    • 更深入掌握调试技巧 (各自视图 调试不按行)
  • 主要有PE和ELF两种可执行文件格式
    在这里插入图片描述

2、编译链接

整体框图,1、预处理 2、编译 3、汇编 4、链接
由下图可以看到,

  • C文件经过预处理可以得到.i文件,编译选项-E
  • .i文件经过编译可以得到汇编文件,编译选项-S
  • .s文件经过汇编可以得到目标文件,
  • .o文件经过打包,可以形成静态库.a文件,也可以经过与库文件链接形成可执行文件,后缀为out或者axf。
    在这里插入图片描述

2.1 预处理器

预处理的主要内容有如下:

  • #define进行替换
  • 处理#if #ifdef等预编译指令
  • 展开#include
  • 删除 // /* */
  • 添加行号和文件名
  • 保留Progma指令 ……
    在这里插入图片描述
    string.h 文件展开
    在这里插入图片描述

2.2 编译

编译遵循的语法规则(个人总结):

  • 函数需要声明,不能重复声明
  • 变量、结构体不能重复定义
  • 变量函数定义需要封号结尾
  • 定义变量数组需要指明大小,不能为负数 宏与枚举不能重复声明
  • 宏需要多行,如果多行,需要\进行链接
  • 包含头文件的路径需要指明
  • 需要包含正确的头文件
  • 函数的声明和定义需要一致
  • If whilefor等关键字得正确使用
  • 注释的正确使用

2.3 链接

链接:将目标文件粘贴在一起,形成可执行文件。
按.o文件进行地址排序

  • Main fun -> Uart1Init fun Main fun -> UartPoll fun
  • 每个目标文件为一个section
  • 目标文件中首个函数地址均从0开始
  • 根据链接顺序,依次向后排
  • 向后排的大小按照目标文件所有函数的大小
  • 后面的符号地址确定后会在前面地址进行修正
    在这里插入图片描述
    按section进行地址排序(设置了分割section 属性,将每个函数进行section分割)
  • Main fun -> Uart1Init fun
  • Main fun -> UartPoll fun
  • 目标文件每个函数为一个section
  • 函数地址均从0开始
  • 根据链接顺序,依次向后排
  • 想后排的大小按照函数的大小
  • 后面的符号地址确定后会在前面地址进行修正

在这里插入图片描述

3、目标文件的认识

3.1 简介

目标文件:以.o或者.obj文件结尾,是可重定位文件(下图1中 REL(Relocatable file))。

  • 包括了代码和数据 (下图2)
  • 入口地址为0 (下图1)
  • 包括多个section/Segment (下图2)
  • Section中包含符号表/重定位表(下图3)
  • 可以被用来链接成可执行文件或者共享库文件
  • 遵循ELF文件格式
    在这里插入图片描述
    下图中有365个段,包括了bss以及data段以及重定位段等。
    在这里插入图片描述在这里插入图片描述
    Section: 链接视图中的段
    Segemnt:装载视图中的段,合并一定相同属性的段

由下图可以看到Section中定义的段,到了Segment里面,代码都合并成了一段。
比如ER_IROM1 、ER_REGION_HEADER、ER_IROM2 合并了,
这样的好处可以减少段零散,节省内存,同时加载相对简单,不需要每个section都去分散加载。
在这里插入图片描述

3.2 目标文件分析

目标文件分析:分割section
分割section的意思,按函数分割为一个段,
UART1Init:Section10,Size 208 Byte,重定位后的地址0x08004C5C(下图1),
UART1Poll:Section11,Size 176Byte,重定位后的地址0x08004D2C(下图1),恰好相差0xD0,也就是208Byte(下图2)。
结论:目标文件确定后,其大小则确定,即链接器按照地址和size依次向后排列,确定地址。
从下图4也可以看出,最终的可执行文件指令代码和目标文件形成的指令代码是一致的
在这里插入图片描述
图1
在这里插入图片描述
图2
在这里插入图片描述
图3
在这里插入图片描述
图4
目标文件分析:文件为section
Uart.o 为一个section,内部函数按顺序地址递增,然后文件之间进行地址排序
Uart.o wifi.o:地址0x08007E68 – 0x08009004(下图2),相差0x119C(4508个byte)(下图3),
结论:目标文件确定后,链接器按照文件地址和size依次向后排列,确定地址,同时size增大(44280 -> 62128)下图5。

图1
在这里插入图片描述
图2
在这里插入图片描述
图3
在这里插入图片描述
图4
在这里插入图片描述
图5

3.3 目标文件重定位

目标文件重定位表:记录着哪些位置的值链接器需要进行重定位
表结构:两个成员,一个offset,一个type

typedef struct rel_table_struct
{u32 offset;u32 type;
}rel_table_t;

可能是数据重定位,也可能是函数重定位

  • 下图1 可以看到是一个重定位表,第一个是函数重定位,其type类型是 R_THM_CALL,符号是DMA_Get_CurrDataCounter
  • 下图1中其他是数据,Type是R_ARMC_ABS32,
  • 图2 可以看到UART1Poll函数,其数据地址都是0,重定位后,图2可以看到都有了相应的地址。

在这里插入图片描述
图1
在这里插入图片描述
图2
在这里插入图片描述
图3

函数地址进行重定位

  • 目标文件中的BL指令F7FFFFFE,经过重定位后,变成F7DFFE94
  • BL的修改规则,是通过BL的ARM 指令编码表来计算的,如下图2。例如知道知道当前地址和编码后的指令代码,就可以知道跳转的地址(下图3和图4),当然如果知道当前地址以及跳转地址,可以推断出修订指令编码值。
  • 函数跳转地址实现如下面代码所示,根据ARM BL指令编码表,然后计算出S、J1和J2,imm1和imm2,最后再组装在一起,形成最后的值。
    在这里插入图片描述
    图1
    在这里插入图片描述
    图2
    在这里插入图片描述
    图3
    在这里插入图片描述
    图4
        int it,pc,offset = 0;printf("please input Intruction:\r\n");scanf("%x", &it);printf("please input pc:\r\n");scanf("%x", &pc);int S = (it & 0x04000000) >> 26;int J1 = (it & 0x00002000) >> 13;int J2 = (it & 0x00000800) >> 11;int I1 = (~(J1 ^ S))&0x1;int I2 = (~(J2 ^ S))&0x1;int imm10 = (it & 0x03FF0000) >> 16;int imm11 = (it & 0x000007FF);if(S == 1){offset = 0xFF000000;}offset |= (S<<24);offset |= (I1<<23);offset |= (I2<<22);offset |= (imm10<<12);offset |= (imm11<<1);printf("jump addr=0x%x\r\n",(offset + pc + 4));

4、静态链接

4.1 空间地址分配

在链接的时候,如果形成图1的这种可执行文件,那么加载的时候,有一些劣势。
简单地址分配:

  • 空间浪费
  • 不利于管理
  • 不利于加载
    在这里插入图片描述
    在这里插入图片描述

4.2 强弱符号和修饰

  • 强符号、弱符号与符号修饰:__weak 或者 attribute((weak))
    符号:函数和变量,链接器接口
    符号名:函数名和变量名
    强符号:只允许存在一个
    弱符号:允许存在多个(weak修饰)
    符号修饰:符号名根据特定规则进行修改
    extern “C”:将函数名按照C语言中生成函数名的方式去生成。

对于弱符号,如果只定义不实现,可以编译过?链接过?能执行吗?
在这里插入图片描述
可以看到能编译过,同样可以链接过,但是执行报错,地址为空,可能无法访问。

所以GCC编译器:

  • 若符号即使没定义,也可以链接
  • 有符号名
  • 符号地址为空,允许出错
    在这里插入图片描述
    在这里插入图片描述

对于ARMCC编译器:

  • 若符号即使没定义,也可以链接
  • 没有符号名
  • 函数引用指令链接成nop,可正常运行

再来说说修饰规则C++调用C:

  • GCC:不作任何操作
  • VC编译器:符号前面加”_”下划线。
  • 不声明extern “C”情况:按照C++的函数命名去修饰
    在这里插入图片描述
    在这里插入图片描述
    修饰规则C++:
  • GCC:N或者_N开头,………
  • VC编译器:??或者?开头 ,…….
    在这里插入图片描述在这里插入图片描述

4.3 链接与ABI接口

链接与ABI接口:Application Binary Interface,应用程序二进制接口

  • API与ABI:前者为源码级别的接口(如POSIX), 后者来二进制级别的接口(各大编译器无法兼容的原因,就是ABI不同,比如GCC和VC编译器,C++标准都一样,但是ABI不同,导致无法互相调用)。

  • 影响ABI的因素:C角度

    • 基本类型大小以及存储方式(大小端)
    • 符号修饰方面 函数调用方式(入栈/返回值)
    • 寄存器使用约定等
    • 堆栈分布方式
  • 影响ABI的因素:C++角度

    • 继承类体系分布
    • 指向成员指针内存分布
    • 虚函数的调用
    • 模板类的实例化
    • 外部符号的修饰
    • 全局对象的构造和析构
    • 异常产生和捕获机制

4.4 链接过程控制与脚本语法

链接过程控制其实就是链接脚本来控制链接的过程,比如将数据分配到链接脚本指定的段。

加载视图:加载期间,代码和数据的分布情况
运行视图:运行期间,代码和数据的分布情况

存储地址:代码数据存放的位置
加载地址:代码数据加载到内存中(执行代码)的地址
执行地址:代码数据真正执行的地址

来看一个加载过程,具体可参考【Bootloader学习理解学习–加强版】。
在这里插入图片描述
链接脚本语法,如下面两张图所示。
在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/740669.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【DDR】DDR4学习记录

这里以美光DDR4芯片 MT40A512M16HA-075E datasheet 为例&#xff0c;说明DDR4存储器的原理及仿真。   根据开发板手册ug1302&#xff0c;在vcu128&#xff08;xcvu37p&#xff09;开发板上&#xff0c;共具有5块DDR4芯片&#xff0c;在数据信号上4块DDR4具有16位数据线&#…

七月论文审稿GPT第3.1版和第3.2版:通过paper-review数据集分别微调Mistral、gemma

前言 我司第二项目组一直在迭代论文审稿GPT(对应的第二项目组成员除我之外&#xff0c;包括&#xff1a;阿荀、阿李、鸿飞、文弱等人)&#xff0c;比如 七月论文审稿GPT第1版&#xff1a;通过3万多篇paper和10多万的review数据微调RWKV七月论文审稿GPT第2版&#xff1a;用一万…

Scrapy 爬虫框架

网络爬虫框架scrapy &#xff08;配置型爬虫&#xff09; 什么是爬虫框架&#xff1f; 爬虫框架是实现爬虫功能的一个软件结构和功能组件集合爬虫框架是个半成品&#xff0c;帮助用户实现专业网络爬虫 scrapy框架结构("52"结构) spider: 解析downloader返回的响…

第四弹:Flutter图形渲染性能

目标&#xff1a; 1&#xff09;Flutter图形渲染性能能够媲美原生&#xff1f; 2&#xff09;Flutter性能优于React Native? 一、Flutter图形渲染原理 1.1 Flutter图形渲染原理 Flutter直接调用Skia 1&#xff09;Flutter将一帧录制成SkPicture&#xff08;skp&#xff…

Doris部署学习(一)

目录 前言 一、Docker容器支持 二、Doris编译步骤 1.拉取镜像 2.构建Docker编译容器 3.下载源码并编译 前言 本文档主要介绍如何通过源码在Docker编译 Doris&#xff0c;以及部署。 一、Docker容器支持 Docker教程&#xff1a;Docker & Docker-Compose 安装教程 - 知…

jupyter 修改文件保存位置 步骤

一、找到配置文件位置 打开Anaconda Prompt&#xff0c;输入&#xff1a; jupyter notebook --generate-config 根据得到的路径&#xff0c;以记事本方式打开配置文件 二、修改路径 在文件中输入&#xff1a; c.NotebookApp.notebook_dir E:\\deepLearning\\Jupyter_files…

Vue的渲染原理

列表渲染 列表渲染 v-for指令写在循环项上&#xff1a;v-for“(一个参数或者两个参数) in/of 要遍历的数组、对象、字符串、指定次数” 遍历数组时参数分别是数组中元素(可以是一个对象)和元素所在下标(从0开始)遍历对象时参数分别是属性值和属性名遍历字符串时参数分别是单…

人工智能在增强数据安全方面的作用

近年来&#xff0c;人工智能&#xff08;AI&#xff09;的力量已被证明是无与伦比的。它不再是我们想象的主题。人工智能已经成为现实&#xff0c;并且越来越清楚地表明它可以让世界变得更美好。但人工智能能帮助我们增强数据安全吗&#xff1f; 由于技术的日益普及&#xff0…

概率与常见的概率分布

概率是数据分析、机器学习中最基础的知识。也是在生活中最实用的一门学科&#xff0c;学了很多大道理不一定能过好一生&#xff0c;学好概率则有一定概率会变得更好。为大概率坚持&#xff0c;为小概率备份。 概率与分布 要想了解概率&#xff0c;首先得搞清楚概率和概率分布的…

力扣L9--- 12. 整数转罗马数字--2024年3月12日

1.题目 2.知识点 &#xff08;1&#xff09;HaspMap的一些基本语法 1&#xff09;创建 HashMap&#xff0c;用于存储键为 String 类型、值为 Integer 类型的键值对。 HashMap<String, Integer> map new HashMap<>();2&#xff09;添加键值对&#xff1a; map.p…

DAY14二叉树迭代遍历

二叉树前序迭代法遍历 前序遍历是中左右&#xff0c;每次先处理的是中间节点&#xff0c;那么先将根节点放入栈中&#xff0c;然后将右孩子加入栈&#xff0c;再加入左孩子。 为什么要先加入 右孩子&#xff0c;再加入左孩子呢&#xff1f; 因为这样出栈的时候才是中左右的顺…

刷题日记——01字符串、非素数个数(厦门大学机试)

题目1——01字符串 分析 经过拆解找规律&#xff0c;发现是两个斐波那契 那么代码就好写了呀 #include <stdio.h>unsigned long long f(int n){if(n0||n1){return n;}return (f(n-1)f(n-2))%2333333; }int main(){int n;scanf("%d",&n);printf("%…

2.Datax数据同步之Windows下,mysql和sqlserver之间的自定义sql文数据同步

目录 前言步骤操作大纲步骤明细mysql 至 sqlServersqlServer 至 mysql执行同步语句中报 前言 上一篇文章实现了不同的mysql数据库之间的数据同步&#xff0c;在此基础上本篇将实现mysql和sqlserver之间的自定义sql文数据同步 准备工作&#xff1a; JDK(1.8以上&#xff0c;推…

亲测抖音小程序备案流程,抖音小程序如何备案,抖音小程序备案所需准备资料

抖音小程序为什么要备案&#xff0c;抖音官方给出如下说明&#xff1a; 1、2024年3月15日后提交备案的小程序将不保证2024年3月31日前平台可初审通过&#xff1b; 2、2024年3月31日后未完成备案小程序将被下架处理。 一&#xff0c;备案前需准备资料 &#xff08;一&#xff0…

BUUCTF-----[SWPU2019]Web1

打开页面&#xff0c;原本以为是二次注入,结果不是&#xff0c;先注册一个账户 在申请发布广告中&#xff0c;发现反射性xss(然而没有什么用) 在广告申请名字中发现注入点 开始注入 通过一系列的测试&#xff0c;发现系统过滤了#&#xff0c;or&#xff0c;空格 orde…

《Fallacies of Distributed Systems》原文手译

Fallacies of Distributed Systems 分布式系统的谬误 Fallacies of distributed systems are a set of assertions made by L Peter Deutsch and others at Sun Microsystems describing false assumptions that programmers new to distributed applications invariably mak…

操作系统--LRU算法,手撕

今天研究一下LRU算法&#xff0c;上学期学数据结构的时候就应该学一下这个算法&#xff0c;不过后面操作系统也会讲到LRU算法 题目 LRU缓存leetocde146 LRU&#xff08;Least Recently Used&#xff0c;最近最少使用&#xff09;算法是一种常见的缓存替换算法&#xff0c;通…

windows系统图标变白设置

我们在使用系统的时候&#xff0c;通常会在桌面创建图标&#xff0c;有时候桌面图标过多&#xff0c;整理图标放在新建文件夹的时候&#xff0c;图标变白&#xff0c;通常情况下都是缓存问题&#xff0c;这里也是删除缓存解决演示系统&#xff1a;windows11 1显示图标缓存目录 …

保护数字前沿:有效的威胁暴露管理

人工智能技术正在从根本上改变网络安全领域的方向。仅 2023 年&#xff0c;全球企业预计将在人工智能上花费 1027.8 亿美元&#xff0c;以阻止网络安全威胁。 人工智能 (AI)在增强网络安全措施方面发挥着关键作用&#xff0c;因为它能够快速分析大量数据并识别可能表明潜在威胁…

Unity 显示MeshRenderer的渲染层级

Unity 显示MeshRenderer的渲染层级 前言源码MeshRendererInspectorSkinnedMeshRendererInspector 参考 前言 Mesh Renderer和Skinned Mesh Renderer组件默认不显示Order&#xff0c;找了个工具显示一下。 源码 下面两个代码放入Editor文件夹中 MeshRendererInspector Me…