iOS ------ 编译链接

编译流程分析

编译可以分为四步:

  • 预处理(Prepressing)
  • 编译(Compilation)
  • 汇编 (Assembly)
  • 链接(Linking)

在这里插入图片描述

预编译(Prepressing)

过程是源文件main.c和相关头文件被(stdio.h)被预编译器cpp预编译成一个.i文件

使用命令:clang -E main.m 或在Xcode的Product->Perform Action->Preprocess得到预编译结果。

#import <Foundation/Foundation.h>
#import "Person.h"
int main(int argc, const char * argv[]) {@autoreleasepool {// insert code here...NSLog(@"Hello, World!");Person* person = [[Person alloc] init];}return 0;
}

预编译后

# 187 "/Applications/Xcode.app/Contents/Developer/Platforms/MacOSX.platform/Developer/SDKs/MacOSX.sdk/System/Library/Frameworks/Foundation.framework/Headers/Foundation.h" 2 3
# 9 "main.m" 2
# 1 "./Person.h" 1
# 10 "./Person.h"
#pragma clang assume_nonnull begin@interface Person : NSObject
@property NSString* name;
@end
# 14 "./Person.h"
#pragma clang assume_nonnull end
# 10 "main.m" 2
int main(int argc, const char * argv[]) {@autoreleasepool {NSLog(@"Hello, World!");Person* person = [[Person alloc] init];person.name = @"111";}return 0;
}

预编译主要是处理源代码中以“#”开头的预编译指令:

  • "define"删除并展开对应宏定义
  • 处理所有的条件预编译指令,如#if/#ifdef/#else/#endif
  • "#include/#import"包含的文件递归插入此处
  • 删除所有的注释"//或/**/"
  • 添加行号或文件名标识。如“#1"main.m"”,编译调试会用到

编译(compliation)

编译过程就是把预处理完的文件进行一系列的:词法分析语法分析语义分析及优化后生产相应的汇编代码文件,此过程是整个程序构建的核心部分,也是最复杂的部分之一。
其编译过程相当于如下命令:

clang -S main.i -o main.s
  • 词法分析:这一步把源文件中的代码转化为特殊的标记流,源码被分割成一个一个 token(关键字、标识符、字面量、特殊符号),在行尾Loc中都标记出了源码所在的对应源文件和具体行数,方便在报错时定位问题。

使用命令clang -Xclang -dump-tokens main.m

star '*'		Loc=<main.m:14:15>
identifier 'person'	 [LeadingSpace]	Loc=<main.m:14:17>
equal '='	 [LeadingSpace]	Loc=<main.m:14:25>
l_square '['	 [LeadingSpace]	Loc=<main.m:14:27>
l_square '['		Loc=<main.m:14:28>
identifier 'Person'		Loc=<main.m:14:29>
identifier 'alloc'	 [LeadingSpace]	Loc=<main.m:14:36>
r_square ']'		Loc=<main.m:14:41>
identifier 'init'	 [LeadingSpace]	Loc=<main.m:14:43>
r_square ']'		Loc=<main.m:14:47>
semi ';'		Loc=<main.m:14:48>
  • 语法分析:把语法分析生成的标记流,解析成一个抽象语法树(AST),每个节点也标记了其在源码的位置

执行 clang 命令 clang -Xclang -ast-dump -fsyntax-only main.m

抽象语法树(abstract syntax code,AST)是源代码的抽象语法结构的树状表示,树上的每个节点都表示源代码中的一种结构,这所以说是抽象的,是因为抽象语法树并不会表示出真实语法出现的每一个细节,比如说,嵌套括号被隐含在树的结构中,并没有以节点的形式呈现。

 |   |     `-ObjCMessageExpr 0x130078978 <col:28, col:41> 'Person *' selector=alloc class='Person'|   `-PseudoObjectExpr 0x130078b50 <line:15:9, col:24> 'NSString *'|     |-BinaryOperator 0x130078af8 <col:9, col:24> 'NSString *' '='|     | |-ObjCPropertyRefExpr 0x130078ab0 <col:9, col:16> '<pseudo-object type>' lvalue objcproperty Kind=PropertyRef Property="name" Messaging=Setter|     | | `-OpaqueValueExpr 0x130078a98 <col:9> 'Person *'|     | |   `-ImplicitCastExpr 0x130078a10 <col:9> 'Person *' <LValueToRValue>|     | |     `-DeclRefExpr 0x1300789f0 <col:9> 'Person *' lvalue Var 0x130078900 'person' 'Person *'|     | `-OpaqueValueExpr 0x130078ae0 <col:23, col:24> 'NSString *'|     |   `-ObjCStringLiteral 0x130078a78 <col:23, col:24> 'NSString *'|     |     `-StringLiteral 0x130078a58 <col:24> 'char[4]' lvalue "111"
  • 静态分析:分析类型声明和匹配问题。比如整型和字符串相加,肯定会报错。
    中间语言生成:CodeGen根据AST自顶向下遍历逐步翻译成 LLVM IR,并且在编译期就可以确定的表达式进行优化,比如代码里t1=2+6,可以优化t1=8。(假如开启了bitcode,)

使用命令clang -O3 -S -emit-llvm main.m -o main.ll

@__CFConstantStringClassReference = external global [0 x i32]
@.str = private unnamed_addr constant [14 x i8] c"Hello, World!\00", section "__TEXT,__cstring,cstring_literals", align 1
@_unnamed_cfstring_ = private global %struct.__NSConstantString_tag { i32* getelementptr inbounds ([0 x i32], [0 x i32]* @__CFConstantStringClassReference, i32 0, i32 0), i32 1992, i8* getelementptr inbounds ([14 x i8], [14 x i8]* @.str, i32 0, i32 0), i64 13 }, section "__DATA,__cfstring", align 8 #0
@"OBJC_CLASS_$_Person" = external global %struct._class_t
@"OBJC_CLASSLIST_REFERENCES_$_" = internal global %struct._class_t* @"OBJC_CLASS_$_Person", section "__DATA,__objc_classrefs,regular,no_dead_strip", align 8
@.str.1 = private unnamed_addr constant [4 x i8] c"111\00", section "__TEXT,__cstring,cstring_literals", align 1
@_unnamed_cfstring_.2 = private global %struct.__NSConstantString_tag { i32* getelementptr inbounds ([0 x i32], [0 x i32]* @__CFConstantStringClassReference, i32 0, i32 0), i32 1992, i8* getelementptr inbounds ([4 x i8], [4 x i8]* @.str.1, i32 0, i32 0), i64 3 }, section "__DATA,__cfstring", align 8 #0
@llvm.compiler.used = appending global [1 x i8*] [i8* bitcast (%struct._class_t** @"OBJC_CLASSLIST_REFERENCES_$_" to i8*)], section "llvm.metadata"
  • 目标代码生成与优化:根据中间语言生成依赖具体机器的汇编语言。并优化汇编语言。这个过程中,假如有变量且定义在同一个编译单元里,那给这个变量分配空间,确定变量的地址。假如变量或者函数不定义在这个编译单元,得链接时候,才能确定地址。

使用命令xcrun clang -S -o - main.m | open -f

.section	__TEXT,__text,regular,pure_instructions.build_version macos, 13, 0	sdk_version 13, 1.globl	_main                           ; -- Begin function main.p2align	2
_main:                                  ; @main.cfi_startproc
; %bb.0:sub	sp, sp, #64stp	x29, x30, [sp, #48]             ; 16-byte Folded Spilladd	x29, sp, #48.cfi_def_cfa w29, 16.cfi_offset w30, -8.cfi_offset w29, -16; implicit-def: $x8mov	w8, #0str	w8, [sp, #20]                   ; 4-byte Folded Spillstur	wzr, [x29, #-4]stur	w0, [x29, #-8]stur	x1, [x29, #-16]

汇编(Assembly)

汇编就是把上面得到的.s文件里的汇编指令一一翻译为机器语言。汇编器的汇编过程相较于编译器来讲比较简单,只是根据汇编指令和机器指令的对照表一一翻译就可以了。

汇编指令:

clang -c main.s -o main.o

链接(Linking)

链接指令:

clang main.o -o main

现在程序为了便于维护都是分模块组成,比如一个App,对应有多个源代码文件。每个源代码文件汇编成目标文件,根据上面流程A目标文件访问B目标文件的函数或者变量,是不知道地址的,链接就是要解决这个问题。链接过程主要包括地址和空间分配、符号决议和重定位。

链接就是把目标文件(一个或多个)和需要的库(静态库/动态库)链接成可执行文件。后面会分别讲静态链接和动态链接。

静态库和动态库

什么是库?

  • 库就是程序代码的集合,将N个文件组织起来,是共享程序代码的一种方式
  • 本质上是一种可执行代码的二进制文件,可以被载入程序中运行

静态库和动态库

  • 什么是静态库和动态库
    • 静态和动态是相对于编译期和运行期而言的,静态库会在程序编译时会被链接到目标代码中,程序运行时将不再需要该静态库。动态库在程序编译时不会被链接到目标代码中,只在程序运行时才被载入
      静态库在程序编译链接的时候,如下图所示
      在这里插入图片描述

动态库在程序编译链接的时候,如下图所示:

在这里插入图片描述

  • 静态库和动态库都是程序编译好的二进制文件,苹果官方的解释:

    • 动态库:可以在运行或启动的时候加载到内存中,加载到一块独立于App的内存地址
    • 静态库:当程序启动的时候时,会将App的代码(包括静态库的代码)一同加载到App所处的内存地址上。相比于静态库的方案,使用动态库会花费更多的启动时间和内存消耗,还会增加可执行文件的大小
  • 存在形式:

    • 静态库:以 “.a” 或者 “.framework” 为文件后缀名;.a 是一个纯二进制文件,.framework 中除了有二进制文件之外还有资源文件。.a 要有 .h 文件以及资源文件配合,.framework 文件可以直接使用。总的来说,.a + .h + sourceFile = .framework,因此创建静态库最好还是用 .framework 的形式。
    • 动态库:以 “.dylib” 或者 “.framework” 为文件后缀名(Xcode7 之后 .tbd 替代 .dylib)。
  • 使用区别

    • 静态库链接时会被完整的复制到可执行文件中,被多次使用就会被多份拷贝
    • 在这里插入图片描述

因为整个数据库的代码都被整合到目标代码中,则编译成的文件比较大。编译后的执行程序不再需要外部的数据库支持。如果静态数据库改变了,那么程序必须重新编译。

  • 动态库链接时不复制,程序运行时有系统动态加载到内存中,供程序调用,而且系统只加载一次,多个程序调用节省内存
    在这里插入图片描述

  • 动态库在编译时,并没有编译进目标代码,所以产生的可执行文件比较小。当程序运行时执行到相关函数才才动态申请并调用函数库的相应函数,所以程序的运行环境必须提供相应的库。且动态函数库的升级并不影响程序。

  • 各种优点:

静态库:

  • 模块化,分工合作,提高了代码的复用及核心技术的保密程度;
  • 避免少量改动经常导致大量的重复编译连接;
  • 也可以重用,注意不是共享使用。
    动态库:
  • 可以将最终可执行文件体积缩小,将整个应用程序分模块,团队合作,进行分工,影响比较小;
  • 多个应用程序共享内存中得同一份库文件,节省资源;
  • 可以不重新编译连接可执行程序的前提下,更新动态库文件达到更新应用程序的目的;

dyld动态链接器

动态库在程序中是怎么加载到内存呢?系统是怎么链接的?这就要用到dyld(the dymanic link editor)动态链接器

dyld(the dymanic link editor)动态链接器是苹果操作系统的一个重要组成部分,在系统内核XNU完成Mach- O文件的加载,做好程序准备工作后,加载或链接动态共享库或可执行文件确保程序能正确执行。

加载流程:

1,环境变量控制:根据环境的状态配置和环境变量下的相应的条件判断状态值及获取当前架构
2,共享缓存解析处理:检查是否开启了共享缓存及共享缓存是否映射到共享区域,例如UIKi t,CoreFoundation等
3,主程序初始化:调用instantiateFromLoadedImage函数实例化出一个ImageLoader对象
4,插入动态库:遍历环境变量DYLD_INSERT_LIBRARIES待插入动态库表容器组,调用loadInsertedDylib加载引入
5,链接主程序和动态库:进行符号和地址的绑定,加载所有类,最后执行load方法和clang attribute的constructor修饰函数

dyld2

dyld2是如何加载程序的?

  • Parse mach-0 header/Find dependencies:分析mach-o headers,通过分析得知需要加载哪些库,然后通过递归查找上述的库又需要那些其他库的支持,知道获得所有dylib完整的二进制文件。普通的iOS程序需要3-600个dylib,数据很庞大,需要大量的处理。
  • 第二Map mach-o files:映射所有的mach-o文件,将他们放入到地址空间内,即内存
  • 第三Perform symbol lookups:执行符号查找,假设程序内使用了printf函数,将会查找printf是否在系统库中,然后找到函数的地址,将它复制到你的程序汇中的函数指针
  • 第四Bind and rebase:进行符号的重绑定,复制这些指针,由于使用随机地址,所有指针必须使用基地址
  • 第五Run initializers:运行所有的初始化器
  • 第六:准备运行main函数
    在这里插入图片描述

dyld3

经过对dyld 2的优化,dyld 3的加载过程的不同之处

  • 将perform symbol lookups移到第二步,向磁盘写入闭包处理。
  • 将dyld分成了3部分,红色部分是一个进程外的mach-o分析器与编译器,也是一个进程内引擎,执行启动闭包处理,也是一个启用闭包的缓存服务,大多数的程序启动会使用缓存,但是始终不需要调用进程外mach-o分析器和编译器,启用闭包比mach-o更加的简单,它们是内存映射文件,不需要复杂的方法进行分析
  • 进程外编译器部分:首先解析所有的搜索路径,所有rpaths、所有环境变量、然后分析mach-o的二进制数据,执行所有的符号查找,利用这些结果来创建闭包处理
  • dyld3也是一个小型进程内引擎,这部分驻留在进程内,它所做的事情就是验证闭包是否正确,然后映射到dylib中,再跳转到main函数,与dyld2对比,dyld3不需要分析mach-o文件头或执行符号查找,不需要做这些事情就可以启动应用,因此极大的提升了程序的启动速度
  • 最后dyld3还会启动一个闭包缓存服务,这里指的是将系统程序闭包直接加入到共享缓存

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/47658.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

window11 部署llama.cpp并运行Qwen2-0.5B-Instruct-GGUF

吾名爱妃&#xff0c;性好静亦好动。好编程&#xff0c;常沉浸于代码之世界&#xff0c;思维纵横&#xff0c;力求逻辑之严密&#xff0c;算法之精妙。亦爱篮球&#xff0c;驰骋球场&#xff0c;尽享挥洒汗水之乐。且喜跑步&#xff0c;尤钟马拉松&#xff0c;长途奔袭&#xf…

FastAPI 学习之路(五十九)封装统一的json返回处理工具

在本篇文章之前的接口&#xff0c;我们每个接口异常返回的数据格式都不一样&#xff0c;处理起来也没有那么方便&#xff0c;因此我们可以封装一个统一的json。 from fastapi import status from fastapi.responses import JSONResponse, Response from typing import Unionde…

= null 和 is null;SQL中关于NULL处理的4个陷阱;三值逻辑

一、概述 1、NULL参与的所有的比较和算术运算符(>,,<,<>,<,>,,-,*,/) 结果为unknown&#xff1b; 2、unknown的逻辑运算(AND、OR、NOT&#xff09;遵循三值运算的真值表&#xff1b; 3、如果运算结果直接返回用户&#xff0c;使用NULL来标识unknown 4、如…

Go语言并发编程-Channel通信_2

Channel通信 Channel概述 不要通过共享内存的方式进行通信&#xff0c;而是应该通过通信的方式共享内存 这是Go语言最核心的设计模式之一。 在很多主流的编程语言中&#xff0c;多个线程传递数据的方式一般都是共享内存&#xff0c;而Go语言中多Goroutine通信的主要方案是Cha…

JavaEE:Lombok工具包的使用以及EditStarter插件的安装

Lombok是一个Java工具库&#xff0c;通过添加注解的方式&#xff0c;简化Java的开发。 目录 1、引入依赖 2、使用 3、原理解释 4、更多使用 5、更快捷的引入依赖 1、引入依赖 <dependency><groupId>org.projectlombok</groupId><artifactId>lomb…

pdf提取其中一页怎么操作?提取PDF其中一页的方法

pdf提取其中一页怎么操作&#xff1f;需要从一个PDF文件中提取特定页码的操作通常是在处理文档时常见的需求。这种操作允许用户选择性地获取所需的信息&#xff0c;而不必操作整个文档。通过选择性提取页面&#xff0c;你可以更高效地管理和利用PDF文件的内容&#xff0c;无论是…

Linux编辑器——vim的使用

目录 vim的基本概念 命令模式 底行模式 插入模式 注释和取消注释 普通用户进行sudo提权 vim配置问题 vim的基本概念 一般使用的vim有三种模式&#xff1a; 命令模式 底行模式和插入模式&#xff0c;可以进行转换&#xff1b; vim filename 打开vim&#xff0c;进入的…

ffmpeg ffplay.c 源码分析

1 ffplay.c的意义 ffplay.c是FFmpeg源码⾃带的播放器&#xff0c;调⽤FFmpeg和SDL API实现⼀个⾮常有⽤的播放器。 例如哔哩哔哩著名开源项⽬ijkplayer也是基于ffplay.c进⾏⼆次开发。 ffplay实现了播放器的主体功能&#xff0c;掌握其原理对于我们独⽴开发播放器⾮常有帮助…

npm install时报错 reason: certificate has expired

在VS code中导入新项目&#xff0c;执行npm install时报错&#xff1a; npm warn old lockfile Could not fetch metadata for antv/g3.4.10 FetchError: request to https://registry.npm.taobao.org/antv%2fg failed, reason: certificate has expirednpm warn old lockfile …

UI设计中的响应式布局策略:让您的界面在各种设备上都表现出色

UI界面设计它是人与机器之间交互的媒介&#xff0c;也是客户体验的媒介&#xff08;UX&#xff09;一个组成部分。操作界面由两个主要部分组成&#xff1a;视觉设计&#xff08;即传达产品的外观和感觉&#xff09;和交互设计&#xff08;即元素功能和逻辑组织&#xff09;。用…

kubernetes Dashboard搭建 (六)

DashBoard 之前在kubernetes中完成的所有操作都是通过命令行工具kubectl完成的。其实&#xff0c;为了提供更丰富的用户体验&#xff0c;kubernetes还开发了一个基于web的用户界面&#xff08;Dashboard&#xff09; 用户可以使用Dashboard部署容器化的应用&#xff0c;还可以监…

<数据集>木材缺陷检测数据集<目标检测>

数据集格式&#xff1a;VOCYOLO格式 图片数量&#xff1a;4000张 标注数量(xml文件个数)&#xff1a;4000 标注数量(txt文件个数)&#xff1a;4000 标注类别数&#xff1a;8 标注类别名称&#xff1a;[Quartzity,Live_Knot,Marrow,resin,Dead_Knot,knot_with_crack,Knot_m…

Prometheus 监控 Java 应用 JMX Exporter

操作场景 Prometheus 社区开发了 JMX Exporter 用于导出 JVM 的监控指标&#xff0c;以便使用 Prometheus 来采集监控数据。当您的 Java 业务容器化至 Kubernetes 后&#xff0c;可通过本文了解如何使用 Prometheus 与 JMX Exporter 来监控 Java 应用。 JMX Exporter 简介 Ja…

如何在 Puppeteer 中运行无头浏览器?

什么是无头浏览器&#xff1f; 我们都知道&#xff0c;用户界面&#xff08;UI&#xff09;是任何软件中最重要的部分。因此&#xff0c;“无头浏览器”的“无头”部分意味着它们确实缺少一个关键元素&#xff0c;即图形用户界面&#xff08;GUI&#xff09;。 这意味着浏览器…

webrtc QOS方法十三(视频渲染平滑)

一、背景介绍 视频渲染时间的确定需要考虑三方面的因素&#xff1a;网络抖动、网络延时、音视频同步 网络抖动&#xff1a;视频帧在网络上传输&#xff0c;会受到网络抖动的影响&#xff0c;不能收到立刻播放&#xff0c;需要进行适当的平滑 网络延时&#xff1a;一些报文在…

docker 安装并测试(Ubuntu下)

1. 确认安装环境&#xff08;操作系统版本和 CPU 架构&#xff09; 2. 如果有旧版本的 docker 需要进行卸载 使用 docker 命令检查是否已经安装了 docker 如果 docker 已经安装&#xff0c;使用以下命令卸载&#xff1a; apt-get purge docker-ce docker-ce-cli containerd…

力扣3202:找出有效子序列的最大长度||

class Solution { public:int maximumLength(vector<int>& nums, int k) {int res0;for(int m0;m<k;m){//假设子序列两数%k之后的结果为m 相当于枚举vector<int> v(k,0);for(auto num:nums){v[num%k]v[(m-num%kk)%k]1; //知道m之后可以知道需要的子序列当前…

maven内网依赖包编译报错问题的一种解决方法

背景 外网开发时可以连接互联网&#xff0c;所以编译没有什么问题&#xff0c;但是将数据库、代码、maven仓库全部拷贝到内网&#xff0c;搭建内网环境之后&#xff0c;编译失败。 此依赖包的依赖层级图 maven镜像库配置使用拷贝到内网的本地库&#xff0c;配置如下&#xff…

【Linux】Linux环境设置环境变量操作步骤

Linux环境设置环境变量操作步骤 在一些开发过程中本地调试经常需要依赖环境变量的参数&#xff0c;但是怎么设置对小白来说有点困难&#xff0c;今天就介绍下具体的操作步骤&#xff0c;跟着实战去学习&#xff0c;更好的检验自己的技术水平&#xff0c;做技术还是那句话&…

【iOS】——内存对齐

内存对齐是什么 内存对齐指的是数据在内存中的布局方式&#xff0c;它确保每个数据类型的起始地址能够满足该类型对齐的要求。这是因为现代处理器在访问内存时&#xff0c;如果数据的起始地址能够对齐到一定的边界&#xff0c;那么访问速度会更快。这种对齐通常是基于数据类型…