第二十一讲:编译和链接

第二十一讲:编译和链接

  • 1.翻译环境和运行环境
    • 1.1翻译环境
    • 1.2编译
      • 1.2.1预编译(预处理)
      • 1.2.2编译
        • 1.2.2.1词法分析
        • 1.2.2.2语法分析
        • 1.2.2.3语义分析
      • 1.2.3汇编
    • 1.3链接
    • 1.4运行环境
    • 1.5#define符号
      • 1.5.1#define的使用和原理
      • 1.5.2#define使用的陷阱注意
      • 1.5.3define中#的使用
        • 1.5.3.1一个#
        • 1.5.3.2两个##
      • 1.5.4undef

1.翻译环境和运行环境

在ANSI C(标准C)的任何一种实现中,都存在着两种不同的环境:
1.翻译环境:将一个"test.c"文件变成"test.exe"文件的过程,也就是将源代码变成可执行程序的过程
2.运行环境:就是执行可执行程序的过程,用于实际执行代码

画图来理解:
在这里插入图片描述

1.1翻译环境

翻译环境分为编译和链接两大部分,而编译又由预处理(预编译)、编译、汇编三部分组成,所以翻译环境通过画图来分析可以看成:

在这里插入图片描述
所以 程序编译和链接总的情况为:
在这里插入图片描述

注意:
1.每个.c文件都会单独经过编译器生成对应的目标文件
2.在Windows环境下,目标文件的后缀为.obj,Linux环境下目标文件的后缀为.o
3.多个目标文件和链接库一起经过链接器生成可执行程序
4.链接库是指运行时库或第三方库

详细的过程如下:
在这里插入图片描述

1.2编译

1.2.1预编译(预处理)

如果想在gcc环境下观察test.c处理之后的.i文件,命令如下:

gcc -E test.c -o test.i

预编译规则:
1.将所有的#define删除,并展开所有的宏定义,也就是说在.i文件中看不到#define了
2.处理所有的条件编译指令,如#if、#ifdef、#elif等,它允许程序员根据编译时的条件来决定是否编译代码的特定部分,以#开头,在正式编译之前
3.处理#include指令,将包含的头文件的内容插入到该预编译指令的位置,这个过程是递归进行的,因为这个头文件中也可以包含其他的头文件,也就是说,.i文件中有着include包含的头文件内容
4.删除所有的注释
5.添加⾏号和⽂件名标识,⽅便后续编译器⽣成调试信息等。
6.或保留所有的#pragma的编译器指令,编译器后续会使⽤。

经过预处理后的 .i ⽂件中不再包含宏定义,因为宏已经被展开。并且包含的头⽂件都被插⼊到 .i文件中。所以当我们⽆法知道宏定义或者头⽂件是否包含正确的时候,可以查看预处理后的 .i ⽂件来确认

1.2.2编译

编译就是将处理后的文件进行一系列的词法分析、语法分析、语义分析及优化,生成相应的汇编代码文件,它的编译命令为:

gcc -S test.i -o test.s

假设我们有一下的一串代码,我们逐步来进行分析:

array[index] = (index+4)*(2+6);
1.2.2.1词法分析

通过扫描器来实现,运用一种算法可以很轻松地将代码中的字符分割成一系列的记号(关键字、标识符、字面量、特殊字符等)比如上面的代码进行词法分析就会得到:
在这里插入图片描述

1.2.2.2语法分析

这时语法分析器会对扫描产生的记号进行语法分析,从而产生语法树,这些语法树是以表达式为节点的树,上述代码中,产生的语法树为:
在这里插入图片描述
这时如果出现了表达式不合法,比如括号不匹配的问题,编译器就会报告语法分析阶段的错误,在这里,各种表达式的优先级和含义将会被确定

1.2.2.3语义分析

由语义分析器来完成,即对编译器的语法层面进行分析,编译器能够做的是语义的静态分析,静态语义分析通常包括声明和类型的匹配,如果类型不同,会进行类型的转换等操作,具体如下:
在这里插入图片描述
这里所有的变量、赋值的结果都是整形,所以语义分析进行地很顺利

1.2.3汇编

汇编的命令:

gcc -c test.s -o test.o

汇编就是将汇编代码编程机器可执行的指令,每一个汇编语句几乎都对应着一条机器指令,就是根据汇编指令和对照表的一一对应,也不做指令优化

对于翻译环境,我们可以通过画图来进行更深刻的分析:
在这里插入图片描述

1.3链接

补充:在汇编完成之后,其实会生成一个符号表,符号表中包含了程序中所有的全局变量、函数等

总结:
链接是一个复杂的过程,需要将一堆文件链接在一起才生成可执行程序
链接过程主要包括:地址和空间分配、符号决议、重定位这些步骤
它解决的是一个项目中多文件、多模块之间互相调用的问题

比如:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

我们创建了两个源文件,那么链接要完成的就是两个源文件的沟通问题

通过补充,我们知道,编译后会生成一个符号表,那么如果我们将add.c中的函数名从Add改为add时,会发生:

在这里插入图片描述

注意:这里报的是链接错误,详细原因为:
使用Add函数时必须要知道Add函数的地址,在链接之前,我们会将Add函数的地址搁置,如果在链接的过程中通过符号表在其它模块中找到了Add函数,就会修正搁置的地址为Add函数的真正地址,这个地址修正的过程被称为:重定义

对于全局变量,也是会在符号表中出现,原理也是如此
然而,上面只是简单讲解了编译和链接的过程,对于很多的细节,可以看《程序员的自我修养》这本书来详细了解

1.4运行环境

  1. 程序必须载⼊内存中。在有操作系统的环境中:⼀般这个由操作系统完成。在独⽴的环境中,程序的载⼊必须由⼿⼯安排,也可能是通过可执⾏代码置⼊只读内存来完成。
  2. 程序开始,调用main函数
  3. 程序将使⽤⼀个运⾏时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使⽤静态(static)内存,存储于静态内存中的变量在程序的整个执⾏过程⼀直保留他们的值。
  4. 终止程序,可能是正常终止,也可能是意外终止

这里并不是需要了解的重点,所以我们简单了解就可以了

1.5#define符号

#define在使用时只是简单地进行替换,我们来了解一下:

1.5.1#define的使用和原理

//#define定义标识符
#define ROW 20
#define STR "hello world"
//#define定义宏
#define MAX(x,y) (x>y ? x:y)
int main()
{//#defime只是简单地替换int row = ROW;//所以这串代码会被替换为:int row = 20printf("row = %d\n", row);//结果为20char arr[20] = STR;//这串代码会被替换为:char arr[20] = "hello world"printf("arr = %s\n", arr);//结果为hello worldint a = 10;int b = 20;int c = MAX(a, b);//这里会被替换成:int c = MAX(a,b)(a>b ? a:b)printf("c = %d\n", c);//结果为20return 0;
}

1.5.2#define使用的陷阱注意

既然是简单的替换,就有可能出现陷阱,比如标识符的优先级等等

我们举例子来看:

#define A 10+10
#define B 20+20
int main()
{int c = A * B;//这里会被替换成c = 10+ 10*20 +20,我们可以很直观地看出算法的优先级问题printf("c = %d\n", c);//所以结果为230return 0;
}

为了解决这些问题,我们可以在define定于的位置加上括号,来保证优先级:

#define A (10+10)
#define B (20+20)
int main()
{int c = A * B;//这里会被替换成c = (10+10) * (20+20)printf("c = %d\n", c);//所以结果为800return 0;
}

1.5.3define中#的使用

需要关注的是,define在预处理期间就被处理了,而不是在运行时

1.5.3.1一个#

会将宏参数变成对应的字符串

#define STRINGIZE(x) #x
#define TOSTRING(x) STRINGIZE(x)int main() 
{const char* version = TOSTRING(1.2.3);//此时会将1.2.3转换成字符串printf("Version: %s\n", version);return 0;
}
1.5.3.2两个##

将两个宏参数合并成一个符号

#define MERGE(str1, str2) str1##str2int main() 
{int class_room = 123;printf("%d\n", MERGE(class_, room));// 预处理后变成:printf("%d\n", class_room);//所以输出的结果为:123,因为class_room就是123return 0;
}

1.5.4undef

这是一个预处理指令,用于移除一个宏定义,使用方法为:

//#define定义标识符
#define ROW 20
int main()
{#undef ROWprintf("ROW = %d\n", ROW);return 0;
}

结果如下:
在这里插入图片描述
这是就取消了一个宏定义

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/24836.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python学习从0开始——Kaggle机器学习004总结2

Python学习从0开始——Kaggle机器学习004总结2 一、缺失值二、分类变量2.1介绍2.2实现1.获取训练数据中所有分类变量的列表。2.比较每种方法方法1(删除分类变量)方法2(序数编码)方法3独热编码 三、管道3.1介绍3.2实现步骤1:定义预处理步骤步骤2:定义模型步骤3:创建和评估管道 四…

【JAVA】javadoc,如何生成标准的JAVA API文档

目录 1.什么是JAVA DOC 2.标签 3.命令 1.什么是JAVA DOC 当我们写完JAVA代码,别人要调用我们的代码的时候要是没有API文档是很痛苦的,只能跟进源码去一个个的看,一个个方法的猜,并且JAVA本来就不是一个重复造轮子的游戏&#…

探索LLM 在金融领域有哪些潜在应用——通过使用 GPT-4 测试金融工程、市场预测和风险管理等 11 项任务

概述 近年来,用于自然语言理解和生成的人工智能技术在自然语言处理领域取得了突破性进展,OpenAI 的 GPT 和其他大规模语言模型在该领域取得了显著进步。这些模型通过先进的计算能力和算法,展示了处理复杂任务的能力,如理解复杂语…

vue2组件封装实战系列之tag组件

作为本系列的第一篇文章,不会过于的繁杂,并且前期的组件都会是比较简单的基础组件!但是不要忽视这些基础组件,因为纵观elementui、elementplus还是其他的流行组件库,组件库的封装都是套娃式的,很多复杂组件…

关于python中的关键字参数

在python语言中存在两种传参方式: 第一种是按照先后顺序来传参,这种传参风格,称为“位置参数”这是各个编程语言中最普遍的方式。 关键字传参~按照形参的名字来进行传参! 如上图所示,在函数中使用关键字传参的最大作…

计算机网络 ——网络层(IPv4地址)

计算机网络 ——网络层(IPv4地址) 什么是IPv4地址IP地址的分类特殊的IP地址 查看自己的IPv4地址 我们今天来看IPv4地址: 什么是IPv4地址 IPv4(Internet Protocol version 4)是第四版互联网协议,是第一个被…

使用CodeGen进行程序综合推理

Program Synthesis with CodeGen — ROCm Blogs (amd.com) CodeGen是基于标准Transformer的自回归语言模型家族,用于程序合成,正如作者所定义的,它是一种利用输入-输出示例或自然语言描述生成解决指定问题的计算机程序的方法。 我们将测试的…

mqtt-emqx:paho.mqttv5的简单例子

# 安装emqx 请参考【https://blog.csdn.net/chenhz2284/article/details/139551293?spm1001.2014.3001.5502】 # 下面是示例代码 【pom.xml】 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</…

spark-3.5.1+Hadoop 3.4.0+Hive4.0 分布式集群 安装配置

Hadoop安装参考: Hadoop 3.4.0HBase2.5.8ZooKeeper3.8.4Hive4.0Sqoop 分布式高可用集群部署安装 大数据系列二-CSDN博客 一 下载:Downloads | Apache Spark 1 下载Maven – Welcome to Apache Maven # maven安装及配置教程 wget https://dlcdn.apache.org/maven/maven-3/3.8…

mqtt-emqx:简单安装emqx

安装依赖 yum install -y epel-release libatomic下载 cd /chz/install/emqx wget https://www.emqx.com/en/downloads/broker/5.7.0/emqx-5.7.0-el7-amd64.tar.gz解压 mkdir -p emqx && tar -zxvf emqx-5.7.0-el7-amd64.tar.gz -C emqx后台运行 cd /chz/install/e…

分布式事务Seata中XA和AT模式介绍

Seata中XA和AT模式介绍 分布式事务介绍分布式解决方案解决分布式事务的思路Seata的架构Seata中的XA模式Seata的XA模型流程XA模式优缺点实现XA模式 Seata中的AT模式Seata中的AT模式流程实现AT模式AT模式优缺点 AT模式与XA模式的区别 分布式事务介绍 分布式事务&#xff0c;就是…

代码随想录算法训练营第36期DAY50

DAY50 如果写累了就去写套磁信吧。 198打家劫舍 class Solution {public: int rob(vector<int>& nums) { vector<int> dp(nums.size()); dp[0]nums[0]; if(nums.size()1) return nums[0]; dp[1]max(nums[0],nums[1]); …

【中颖】SH79F9202 串口通信

头文件 uart.h #ifndef UART_H #define UART_H#include "SH79F9202.h" #include "LCD.h" #include "timer2.h" #include "timer5.h" #include "cpu.h" #include "key.h" #include "io.h" #include &qu…

Meta Llama 3 RMSNorm(Root Mean Square Layer Normalization)

Meta Llama 3 RMSNorm&#xff08;Root Mean Square Layer Normalization&#xff09; flyfish 目录 Meta Llama 3 RMSNorm&#xff08;Root Mean Square Layer Normalization&#xff09;先看LayerNorm和BatchNorm举个例子计算 LayerNormRMSNorm 的整个计算过程实际代码实现结…

Linux内核epoll

Linux网络IO模型 同步和异步&#xff0c;阻塞和非阻塞 Linux下的五种IO模型 同步和异步&#xff0c;阻塞和非阻塞 Linux 下的五种I/O模型&#xff1a; 阻塞IO&#xff08;Blocking IO&#xff09; BIO 非阻塞IO&#xff08;No Blocking IO&#xff09; IO复用&#xff08;se…

手把手教你实现条纹结构光三维重建(1)——多频条纹生成

关于条纹结构光三维重建的多频相移、格雷码、格雷码相移、互补格雷码等等编码方法&#xff0c;我们在大多数平台上&#xff0c;包括现在使用语言大模型提问&#xff0c;都可以搜到相关的理论&#xff0c;本人重点是想教会你怎么快速用代码实现。 首先说下硬件要求&#xff0c;…

从0到1:企业办公审批小程序开发笔记

可行性分析 企业办公审批小程序&#xff0c;适合各大公司&#xff0c;企业&#xff0c;机关部门办公审批流程&#xff0c;适用于请假审批&#xff0c;报销审批&#xff0c;外出审批&#xff0c;合同审批&#xff0c;采购审批&#xff0c;入职审批&#xff0c;其他审批等规划化…

云计算期末复习(3)

Amazon云计算 习题 私有IP、公有IP和弹性IP的区别在哪里? EC2的实例一旦被创建就会动态地分配公共IP地址和私有IP地址。私有IP地址由动态主机配置协议(DHCP)分配产生。 私有IP、公有IP和弹性IP的主要区别在于它们的使用场景、可达性和管理方式&#xff1a; 私有IP&#xff1a…

46-1 护网溯源 - 钓鱼邮件溯源

一、客户提供钓鱼邮件样本 二、行为分析 三、样本分析 对钓鱼邮件中的木马程序1111.exe文件进行了分析,提交了360安全大脑沙箱云和微步在线云沙箱。 360安全大脑沙箱云显示,该1111.exe文件存在危险,因此在解压时需要谨慎操作,以免触发木马程序。 建议使用360压缩软件进行…

面试(02)————Java集合篇

目录 一、为什么数组索引是从0开始&#xff1f;如果从1开始不行吗&#xff1f; 二、ArrayList底层的实现原理是什么&#xff1f; ​编辑三、ArrayList list new ArrayList(10)中的list扩容几次&#xff1f; 四、如何实现数组与List之间的转换&#xff1f; 五、ArrayList…