一、GCC简介
GCC(GNU Compiler Collection,GNU编译器集合)是一套由GNU工程开发的支持多种编程语言的编译器。GCC是自由软件发展过程中的著名例子,由自由软件基金会 以GPL协议发布。当年Richard Stallman 刚开始写作 GCC 的时候,还只是把它当作仅仅一个 C 程序语言的编译器,GCC 的意思也只是 GNU C Compiler 而已。现如今GCC经过自由软件发展,已然成为GNU Compiler Collection,GNU编译器集合,除了支持C语言外,还支持多种其他语言,例如C++、Ada、Java、Objective-C、 FORTRAN、Pascal等。现在通常所说的GCC是GUN Compiler Collection的简称。
GCC是大多数类Unix操作系统(如Linux、BSD、Mac OS X等)的标准的编译器,同时,在Linux平台下的嵌入式开发领域,GCC也是用得最普遍的一种编译器。GCC之所以被广泛采用,是因为它能支持各种不同 的目标体系结构。例如,它既支持基于宿主的开发(简单讲就是要为某平台编译程序,就在该平台上编译),也支持交叉编译(即在A平台上编译的程序是供平台B 使用的)。目前,GCC支持的体系结构有四十余种,常见的有X86系列、Arm、PowerPC等。同时,GCC还能运行在不同的操作系统上,如 Linux、Solaris、Windows等。
二、程序的编译过程
对于GUN编译器来说,程序的编译要经历预处理、编译、汇编、链接四个阶段,如下图所示:
从功能上分,预处理、编译、汇编是三个不同的阶段,但GCC的实际操作上,它可以把这三个步骤合并为一个步骤来执行。下面我们以C语言为例来谈一下不同阶段的输入和输出情况。
在预处理阶段,输入的是C语言的源文件,通常为*.c。它们通常带有.h之类头文件的包含文件。这个阶段主要处理完成源文件中的诸如#ifdef、 #include和#define的编译与处理指令。该阶段会生成一个中间文件*.i,但实际工作中通常不用专门生成这种文件,因为基本上用不到;若非要 生成这种文件不可,可以利用下面的示例命令:
gcc -E test.c -o test.i |
在编译阶段,输入的是中间文件*.i,编译后生成汇编语言文件*.s 。这个阶段对应的GCC命令如下所示:
GCC -S test.i -o test.s |
在汇编阶段,将输入的汇编文件*.s转换成机器语言*.o。这个阶段对应的GCC命令如下所示:
GCC -c test.s -o test.o |
最后,在链接阶段将输入的机器代码文件*.s(与其它的机器代码文件和库文件)汇集成一个可执行的机器代码文件。这一步骤,可以利用下面的示例命令完成:
GCC test.o -o test |
上面介绍了GCC编译过程的四个阶段以及相应的命令。
总结:gcc命令。gcc命令加选项-o可以指定其输出文件名称;加选项-c则不进入链接环节,输出机器码目标程序;加选项-S则不进入汇编环节,输出汇编码的目标程序;加选项-E则不进入编译环节,输出完成预处理指令处理后的结果。
三、编译器GCC的基本功能及其使用介绍
下面以一个例子来说明。为简单起见,假设我们全部的源代码都在一个文件test.c中,要想把这个源文件直接编译成可执行程序,可以使用以下命令:
$ GCC -o test |
这里test.c是源文件,生成的可执行代码存放在一个名为test 的文件中(该文件是机器代码并且可执行)。-o 是生成可执行文件的输出选项。
如果我们只想让源文件生成机器码目标文件(该文件虽然也是机器代码但因未经链接成可执行文件,所以该文件并不可执行),可以使用gcc命令选项-c ,详细命令如下所示:
$ GCC -c test.c |
默认情况下,生成的目标文件被命名为test.o,但我们也可以为输出文件指定名称,如下所示:
$ GCC -c test.c -o mytest.o |
上面这条命令将编译后的机器码目标文件命名为mytest.o,而不是默认的test.o。
到此为止,我们谈论的程序仅涉及到一个源文件;现实中,一个程序的源代码通常包含在多个源文件之中,这该怎么办?没关系,即使这样,用GCC处理起来也并不复杂,见下例:
$ GCC -o test first.c second.c third.c |
该命令将同时编译三个源文件,即first.c、second.c和 third.c,然后将它们连接成一个可执行程序,名为test。
许多情况下,我们的头文件和源文件会单独存放在不同的目录中。另一方面,在开发软件时,除了标准库文件外,我们完全不使用第三方函数库的情况是比较少见 的,通常来讲都需要借助许多函数库的支持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(so、或lib、 dll)的集合。虽然Linux下的大多数函数都默认将头文件放到/usr/include/目录下,而库文件则放到/usr/lib/目录 下;Windows所使用的库文件主要放在Visual Stido的目录下的include和lib,以及系统文件夹下。但也有的时候,我们要用的库或许就是不在这些目录下,所以GCC在编译时必须用自己的办 法来查找所需要的头文件和库文件,GCC命令的-I选项(特别注意:这是字母i的大写)可以添加头文件搜索目录,-L加-l选项(注意:这是字母L的大小 写,而不是字符i)可以添加库文件搜索目录。
例如,假设存放源文件的子目录名为./src,而包含文件则放在层次的其他目录下,如./inc。当我们在./src 目录下进行编译工作时,如何告诉GCC到哪里找头文件呢?方法如下所示:
$ gcc test.c –I../inc -o test |
上面的命令告诉GCC包含文件存放在../inc 目录下。如果在编译时需要的包含文件存放在多个目录下,可以使用多个-I 来指定各个目录:
$ gcc test.c –I../inc –I../../inc2 -o test |
这里指出了另一个包含子目录inc2,较之前目录它还要在再上两级才能找到。
四、警告功能
当GCC在编译过程中检查出错误的话,它就会中止编译;但检测到警告时却能继续编译生成可执行程序,因为警告只是针对程序结构的诊断信息,它不能说 明程序一定有错误,而是存在风险,或者可能存在错误。虽然GCC提供了非常丰富的警告,但前提是你已经启用了它们,否则它不会报告这些检测到的警告。
在众多的警告选项之中,最常用的就是-Wall选项。该选项能发现程序中一系列的常见错误警告,该选项用法举例如下:
$ gcc -Wall test.c -o test |
该选项相当于同时使用了下列所有的选项:
◆unused-function:遇到仅声明过但尚未定义的静态函数时发出警告。
◆unused-label:遇到声明过但不使用的标号的警告。
◆unused-parameter:从未用过的函数参数的警告。
◆unused-variable:在本地声明但从未用过的变量的警告。
◆unused-value:仅计算但从未用过的值得警告。
◆Format:检查对printf和scanf等函数的调用,确认各个参数类型和格式串中的一致。
◆implicit-int:警告没有规定类型的声明。
◆implicit-function-:在函数在未经声明就使用时给予警告。
◆char-subscripts:警告把char类型作为数组下标。这是常见错误,程序员经常忘记在某些机器上char有符号。
◆missing-braces:聚合初始化两边缺少大括号。
◆Parentheses:在某些情况下如果忽略了括号,编译器就发出警告。
◆return-type:如果函数定义了返回类型,而默认类型是int型,编译器就发出警告。同时警告那些不带返回值的 return语句,如果他们所属的函数并非void类型。
◆sequence-point:出现可疑的代码元素时,发出报警。
◆Switch:如果某条switch语句的参数属于枚举类型,但是没有对应的case语句使用枚举元素,编译器就发出警告(在switch语句中使用default分支能够防止这个警告)。超出枚举范围的case语句同样会导致这个警告。
◆strict-aliasing:对变量别名进行最严格的检查。
◆unknown-pragmas:使用了不允许的#pragma。
◆Uninitialized:在初始化之前就使用自动变量。
需要注意的是,各警告选项既然能使之生效,当然也能使之关闭。比如假设我们想要使用-Wall来启用个选项,同时又要关闭unused警告,利益通过下面的命令来达到目的:
$ gcc -Wall -Wno-unused test.c -o test |
下面是使用-Wall选项的时候没有生效的一些警告项:
◆cast-align:一旦某个指针类型强制转换时,会导致目标所需的地址对齐边界扩展,编译器就发出警告。例如,某些机器上只能在2或4字节边界上访问整数,如果在这种机型上把char *强制转换成int *类型, 编译器就发出警告。
◆sign-compare:将有符号类型和无符号类型数据进行比较时发出警告。
◆missing-prototypes :如果没有预先声明函数原形就定义了全局函数,编译器就发出警告。即使函数定义自身提供了函数原形也会产生这个警告。这样做的目的是检查没有在头文件中声明的全局函数。
◆Packed:当结构体带有packed属性但实际并没有出现紧缩式给出警告。
◆Padded:如果结构体通过充填进行对齐则给出警告。
◆unreachable-code:如果发现从未执行的代码时给出警告。
◆Inline:如果某函数不能内嵌(inline),无论是声明为inline或者是指定了-finline-functions 选项,编译器都将发出警告。
◆disabled-optimization:当需要太长时间或过多资源而导致不能完成某项优化时给出警告。
上面是使用-Wall选项时没有生效,但又比较常用的一些警告选项。本文中要介绍的最后一个常用警告选项是-Werror。使用该选项后,GCC发现可疑之处时不会简单的发出警告就算完事,而是将警告作为一个错误而中断编译过程。该选项在希望得到高质量代码时非常有用。
以上整理参考了51CTO网站上有关GCC使用入门的文章,原文参见http://developer.51cto.com/art/200609/32317.htm