了解c編譯器三劍客,gcc c編譯器編譯流程詳解
gcc是當(dāng)前三大主流c編譯器之一,對(duì)于這款c編譯器,想必諸多人士均有使用體驗(yàn)。在本文中,將對(duì)gcc c編譯器編譯流程加以介紹,以幫助大家更好了解這款c編譯器的工作流程。
一、GCC簡(jiǎn)介
GNU CC(簡(jiǎn)稱為gcc)是GNU項(xiàng)目中符合ANSI C標(biāo)準(zhǔn)的編譯系統(tǒng),能夠編譯用C、C++和Object C等語(yǔ)言編寫(xiě)的程序。gcc不僅功能強(qiáng)大,而且可以編譯如C、C++、Object C、Java、Fortran、Pascal、Modula-3和Ada等多種語(yǔ)言,而且gcc是一個(gè)交叉平臺(tái)編譯器,它能夠在當(dāng)前CPU平臺(tái)上為多種不同體系結(jié)構(gòu)的硬件平臺(tái)開(kāi)發(fā)軟件,因此尤其適合在嵌入式領(lǐng)域的開(kāi)發(fā)編譯。本章中的示例,除非特別注明,否則均采用4.x.x的gcc版本。
.cC原始程序.s/.S匯編語(yǔ)言原始程序
.C/.cc/.cxxC++原始程序.h預(yù)處理文件(頭文件)
.mObjecTIve-C原始程序.o目標(biāo)文件
.i已經(jīng)過(guò)預(yù)處理的C原始程序.a/.so編譯后的庫(kù)文件
.ii已經(jīng)過(guò)預(yù)處理的C++原始程序……
二、gcc編譯流程解析
如本章開(kāi)頭提到的,gcc的編譯流程分為了4個(gè)步驟,分別為:
n 預(yù)處理(Pre-Processing);
n 編譯(Compiling);
n 匯編(Assembling);
n 鏈接(Linking)。
下面就具體來(lái)查看一下gcc是如何完成以上4個(gè)步驟的。
首先看一下hello.c的源代碼:
#include 《stdio.h》
int main()
{
printf(“Hello! This is our embedded world!\n”);
return 0;
}
(1)預(yù)處理階段。
在該階段,對(duì)包含的頭文件(#include)和宏定義(#define、#ifdef等)進(jìn)行處理。在上述代碼的預(yù)處理過(guò)程中,編譯器將包含的頭文件stdio.h編譯進(jìn)來(lái),并且用戶可以使用gcc的選項(xiàng)“-E”進(jìn)行查看,該選項(xiàng)的作用是讓gcc在預(yù)處理結(jié)束后停止編譯過(guò)程。
注意gcc指令的一般格式為:gcc [選項(xiàng)] 要編譯的文件 [選項(xiàng)] [目標(biāo)文件]
其中,目標(biāo)文件可缺省,gcc默認(rèn)生成可執(zhí)行的文件,名為:編譯文件.out
[root@localhost gcc]# gcc –E hello.c –o hello.i
在此處,選項(xiàng)“-o”是指目標(biāo)文件,由表3.6可知,“.i”文件為已經(jīng)過(guò)預(yù)處理的C程序。以下列出了hello.i文件的部分內(nèi)容:
typedef int (*__gconv_trans_fct) (struct __gconv_step *,
struct __gconv_step_data *, void *,
__const unsigned char *,
__const unsigned char **,
__const unsigned char *, unsigned char **,
size_t *);
…
# 2 “hello.c” 2
int main()
{
printf(“Hello! This is our embedded world!\n”);
return 0;
}
由此可見(jiàn),gcc確實(shí)進(jìn)行了預(yù)處理,它把“stdio.h”的內(nèi)容插入hello.i文件中。
(2)編譯階段。
接下來(lái)進(jìn)行的是編譯階段,在這個(gè)階段中,gcc首先要檢查代碼的規(guī)范性、是否有語(yǔ)法錯(cuò)誤等,以確定代碼實(shí)際要做的工作,在檢查無(wú)誤后,gcc把代碼翻譯成匯編語(yǔ)言。用戶可以使用“-S”選項(xiàng)來(lái)進(jìn)行查看,該選項(xiàng)只進(jìn)行編譯而不進(jìn)行匯編,結(jié)果生成匯編代碼。
[root@localhost gcc]# gcc –S hello.i –o hello.s
以下列出了hello.s的內(nèi)容,可見(jiàn)gcc已經(jīng)將其轉(zhuǎn)化為匯編代碼了,感興趣的小編可以分析一下這一個(gè)簡(jiǎn)單的C語(yǔ)言小程序是如何用匯編代碼實(shí)現(xiàn)的。
.file “hello.c”
.secTIon .rodata
.align 4
.LC0:
.string “Hello! This is our embedded world!”
.text
.globl main
.type main, @funcTIon
main:
pushl %ebp
movl %esp, %ebp
subl $8, %esp
andl $-16, %esp
movl $0, %eax
addl $15, %eax
addl $15, %eax
shrl $4, %eax
sall $4, %eax
subl %eax, %esp
subl $12, %esp
pushl $.LC0
call puts
addl $16, %esp
movl $0, %eax
leave
ret
.size main, 。-main
.ident “GCC: (GNU) 4.0.0 200XYZ19 (Red Hat 4.0.0-8)”
.secTIon .note.GNU-stack,“”,@progbits
(3)匯編階段。
匯編階段是把編譯階段生成的“.s”文件轉(zhuǎn)成目標(biāo)文件,小編在此使用選項(xiàng)“-c”就可看到匯編代碼已轉(zhuǎn)化為“.o”的二進(jìn)制目標(biāo)代碼了,如下所示:
[root@localhost gcc]# gcc –c hello.s –o hello.o
(4)鏈接階段。
在成功編譯之后,就進(jìn)入了鏈接階段。這里涉及一個(gè)重要的概念:函數(shù)庫(kù)。
小編可以重新查看這個(gè)小程序,在這個(gè)程序中并沒(méi)有定義“printf”的函數(shù)實(shí)現(xiàn),且在預(yù)編譯中包含進(jìn)的“stdio.h”中也只有該函數(shù)的聲明,而沒(méi)有定義函數(shù)的實(shí)現(xiàn),那么,是在哪里實(shí)現(xiàn)“printf”函數(shù)的呢?最后的答案是:系統(tǒng)把這些函數(shù)的實(shí)現(xiàn)都放到名為libc.so.6的庫(kù)文件中去了,在沒(méi)有特別指定時(shí),gcc會(huì)到系統(tǒng)默認(rèn)的搜索路徑“/usr/lib”下進(jìn)行查找,也就是鏈接到libc.so.6函數(shù)庫(kù)中去,這樣就能調(diào)用函數(shù)“printf”了,而這也正是鏈接的作用。
函數(shù)庫(kù)有靜態(tài)庫(kù)和動(dòng)態(tài)庫(kù)兩種。靜態(tài)庫(kù)是指編譯鏈接時(shí),將庫(kù)文件的代碼全部加入可執(zhí)行文件中,因此生成的文件比較大,但在運(yùn)行時(shí)也就不再需要庫(kù)文件了。其后綴名通常為“.a”。動(dòng)態(tài)庫(kù)與之相反,在編譯鏈接時(shí)并沒(méi)有將庫(kù)文件的代碼加入可執(zhí)行文件中,而是在程序執(zhí)行時(shí)加載庫(kù),這樣可以節(jié)省系統(tǒng)的開(kāi)銷。一般動(dòng)態(tài)庫(kù)的后綴名為“.so”,如前面所述的libc.so.6就是動(dòng)態(tài)庫(kù)。gcc在編譯時(shí)默認(rèn)使用動(dòng)態(tài)庫(kù)。
以上便是小編帶來(lái)的有關(guān)“c編譯器”的所有內(nèi)容,通過(guò)本文,希望大家對(duì)gcc的編譯原理有所了解。





