cmd/compile 包含構(gòu)成 Go 編譯器主要的包。編譯器在邏輯上可以被分為四個(gè)階段,我們將簡(jiǎn)要介紹這幾個(gè)階段以及包含相應(yīng)代碼的包的列表。
在談到編譯器時(shí),有時(shí)可能會(huì)聽到 前端(front-end)和 后端(back-end)這兩個(gè)術(shù)語。粗略地說,這些對(duì)應(yīng)于我們將在此列出的前兩個(gè)和后兩個(gè)階段。第三個(gè)術(shù)語 中間端(middle-end)通常指的是第二階段執(zhí)行的大部分工作。
請(qǐng)注意,go/parser 和 go/types 等 go/* 系列的包與編譯器無關(guān)。由于編譯器最初是用 C 編寫的,所以這些 go/* 包被開發(fā)出來以便于能夠?qū)懗龊?Go 代碼一起工作的工具,例如 gofmt 和 vet。
需要澄清的是,名稱 “gc” 代表 “ Go 編譯器(Go compiler)”,與大寫 GC 無關(guān),后者代表 垃圾收集(garbage collection)。
1、解析
在編譯的第一階段,源代碼被標(biāo)記化(詞法分析)、解析(語法分析),并為每個(gè)源文件構(gòu)造語法樹(譯注:這里標(biāo)記指 token,它是一組預(yù)定義的、能夠識(shí)別的字符串,通常由名字和值構(gòu)成,其中名字一般是詞法的類別,如標(biāo)識(shí)符、關(guān)鍵字、分隔符、操作符、文字和注釋等;語法樹,以及下文提到的 抽象語法樹(Abstract Syntax Tree)(AST),是指用樹來表達(dá)程序設(shè)計(jì)語言的語法結(jié)構(gòu),通常葉子節(jié)點(diǎn)是操作數(shù),其它節(jié)點(diǎn)是操作碼)。
每個(gè)語法樹都是相應(yīng)源文件的確切表示,其中節(jié)點(diǎn)對(duì)應(yīng)于源文件的各種元素,例如表達(dá)式、聲明和語句。語法樹還包括位置信息,用于錯(cuò)誤報(bào)告和創(chuàng)建調(diào)試信息。
2、類型檢查和 AST 變換
gc 包中包含一個(gè)繼承自(早期)C 語言實(shí)現(xiàn)的版本的 AST 定義。所有代碼都是基于它編寫的,所以 gc 包必須做的第一件事就是將 syntax 包(定義)的語法樹轉(zhuǎn)換為編譯器的 AST 表示法。這個(gè)額外步驟可能會(huì)在將來重構(gòu)。
然后對(duì) AST 進(jìn)行類型檢查。第一步是名字解析和類型推斷,它們確定哪個(gè)對(duì)象屬于哪個(gè)標(biāo)識(shí)符,以及每個(gè)表達(dá)式具有的類型。類型檢查包括特定的額外檢查,例如“聲明但未使用”以及確定函數(shù)是否會(huì)終止。
特定變換也基于 AST 完成。一些節(jié)點(diǎn)被基于類型信息而細(xì)化,例如把字符串加法從算術(shù)加法的節(jié)點(diǎn)類型中拆分出來。其它一些例子是 死代碼消除(dead code elimination), 函數(shù)調(diào)用內(nèi)聯(lián)(function call inlining)和 逃逸分析(escape analysis)(譯注:逃逸分析是一種分析指針有效范圍的方法)。
3、通用 SSA
(譯注:許多常見高級(jí)語言的編譯器無法通過一次掃描源代碼或 AST 就完成所有編譯工作,取而代之的做法是多次掃描,每次完成一部分工作,并將輸出結(jié)果作為下次掃描的輸入,直到最終產(chǎn)生目標(biāo)代碼。這里每次掃描稱作一個(gè) 環(huán)節(jié)(pass);最后一個(gè)環(huán)節(jié)之前所有的環(huán)節(jié)得到的結(jié)果都可稱作中間表示法,本文中 AST、SSA 等都屬于中間表示法。SSA,靜態(tài)單賦值形式,是中間表示法的一種性質(zhì),它要求每個(gè)變量只被賦值一次且在使用前被定義)。
在此階段,AST 將被轉(zhuǎn)換為 靜態(tài)單賦值(Static Single Assignment)(SSA)形式,這是一種具有特定屬性的低級(jí) 中間表示法(intermediate representation),可以更輕松地實(shí)現(xiàn)優(yōu)化并最終從它生成機(jī)器碼。
在這個(gè)轉(zhuǎn)換過程中,將完成 內(nèi)置函數(shù)(function intrinsics)的處理。這些是特殊的函數(shù),編譯器被告知逐個(gè)分析這些函數(shù)并決定是否用深度優(yōu)化的代碼替換它們(譯注:內(nèi)置函數(shù)指由語言本身定義的函數(shù),通常編譯器的處理方式是使用相應(yīng)實(shí)現(xiàn)函數(shù)的指令序列代替對(duì)函數(shù)的調(diào)用指令,有點(diǎn)類似內(nèi)聯(lián)函數(shù))。
在 AST 轉(zhuǎn)化成 SSA 的過程中,特定節(jié)點(diǎn)也被低級(jí)化為更簡(jiǎn)單的組件,以便于剩余的編譯階段可以基于它們工作。例如,內(nèi)建的拷貝被替換為內(nèi)存移動(dòng),range 循環(huán)被改寫為 for 循環(huán)。由于歷史原因,目前這里面有些在轉(zhuǎn)化到 SSA 之前發(fā)生,但長(zhǎng)期計(jì)劃則是把它們都移到這里(轉(zhuǎn)化 SSA)。
然后,一系列機(jī)器無關(guān)的規(guī)則和編譯環(huán)節(jié)會(huì)被執(zhí)行。這些并不考慮特定計(jì)算機(jī)體系結(jié)構(gòu),因此對(duì)所有 GOARCH 變量的值都會(huì)運(yùn)行。
這類通用的編譯環(huán)節(jié)的一些例子包括,死代碼消除、移除不必要的空值檢查,以及移除無用的分支等。通用改寫規(guī)則主要考慮表達(dá)式,例如將一些表達(dá)式替換為常量,優(yōu)化乘法和浮點(diǎn)操作。
4、生成機(jī)器碼
編譯器中機(jī)器相關(guān)的階段開始于“低級(jí)”的編譯環(huán)節(jié),該階段將通用變量改寫為它們的特定的機(jī)器碼形式。例如,在 amd64 架構(gòu)中操作數(shù)可以在內(nèi)存中操作,這樣許多 加載-存儲(chǔ)(load-store)操作就可以被合并。
注意低級(jí)的編譯環(huán)節(jié)運(yùn)行所有機(jī)器特定的重寫規(guī)則,因此當(dāng)前它也應(yīng)用了大量?jī)?yōu)化。
一旦 SSA 被“低級(jí)化”并且更具體地針對(duì)目標(biāo)體系結(jié)構(gòu),就要運(yùn)行最終代碼優(yōu)化的編譯環(huán)節(jié)了。這包含了另外一個(gè)死代碼消除的環(huán)節(jié),它將變量移動(dòng)到更靠近它們使用的地方,移除從來沒有被讀過的局部變量,以及 寄存器(register)分配。
本步驟中完成的其它重要工作包括 堆棧布局(stack frame layout),它將堆棧偏移位置分配給局部變量,以及 指針活性分析(pointer liveness analysis),后者計(jì)算每個(gè)垃圾收集安全點(diǎn)上的哪些堆棧上的指針仍然是活動(dòng)的。
在 SSA 生成階段結(jié)束時(shí),Go 函數(shù)已被轉(zhuǎn)換為一系列 obj.Prog 指令。它們被傳遞給匯編程序(cmd/internal/obj),后者將它們轉(zhuǎn)換為機(jī)器碼并輸出最終的目標(biāo)文件。目標(biāo)文件還將包含反射數(shù)據(jù),導(dǎo)出數(shù)據(jù)和調(diào)試信息。
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計(jì)公司的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。