cmd/compile 包含構(gòu)成 Go 編譯器主要的包。編譯器在邏輯上可以被分為四個階段,我們將簡要介紹這幾個階段以及包含相應(yīng)代碼的包的列表。
在談到編譯器時,有時可能會聽到 前端(front-end)和 后端(back-end)這兩個術(shù)語。粗略地說,這些對應(yīng)于我們將在此列出的前兩個和后兩個階段。第三個術(shù)語 中間端(middle-end)通常指的是第二階段執(zhí)行的大部分工作。
請注意,go/parser 和 go/types 等 go/* 系列的包與編譯器無關(guān)。由于編譯器最初是用 C 編寫的,所以這些 go/* 包被開發(fā)出來以便于能夠?qū)懗龊?Go 代碼一起工作的工具,例如 gofmt 和 vet。
需要澄清的是,名稱 “gc” 代表 “ Go 編譯器(Go compiler)”,與大寫 GC 無關(guān),后者代表 垃圾收集(garbage collection)。
創(chuàng)新互聯(lián)建站2013年開創(chuàng)至今,先為晉城等服務(wù)建站,晉城等地企業(yè),進行企業(yè)商務(wù)咨詢服務(wù)。為晉城企業(yè)網(wǎng)站制作PC+手機+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。
1、解析
在編譯的第一階段,源代碼被標記化(詞法分析)、解析(語法分析),并為每個源文件構(gòu)造語法樹(譯注:這里標記指 token,它是一組預(yù)定義的、能夠識別的字符串,通常由名字和值構(gòu)成,其中名字一般是詞法的類別,如標識符、關(guān)鍵字、分隔符、操作符、文字和注釋等;語法樹,以及下文提到的 抽象語法樹(Abstract Syntax Tree)(AST),是指用樹來表達程序設(shè)計語言的語法結(jié)構(gòu),通常葉子節(jié)點是操作數(shù),其它節(jié)點是操作碼)。
每個語法樹都是相應(yīng)源文件的確切表示,其中節(jié)點對應(yīng)于源文件的各種元素,例如表達式、聲明和語句。語法樹還包括位置信息,用于錯誤報告和創(chuàng)建調(diào)試信息。
2、類型檢查和 AST 變換
gc 包中包含一個繼承自(早期)C 語言實現(xiàn)的版本的 AST 定義。所有代碼都是基于它編寫的,所以 gc 包必須做的第一件事就是將 syntax 包(定義)的語法樹轉(zhuǎn)換為編譯器的 AST 表示法。這個額外步驟可能會在將來重構(gòu)。
然后對 AST 進行類型檢查。第一步是名字解析和類型推斷,它們確定哪個對象屬于哪個標識符,以及每個表達式具有的類型。類型檢查包括特定的額外檢查,例如“聲明但未使用”以及確定函數(shù)是否會終止。
特定變換也基于 AST 完成。一些節(jié)點被基于類型信息而細化,例如把字符串加法從算術(shù)加法的節(jié)點類型中拆分出來。其它一些例子是 死代碼消除(dead code elimination), 函數(shù)調(diào)用內(nèi)聯(lián)(function call inlining)和 逃逸分析(escape analysis)(譯注:逃逸分析是一種分析指針有效范圍的方法)。
3、通用 SSA
(譯注:許多常見高級語言的編譯器無法通過一次掃描源代碼或 AST 就完成所有編譯工作,取而代之的做法是多次掃描,每次完成一部分工作,并將輸出結(jié)果作為下次掃描的輸入,直到最終產(chǎn)生目標代碼。這里每次掃描稱作一個 環(huán)節(jié)(pass);最后一個環(huán)節(jié)之前所有的環(huán)節(jié)得到的結(jié)果都可稱作中間表示法,本文中 AST、SSA 等都屬于中間表示法。SSA,靜態(tài)單賦值形式,是中間表示法的一種性質(zhì),它要求每個變量只被賦值一次且在使用前被定義)。
在此階段,AST 將被轉(zhuǎn)換為 靜態(tài)單賦值(Static Single Assignment)(SSA)形式,這是一種具有特定屬性的低級 中間表示法(intermediate representation),可以更輕松地實現(xiàn)優(yōu)化并最終從它生成機器碼。
在這個轉(zhuǎn)換過程中,將完成 內(nèi)置函數(shù)(function intrinsics)的處理。這些是特殊的函數(shù),編譯器被告知逐個分析這些函數(shù)并決定是否用深度優(yōu)化的代碼替換它們(譯注:內(nèi)置函數(shù)指由語言本身定義的函數(shù),通常編譯器的處理方式是使用相應(yīng)實現(xiàn)函數(shù)的指令序列代替對函數(shù)的調(diào)用指令,有點類似內(nèi)聯(lián)函數(shù))。
在 AST 轉(zhuǎn)化成 SSA 的過程中,特定節(jié)點也被低級化為更簡單的組件,以便于剩余的編譯階段可以基于它們工作。例如,內(nèi)建的拷貝被替換為內(nèi)存移動,range 循環(huán)被改寫為 for 循環(huán)。由于歷史原因,目前這里面有些在轉(zhuǎn)化到 SSA 之前發(fā)生,但長期計劃則是把它們都移到這里(轉(zhuǎn)化 SSA)。
然后,一系列機器無關(guān)的規(guī)則和編譯環(huán)節(jié)會被執(zhí)行。這些并不考慮特定計算機體系結(jié)構(gòu),因此對所有 GOARCH 變量的值都會運行。
這類通用的編譯環(huán)節(jié)的一些例子包括,死代碼消除、移除不必要的空值檢查,以及移除無用的分支等。通用改寫規(guī)則主要考慮表達式,例如將一些表達式替換為常量,優(yōu)化乘法和浮點操作。
4、生成機器碼
編譯器中機器相關(guān)的階段開始于“低級”的編譯環(huán)節(jié),該階段將通用變量改寫為它們的特定的機器碼形式。例如,在 amd64 架構(gòu)中操作數(shù)可以在內(nèi)存中操作,這樣許多 加載-存儲(load-store)操作就可以被合并。
注意低級的編譯環(huán)節(jié)運行所有機器特定的重寫規(guī)則,因此當前它也應(yīng)用了大量優(yōu)化。
一旦 SSA 被“低級化”并且更具體地針對目標體系結(jié)構(gòu),就要運行最終代碼優(yōu)化的編譯環(huán)節(jié)了。這包含了另外一個死代碼消除的環(huán)節(jié),它將變量移動到更靠近它們使用的地方,移除從來沒有被讀過的局部變量,以及 寄存器(register)分配。
本步驟中完成的其它重要工作包括 堆棧布局(stack frame layout),它將堆棧偏移位置分配給局部變量,以及 指針活性分析(pointer liveness analysis),后者計算每個垃圾收集安全點上的哪些堆棧上的指針仍然是活動的。
在 SSA 生成階段結(jié)束時,Go 函數(shù)已被轉(zhuǎn)換為一系列 obj.Prog 指令。它們被傳遞給匯編程序(cmd/internal/obj),后者將它們轉(zhuǎn)換為機器碼并輸出最終的目標文件。目標文件還將包含反射數(shù)據(jù),導(dǎo)出數(shù)據(jù)和調(diào)試信息。
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習或者工作具有一定的參考學(xué)習價值,謝謝大家對創(chuàng)新互聯(lián)的支持。如果你想了解更多相關(guān)內(nèi)容請查看下面相關(guān)鏈接