小編給大家分享一下Golang中運行與Plan9匯編的示例分析,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
成都創(chuàng)新互聯(lián)總部坐落于成都市區(qū),致力網(wǎng)站建設(shè)服務(wù)有成都網(wǎng)站設(shè)計、網(wǎng)站制作、外貿(mào)營銷網(wǎng)站建設(shè)、網(wǎng)絡(luò)營銷策劃、網(wǎng)頁設(shè)計、網(wǎng)站維護、公眾號搭建、重慶小程序開發(fā)、軟件開發(fā)等為企業(yè)提供一整套的信息化建設(shè)解決方案。創(chuàng)造真正意義上的網(wǎng)站建設(shè),為互聯(lián)網(wǎng)品牌在互動行銷領(lǐng)域創(chuàng)造價值而不懈努力!
Golang的運行環(huán)境
當(dāng)我們把編譯后的Go代碼運行起來,它會以進程的方式出現(xiàn)在系統(tǒng)中。然后開始處理請求、數(shù)據(jù),我們會看到這個進程占用了內(nèi)存消耗、cpu占比等等信息。本文就是要來解釋在程序的運行過程中,內(nèi)存、CPU、操作系統(tǒng)(當(dāng)然還有其它的硬件,文中關(guān)系不大,就不說了)是如何進行配合,完成了我們代碼所指定的事情。
內(nèi)存
首先,我們先來說說內(nèi)存。先來看一個我們運行的go進程。
代碼如下:
package main import ( "fmt" "log" "net/http" ) func main() { http.HandleFunc("/", sayHello) err := http.ListenAndServe(":9999", nil) if err != nil { log.Fatal("ListenAndServe: ", err) } } func sayHello(w http.ResponseWriter, r *http.Request) { fmt.Printf("fibonacci: %d\n", fibonacci(1000)) _, _ = fmt.Fprint(w, "Hello World!") } func fibonacci(num int) int { if num < 2 { return 1 } return fibonacci(num-1) + fibonacci(num-2) }
來看一下執(zhí)行情況:
dayu.com >ps aux USER PID %CPU %MEM VSZ RSS TT STAT STARTED TIME COMMAND xxxxx 3584 99.2 0.1 4380456 4376 s003 R+ 8:33下午 0:05.81 ./myhttp
這里我們先來不關(guān)注其它指標(biāo),先來看 VSZ 與 RSS。
VSZ: 是指虛擬地址,他是程序?qū)嶋H操作的內(nèi)存。包含了分配還沒有使用的內(nèi)存。
RSS: 是實際的物理內(nèi)存,包含了棧內(nèi)存與堆內(nèi)存。
每一個進程都是運行在自己的內(nèi)存沙盒里,程序被分配的地址都是 “虛擬內(nèi)存”,物理內(nèi)存對程序開發(fā)者來說實際是不可見的,而且虛擬地址比進程實際的物理地址要大的多。我們經(jīng)常編程中取指針對應(yīng)的地址實際就是虛擬地址。這里一定要注意區(qū)分虛擬內(nèi)存與物理內(nèi)存。來一張圖感受一下。
這張圖主要是為了說明兩個問題:
鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術(shù)社區(qū)
程序使用的是虛擬內(nèi)存,但是操作系統(tǒng)會把虛擬內(nèi)存映射到物理內(nèi)存;你會發(fā)現(xiàn)自己機器上所有進程的VSZ要大得多;
物理內(nèi)存可以被多個進程共享,甚至一個進程內(nèi)的不同地址可能映射的都是同一個物理內(nèi)存地址。
上面搞明白了程序中的內(nèi)存具體是指什么,接下來說明程序是如何使用內(nèi)存的(虛擬內(nèi)存),內(nèi)存說白了就是比硬盤存取速度更快的一個硬件,為了方便內(nèi)存的管理,操作系統(tǒng)把分配給進程的內(nèi)存劃分成了不同的功能塊。像我們經(jīng)常說的:代碼區(qū),靜態(tài)數(shù)據(jù)區(qū),堆區(qū),棧區(qū)等。
這里借用一張網(wǎng)絡(luò)上的圖來看一下。
這里就是我們程序(進程)在虛擬內(nèi)存中的分布。
代碼區(qū):存放的就是我們編譯后的機器碼,一般來說這個區(qū)域只能是只讀。
靜態(tài)數(shù)據(jù)區(qū):存放的是全局變量與常量。這些變量的地址編譯的時候就確定了(這也是使用虛擬地址的好處,如果是物理地址,這些地址編譯的時候是不可能確定的)。Data與BSS都屬于這一部分。這部分只有程序中止(kill掉、crasg掉等)才會被銷毀。
棧區(qū):主要是 Golang 里邊的函數(shù)、方法以及其本地變量存儲的地方。這部分伴隨函數(shù)、方法開始執(zhí)行而分配,運行完后就被釋放,特別注意這里的釋放并不會清空內(nèi)存。后面文章講內(nèi)存分配的時候再詳細(xì)說;還有一個點需要記住棧一般是從高地址向低地址方向分配,換句話說:高地址屬于棧低,低地址屬于棧底,它分配方向與堆是相反的。
堆區(qū):像 C/C++ 語言,堆完全是程序員自己控制的。但是 Golang 里邊由于有GC機制,我們寫代碼的時候并不需要關(guān)心內(nèi)存是在棧還是堆上分配。Golang 會自己判斷如果變量的生命周期在函數(shù)退出后還不能銷毀或者棧上資源不夠分配等等情況,就會被放到堆上。堆的性能會比棧要差一些。原因也留到內(nèi)存分配相關(guān)的文章再給大家介紹。
內(nèi)存的結(jié)構(gòu)搞明白了,我們的程序被加載到內(nèi)存還需要操作系統(tǒng)來指揮才能正確運行。
補充一個比較重要的概念:
尋址空間:一般指的是CPU對于內(nèi)存尋址的能力,通俗地說,就是能最多用到多少內(nèi)存的一個問題。比如:32條地址線(32位機器),那么總的地址空間就有 2^32 個,如果是64位機器,就是 2^64 個尋址空間。可以使用 uname -a 來查看自己系統(tǒng)支持的位數(shù)字。
操作系統(tǒng)、CPU、內(nèi)存互相配合
為了講清楚程序運行與調(diào)用,我們得先理清楚操作系統(tǒng)、內(nèi)存、CPU、寄存器這幾者之間的關(guān)系。
CPU: 計算機的大腦,它才能理解并執(zhí)行指令;
寄存器:嚴(yán)格講寄存器是CPU的組成部分,它主要負(fù)責(zé)CPU在計算時臨時存儲數(shù)據(jù);當(dāng)然CPU還有多級的高速緩存,與我們這里相關(guān)度不大,就略過,大家知道其目的是為了彌補內(nèi)存與CPU速度的差距即可;
內(nèi)存:像上面內(nèi)存被劃分成不同區(qū),每一部分存了不同的數(shù)據(jù);當(dāng)然這些區(qū)的劃分、以及虛擬內(nèi)存與物理內(nèi)存的映射都是操作系統(tǒng)來做的;
操作系統(tǒng):控制各種硬件資源,為其它運行的程序提供操作接口(系統(tǒng)調(diào)用)及管理。
這里操作系統(tǒng)是一個軟件,CPU、寄存器、內(nèi)存(物理內(nèi)存)都是實打?qū)嵉挠布2僮飨到y(tǒng)雖然也是一堆代碼寫出來的。但是她是硬件對其它應(yīng)用程序的接口??偟膩碇v操作系統(tǒng)通過系統(tǒng)調(diào)用控制所有的硬件資源,他把其它的程序調(diào)度到CPU上讓其它程序執(zhí)行,但是為了讓每個程序都有機會使用CPU,CPU又通過時間中斷把控制權(quán)交給操作系統(tǒng)。
讓操作系統(tǒng)可以控制我們的程序,我們編寫的程序需要遵循操作系統(tǒng)的規(guī)定。這樣操作系統(tǒng)才能控制程序執(zhí)行、切換進程等操作。
最后我們的代碼被編譯成機器碼之后,本質(zhì)就是一條條的指令。我們期望的就是CPU去執(zhí)行完這些指令進而完成任務(wù)。而操作系統(tǒng)又能夠幫助我們讓CPU來執(zhí)行代碼以及提供所需資源的調(diào)用接口(系統(tǒng)調(diào)用)。是不是非常簡單?
Go程序的調(diào)用規(guī)約
在上面我們知道整個虛擬內(nèi)存被我們劃分為:代碼區(qū)、靜態(tài)數(shù)據(jù)區(qū)、棧區(qū)、堆區(qū)。接下來要講的Go程序的調(diào)用規(guī)約(其實就是函數(shù)、方法運行的規(guī)則),主要是涉及上面所說的棧部分(堆部分會在內(nèi)存分配的文章里邊去講)。以及計算機軟硬各個部分如何配合。接下來我們就來看一下程序的基本單位函數(shù)跟方法是怎么執(zhí)行與相互調(diào)用的。
函數(shù)在棧上的分布
這一部分,我們先來了解一些理論,然后接著用一個實際的例子來分析一下。先通過一張圖來看一下在 Golang 中函數(shù)是如何在棧上分布的。
幾個涉及到的專業(yè)用語:
棧:這里說的棧跟上面的解釋含義一致。無論是進程、線程、goroutine都有自己的調(diào)用棧;
棧幀:可以理解是函數(shù)調(diào)用時在棧上為函數(shù)所分配的區(qū)域;
調(diào)用者:caller,比如:a函數(shù)調(diào)用了b函數(shù),那么a就是調(diào)用者;
被調(diào)者:callee,還是上面的例子,b就是被調(diào)者。
棧幀
這幅圖所展示的就是一個 棧幀 的結(jié)構(gòu)。也可以說棧楨是棧給一個函數(shù)分配的棧空間,它包括了函數(shù)調(diào)用者地址、本地變量、返回值地址、調(diào)用者參數(shù)等信息。
這里有幾個注意點,圖中的 BP、SP都表示對應(yīng)的寄存器。
BP:基址指針寄存器(extended base pointer),也叫幀指針,存放著一個指針,表示函數(shù)棧開始的地方。
SP:棧指針寄存器(extended stack pointer),存放著一個指針,存儲的是函數(shù)??臻g的棧頂,也就是函數(shù)??臻g分配結(jié)束的地方,注意這里是硬件寄存器,不是Plan9中的偽寄存器。
BP 與 SP 放在一起,一個表示開始(棧頂)、一個表示結(jié)束(棧低)。
有了上面的基礎(chǔ)知識,接著下面用實際的例子來驗證一下。
Go的調(diào)用實例
才開始,我們就從一個簡單的函數(shù)開始來分析一下整個函數(shù)的調(diào)用過程(下面涉及到 Plan9 匯編,請別慌,大部分都能夠看懂,并且我也會寫注釋)。
package main func main() { a := 3 b := 2 returnTwo(a, b) } func returnTwo(a, b int) (c, d int) { tmp := 1 // 這一行的主要目的是保證棧楨不為0,方便分析 c = a + b d = b - tmp return }
上面有兩個函數(shù),main 定義了兩個本地變量,然后調(diào)用 returnTwo 函數(shù)。returnTwo 函數(shù)有兩個參數(shù)與兩個返回值。設(shè)計兩個返回值主要是一起來看一下 golang 的多返回值是如何實現(xiàn)的。接下來我們把上面的代碼對應(yīng)的匯編代碼展示出來。
有幾行代碼需要特別解釋下,
0x0000 00000 (test1.go:3) TEXT "".main(SB), ABIInternal, $56-0
這一行中的重點信息:$56-0。56 表示的該函數(shù)棧楨大?。▋蓚€本地變量,兩個參數(shù)是int類型,兩個返回值是int類型,1個保存base pointer,合計7 * 8 = 56);0表示 mian 函數(shù)的參數(shù)與返回值大小。待會可以在 returnTwo 中去看一下它的返回值又是多少。
接下來在看一下計算機是怎么在棧上分配大小的。
0x000f 00015 (test1.go:3) SUBQ $56, SP // 分配,56的大小在上面第一行定義了 ... ... 0x004b 00075 (test1.go:7) ADDQ $56, SP // 釋放掉,但是并未清空
這兩行,一個是分配,一個是釋放。為什么用了 SUBQ 指令就能進行分配呢?而 ADDQ 是釋放?記得我們前面說過嗎? SP 是一個指針寄存器,并且指向棧頂,棧又是從高地址向低地址分配。那么對它做一次減法,是不是表示從高地址向低地址方向移動指針了呢?釋放也是同樣的道理,一次加法操作又把 SP 恢復(fù)到初始狀態(tài)。
再來看一下對 BP 寄存器的操作。
0x0013 00019 (test1.go:3) MOVQ BP, 48(SP) // 保存BP 0x0018 00024 (test1.go:3) LEAQ 48(SP), BP // BP存放了新的地址 ... ... 0x0046 00070 (test1.go:7) MOVQ 48(SP), BP // 恢復(fù)BP的地址
這三行代碼是不是感覺很變扭?寫來寫去讓人云里霧里的。我先用文字描述一下,后面再用圖來解釋。
我們先做如下假設(shè):此時 BP 指向的 值 是:0x00ff,48(SP) 的 地址 是:0x0008。
第一條指令 MOVQ BP, 48(SP) 是把 0x00ff 寫入到 48(SP)的位置;
第二條指令 LEAQ 48(SP), BP 是更新寄存器指針,讓 BP 保存 48(SP) 這個位置的地址,也就是 0x00ff 這個值。
第三條指令 MOVQ 48(SP), BP ,因為一開始 48(SP) 保存了最開始 BP 的所存的值 0x00ff,所以這里是又把 BP 恢復(fù)回去了。
這幾行代碼的作用至關(guān)重要,正因為如此在執(zhí)行的時候,我們才能找到函數(shù)開始的地方以及回到調(diào)用函數(shù)的位置,它才可以繼續(xù)往下執(zhí)行(如果覺得饒,先放過,后面有圖,看完后再回來理解)。接著來看一下 returnTwo 函數(shù)。
這里 NOSPLIT|ABIInternal, $0-32 說明,該函數(shù)的棧楨大小是0,由于有兩個int參數(shù),以及2個int返回值,合計為 4*8 = 32 字節(jié)大小,是不是跟上面的 main 函數(shù)對上了?。
這里有沒有對 returnTwo 函數(shù)的棧楨大小是0表示迷惑呢?難道這個函數(shù)不需要??臻g嗎?其實主要原因是:golang的參數(shù)傳遞與返回值都是要求使用棧來進行的(這也是為什么go能夠支持多參數(shù)返回的原因)。所以參數(shù)與返回值所需空間都由 caller 來提供。
接下來,我們用完整的圖來演示一下這個調(diào)用過程。
這個圖就畫了將近1個小時,希望對大家理解有幫助。
整個的流程是:初始化 ----> call main function ----> call returnTwo function ----> returnTwo return ----> main return。
通過這張圖,在結(jié)合我上面的文字解釋,相信大家能夠理解了。不過這里還有幾個注意點:
BP 與 SP 是寄存器,它保存的是棧上的地址,所以執(zhí)行中可以對 SP 做運算找到下一個指令的位置;
棧被回收 ADDQ $56, SP ,只是改變了 SP 指向的位置,內(nèi)存中的數(shù)據(jù)并不會清空,只有下次被分配使用的時候才會清空;
callee的參數(shù)、返回值內(nèi)存都是caller分配的;
returnTwo ret的時候,call returnTwo的next指令 所在棧位置會被彈出,也就是圖中 0x0d00 地址所保存的指令,所以 returnTwo 函數(shù)返回后,SP 又指向了 0x0d08 地址。
由于上面涉及到一些 Plan9 的知識,就順帶一起介紹一些它的語法,如果直接講語法會很枯燥,下面會結(jié)合一些實際中會用到的情況來介紹。既有收獲又能學(xué)會語法。
Go的匯編plan9
我們整個程序的編譯最終會被翻譯成機器碼,而匯編可以算是機器碼的文本形式,他們之間可以一一對應(yīng)。所以如果我們能夠看懂匯編一點點就能夠分析出很多實際問題。
開發(fā)go語言的都是當(dāng)前世界最TOP的那群程序員,他們選擇了持續(xù)裝逼,不用標(biāo)準(zhǔn)的 AT&T 也不用 Intel 匯編器,偏要自己搞一套,沒辦法,誰讓人家牛呢!Golang的匯編是基于 Plan9 匯編的,個人覺得要完全學(xué)懂太復(fù)雜了,因為這涉及到很多底層知識。不過如果只是要求看懂還是能夠做到的。下面我們就舉一些例子來試試看。
PS: 這東西完全學(xué)懂也沒有必要,投入產(chǎn)出比太低了,對于一個應(yīng)用工程師能夠看懂就行。
在正式開始前,我們還是補充一些必要信息,上文已經(jīng)涉及過一些,為了完整這里在整體介紹一下。
幾個重要的偽寄存器
SB:是一個虛擬寄存器,保存了靜態(tài)基地址(static-base) 指針,即我們程序地址空間的開始地址;
NOSPLIT:向編譯器表明不應(yīng)該插入 stack-split 的用來檢查棧需要擴張的前導(dǎo)指令;
FP:使用形如 symbol+offset(FP) 的方式,引用函數(shù)的輸入?yún)?shù);
SP:plan9 的這個 SP 寄存器指向當(dāng)前棧幀的局部變量的開始位置,使用形如 symbol+offset(SP) 的方式,引用函數(shù)的局部變量,注意:這個寄存器與上文的寄存器是不一樣的,這里是偽寄存器,而我們展示出來的都是硬件寄存器。
其它還有一些操作指令,根據(jù)名字多半都能夠看出來,就不再介紹,直接開始干。
查看go應(yīng)用代碼對應(yīng)的翻譯函數(shù)
package main func main() { } func test() []string { a := make([]string, 10) return a } -------- "".test STEXT size=151 args=0x18 locals=0x40 0x0000 00000 (test1.go:6) TEXT "".test(SB), ABIInternal, $64-24 // 棧幀大小,與參數(shù)、返回值大小 0x0000 00000 (test1.go:6) MOVQ (TLS), CX 0x0009 00009 (test1.go:6) CMPQ SP, 16(CX) 0x000d 00013 (test1.go:6) JLS 141 0x000f 00015 (test1.go:6) SUBQ $64, SP 0x0013 00019 (test1.go:6) MOVQ BP, 56(SP) 0x0018 00024 (test1.go:6) LEAQ 56(SP), BP ... ... 0x001d 00029 (test1.go:6) MOVQ $0, "".~r0+72(SP) 0x0026 00038 (test1.go:6) XORPS X0, X0 0x0029 00041 (test1.go:6) MOVUPS X0, "".~r0+80(SP) 0x002e 00046 (test1.go:7) PCDATA $2, $1 0x002e 00046 (test1.go:7) LEAQ type.string(SB), AX 0x0035 00053 (test1.go:7) PCDATA $2, $0 0x0035 00053 (test1.go:7) MOVQ AX, (SP) 0x0039 00057 (test1.go:7) MOVQ $10, 8(SP) 0x0042 00066 (test1.go:7) MOVQ $10, 16(SP) 0x004b 00075 (test1.go:7) CALL runtime.makeslice(SB) // 對應(yīng)的底層runtime function ... ... 0x008c 00140 (test1.go:8) RET 0x008d 00141 (test1.go:8) NOP 0x008d 00141 (test1.go:6) PCDATA $0, $-1 0x008d 00141 (test1.go:6) PCDATA $2, $-1 0x008d 00141 (test1.go:6) CALL runtime.morestack_noctxt(SB) 0x0092 00146 (test1.go:6) JMP 0
根據(jù)對應(yīng)的代碼行數(shù)與名字,很明顯的可以看到應(yīng)用層寫的 make 對應(yīng)底層是 makeslice。
逃逸分析
這里先說一下逃逸分析的概念。這里牽扯到棧、堆分配的問題。如果變量被分配到棧上,會伴隨函數(shù)調(diào)用結(jié)束自動回收,并且分配效率很高;其次分配到堆上,則需要GC進行標(biāo)記回收。所謂逃逸就是指變量從棧上逃到了堆上(很多人對這個概念都不清楚就在談逃逸分析,面試遇到了好幾次?)。
package main func main() { } func test() *int { t := 3 return &t } ------ "".test STEXT size=98 args=0x8 locals=0x20 0x0000 00000 (test1.go:6) TEXT "".test(SB), ABIInternal, $32-8 0x0000 00000 (test1.go:6) MOVQ (TLS), CX 0x0009 00009 (test1.go:6) CMPQ SP, 16(CX) 0x000d 00013 (test1.go:6) JLS 91 0x000f 00015 (test1.go:6) SUBQ $32, SP 0x0013 00019 (test1.go:6) MOVQ BP, 24(SP) 0x0018 00024 (test1.go:6) LEAQ 24(SP), BP ... ... 0x001d 00029 (test1.go:6) MOVQ $0, "".~r0+40(SP) 0x0026 00038 (test1.go:7) PCDATA $2, $1 0x0026 00038 (test1.go:7) LEAQ type.int(SB), AX 0x002d 00045 (test1.go:7) PCDATA $2, $0 0x002d 00045 (test1.go:7) MOVQ AX, (SP) 0x0031 00049 (test1.go:7) CALL runtime.newobject(SB) // 堆上分配空間,表示逃逸了 ... ...
這里如果是對 slice 使用匯編進行逃逸分析,并不會很直觀。因為只會看到調(diào)用了 runtime.makeslice 函數(shù),該函數(shù)內(nèi)部其實又調(diào)用了 runtime.mallocgc 函數(shù),這個函數(shù)會分配的內(nèi)存其實就是堆上的內(nèi)存(如果棧上足夠保存,是不會看到對 runtime.makslice 函數(shù)的調(diào)用)。
實際go也提供了更方便的命令來進行逃逸分析:go build -gcflags="-m" ,如果真的是做逃逸分析,建議使用該命令,別折騰用匯編。
傳值還是傳指針
對于golang中的基本類型:字符串、整型、布爾類型就不多說了,肯定是值傳遞,那么對于結(jié)構(gòu)體、指針到底是值傳遞還是指針傳遞呢?
package main type Student struct { name string age int } func main() { jack := &Student{"jack", 30} test(jack) } func test(s *Student) *Student { return s } ------- "".test STEXT nosplit size=20 args=0x10 locals=0x0 0x0000 00000 (test1.go:14) TEXT "".test(SB), NOSPLIT|ABIInternal, $0-16 ... ... 0x0000 00000 (test1.go:14) MOVQ $0, "".~r1+16(SP) // 初始返回值為0 0x0009 00009 (test1.go:15) PCDATA $2, $1 0x0009 00009 (test1.go:15) PCDATA $0, $1 0x0009 00009 (test1.go:15) MOVQ "".s+8(SP), AX // 將引用地址復(fù)制到 AX 寄存器 0x000e 00014 (test1.go:15) PCDATA $2, $0 0x000e 00014 (test1.go:15) PCDATA $0, $2 0x000e 00014 (test1.go:15) MOVQ AX, "".~r1+16(SP) // 將 AX 的引用地址又復(fù)制到返回地址 0x0013 00019 (test1.go:15) RET
通過這里可以看到在go里邊,只有值傳遞,因為它底層還是通過拷貝對應(yīng)的值。
以上是“Golang中運行與Plan9匯編的示例分析”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!