此篇文章流傳甚廣, 其實(shí)里面沒(méi)啥干貨, 而且里面很多觀(guān)點(diǎn)是有問(wèn)題的. 這個(gè)文章在 golang-china 很早就討論過(guò)了.
泰和網(wǎng)站制作公司哪家好,找成都創(chuàng)新互聯(lián)!從網(wǎng)頁(yè)設(shè)計(jì)、網(wǎng)站建設(shè)、微信開(kāi)發(fā)、APP開(kāi)發(fā)、響應(yīng)式網(wǎng)站建設(shè)等網(wǎng)站項(xiàng)目制作,到程序開(kāi)發(fā),運(yùn)營(yíng)維護(hù)。成都創(chuàng)新互聯(lián)于2013年創(chuàng)立到現(xiàn)在10年的時(shí)間,我們擁有了豐富的建站經(jīng)驗(yàn)和運(yùn)維經(jīng)驗(yàn),來(lái)保證我們的工作的順利進(jìn)行。專(zhuān)注于網(wǎng)站建設(shè)就選成都創(chuàng)新互聯(lián)。
最近因?yàn)?Rust 1.0 和 1.1 的發(fā)布, 導(dǎo)致這個(gè)文章又出來(lái)毒害讀者.
所以寫(xiě)了這篇反駁文章, 指出其中的問(wèn)題.
有好幾次,當(dāng)我想起來(lái)的時(shí)候,總是會(huì)問(wèn)自己:我為什么要放棄Go語(yǔ)言?這個(gè)決定是正確的嗎?是明智和理性的嗎?其實(shí)我一直在認(rèn)真思考這個(gè)問(wèn)題。
開(kāi)門(mén)見(jiàn)山地說(shuō),我當(dāng)初放棄Go語(yǔ)言(golang),就是因?yàn)閮蓚€(gè)“不爽”:第一,對(duì)Go語(yǔ)言本身不爽;第二,對(duì)Go語(yǔ)言社區(qū)里的某些人不爽。毫無(wú)疑問(wèn),這是非常主觀(guān)的結(jié)論。但是我有足夠詳實(shí)的客觀(guān)的論據(jù),用以支撐這個(gè)看似主觀(guān)的結(jié)論。
文末附有本文更新日志。
確實(shí)是非常主觀(guān)的結(jié)論, 因?yàn)槔锩嬗胁簧儆袉?wèn)題的觀(guān)點(diǎn)(用來(lái)忽悠Go小白還行).
第0節(jié):我的Go語(yǔ)言經(jīng)歷
先說(shuō)說(shuō)我的經(jīng)歷吧,以避免被無(wú)緣無(wú)故地當(dāng)作Go語(yǔ)言的低級(jí)黑。
2009年底,Go語(yǔ)言(golang)第一個(gè)公開(kāi)版本發(fā)布,籠罩著“Google公司制造”的光環(huán),吸引了許多慕名而來(lái)的嘗鮮者,我(Liigo)也身居其中,籠統(tǒng)的看了一些Go語(yǔ)言的資料,學(xué)習(xí)了基礎(chǔ)的教程,因?qū)ζ湔Z(yǔ)法中的分號(hào)和花括號(hào)不滿(mǎn),很快就遺忘掉了,沒(méi)拿它當(dāng)一回事。
在2009年Go剛發(fā)布時(shí), 確實(shí)是因?yàn)椤癎oogle公司制造”的光環(huán)而吸引了(包括文章作者和諸多IT記者)很多低級(jí)的嘗鮮者.
還好, 經(jīng)過(guò)5年的發(fā)展, 這些純粹因?yàn)楣猸h(huán)來(lái)的投機(jī)者所剩已經(jīng)不多了(Google趨勢(shì)).
目前, 真正的Go用戶(hù)早就將Go用于實(shí)際的生產(chǎn)了.
說(shuō)到 其語(yǔ)法中的分號(hào)和花括號(hào)不滿(mǎn), 我想說(shuō)這只是你的 個(gè)人主觀(guān)感受, 還有很多人對(duì)Go的分號(hào)和花括號(hào)很滿(mǎn)意,
包括水果公司的的 Swift 的語(yǔ)言設(shè)計(jì)者也很滿(mǎn)意這種風(fēng)格(Swift中的分號(hào)和花括號(hào)和Go基本相同).
如果只談 個(gè)人主觀(guān)感受, 我也可以說(shuō) Rust 的 fn 縮寫(xiě)也很蛋疼!
兩年之后,2011年底,Go語(yǔ)言發(fā)布1.0的計(jì)劃被提上日程,相關(guān)的報(bào)道又多起來(lái),我再次關(guān)注它,重新評(píng)估之后決定深入?yún)⑴cGo語(yǔ)言。我訂閱了其users、nuts、dev、commits等官方郵件組,堅(jiān)持每天閱讀其中的電子郵件,以及開(kāi)發(fā)者提交的每一次源代碼更新,給Go提交了許多改進(jìn)意見(jiàn),甚至包括修改Go語(yǔ)言編譯器源代碼直接參與開(kāi)發(fā)任務(wù)。如此持續(xù)了數(shù)月時(shí)間。
這個(gè)到是事實(shí), 在 golang-china 有不少吵架的帖子, 感興趣的可以去挖下, 我就不展開(kāi)說(shuō)了.
到2012年初,Go 1.0發(fā)布,語(yǔ)言和標(biāo)準(zhǔn)庫(kù)都已經(jīng)基本定型,不可能再有大幅改進(jìn),我對(duì)Go語(yǔ)言未能在1.0定型之前更上一個(gè)臺(tái)階、實(shí)現(xiàn)自我突破,甚至帶著諸多明顯缺陷走向1.0,感到非常失望,因而逐漸疏遠(yuǎn)了它(所以Go 1.0之后的事情我很少關(guān)心)。后來(lái)看到即將發(fā)布的Go 1.1的Release Note,發(fā)現(xiàn)語(yǔ)言層面沒(méi)有太大改變,只是在庫(kù)和工具層面有所修補(bǔ)和改進(jìn),感到它尚在幼年就失去成長(zhǎng)的動(dòng)力,越發(fā)失望。外加Go語(yǔ)言社區(qū)里的某些人,其中也包括Google公司負(fù)責(zé)開(kāi)發(fā)Go語(yǔ)言的某些人,其態(tài)度、言行,讓我極度厭惡,促使我決絕地離棄Go語(yǔ)言。
真的不清楚樓主說(shuō)的可以在 Go1.0 之前短時(shí)間內(nèi)能實(shí)現(xiàn)的 重大改進(jìn)和諸多明顯缺陷 是什么.
如果是樓主說(shuō)前面的 其語(yǔ)法中的分號(hào)和花括號(hào)不滿(mǎn) 之類(lèi)的重大改進(jìn), 我只能說(shuō)這只是你的 個(gè)人主觀(guān)感受 而已,
你的很多想法只能說(shuō)服你自己, 沒(méi)辦法說(shuō)服其他絕大部分人(不要以為像C++或Rust那樣什么特性都有就NB了, 各種NB特性加到一起只能是 要你命3000, 而絕對(duì)不會(huì)是什么 銀彈).
Go 1.1的Release Note,發(fā)現(xiàn)語(yǔ)言層面沒(méi)有太大改變. 語(yǔ)言層沒(méi)有改變是是因?yàn)?Go1 作出的向后兼容的承諾. 對(duì)于工業(yè)級(jí)的語(yǔ)言來(lái)說(shuō), Go1 這個(gè)只能是優(yōu)點(diǎn). 如果連語(yǔ)言層在每個(gè)版本都會(huì)出現(xiàn)諸多大幅改進(jìn), 那誰(shuí)還敢用Go語(yǔ)言來(lái)做生產(chǎn)開(kāi)發(fā)呢(我承認(rèn)Rust的改動(dòng)很大膽, 但也說(shuō)明了Rust還處于比較幼稚和任性的階段)?
說(shuō) Go語(yǔ)言社區(qū)里的某些人固執(zhí) 的觀(guān)點(diǎn)我是同意的. 但是這些 固執(zhí) 的人是可以講道理的, 但是他們對(duì)很多東西的要求很高(特別是關(guān)于Go的設(shè)計(jì)哲學(xué)部分).
只要你給的建議有依據(jù)(語(yǔ)言的設(shè)計(jì)哲學(xué)是另外一回事情), 他們絕對(duì)不會(huì)盲目的拒絕(只是討論的周期會(huì)比較長(zhǎng)).
關(guān)于樓主提交的給Go文件添加BOM的文章, 需要補(bǔ)充說(shuō)明下.
在Go1.0發(fā)布的時(shí)候, Go語(yǔ)言的源文件(.go)明確要求必須是UTF8編碼的, 而且是無(wú)BOM的UTF8編碼的.
注意: 這個(gè) 無(wú)BOM的UTF8編碼 的限制僅僅是 針對(duì) Go語(yǔ)言的源文件(.go).
這個(gè)限制并不是說(shuō)不允許用戶(hù)處理帶BOM的UTF8的txt文件!
我覺(jué)得對(duì)于寫(xiě)Go程序來(lái)說(shuō), 這個(gè)限制是沒(méi)有任何問(wèn)題的, 到目前為止, 我還從來(lái)沒(méi)有使用過(guò)帶BOM的.go文件.
不僅是因?yàn)閹OM的.go文件沒(méi)有太多的意義, 而且有很多的缺陷.
BOM的原意是用來(lái)表示編碼是大端還是小端的, 主要用于UTF16和UTF32. 對(duì)于 UTF8 來(lái)說(shuō), BOM 沒(méi)有任何存在的意義(正是Go的2個(gè)作者發(fā)明了UTF8, 徹底解決了全球的編碼問(wèn)題).
但是, 在現(xiàn)實(shí)中, 因?yàn)镸S的txt記事本, 對(duì)于中文環(huán)境會(huì)將txt(甚至是C/C++源文件)當(dāng)作GBK編碼(GBK是個(gè)爛編碼),
為了區(qū)別到底是GBK還是UTF8, MS的記事本在前面加了BOM這個(gè)垃圾(被GBK占了茅坑), 這里的bom已經(jīng)不是表示字節(jié)序本意了. 不知道有沒(méi)有人用ms的記事本寫(xiě)網(wǎng)頁(yè), 然后生成一個(gè)帶bom的utf8網(wǎng)頁(yè)肯定很有意思.
這是MS的記事本的BUG: 它不支持生成無(wú)BOM的UTF8編碼的文本文件!
這些是現(xiàn)實(shí)存在的帶BOM的UTF8編碼的文本文件, 但是它們肯定都不是Go語(yǔ)言源文件!
所以說(shuō), Go語(yǔ)言的源文件即使強(qiáng)制限制了無(wú)BOM的UTF8編碼要求, 也是沒(méi)有任何問(wèn)題的(而且我還希望有這個(gè)限制).
雖然后來(lái)Go源文件接受帶BOM的UTF8了, 但是運(yùn)行 go fmt 之后, 還是會(huì)刪除掉BOM的(因?yàn)锽OM就是然并卵). 也就是說(shuō) 帶 BOM 的 Go 源文件是不符合 Go語(yǔ)言的編碼風(fēng)格的, go fmt 會(huì)強(qiáng)制刪除 BOM 頭.
前面說(shuō)了BOM是MS帶來(lái)的垃圾, 但是BOM的UTF8除了然并卵之外還有很多問(wèn)題, 因?yàn)锽OM在string的開(kāi)頭嵌入了垃圾,
導(dǎo)致正則表達(dá)式, string的鏈接運(yùn)算等操作都被會(huì)被BOM這個(gè)垃圾所污染. 對(duì)于.go語(yǔ)言, 即使代碼完全一樣, 有BOM和無(wú)BOM會(huì)導(dǎo)致文件的MD5之類(lèi)的校驗(yàn)碼不同.
所以, 我覺(jué)得Go用戶(hù)不用糾結(jié)BOM這個(gè)無(wú)關(guān)緊要的東西.
在上一個(gè)10年,我(Liigo)在我所屬的公司里,深度參與了兩個(gè)編程語(yǔ)言項(xiàng)目的開(kāi)發(fā)。我想,對(duì)于如何判斷某個(gè)編程語(yǔ)言的優(yōu)劣,或者說(shuō)至少對(duì)于如何判斷某個(gè)編程語(yǔ)言是否適合于我自己,我應(yīng)該還是有一點(diǎn)發(fā)言權(quán)的。
第1節(jié):我為什么對(duì)Go語(yǔ)言不爽?
Go語(yǔ)言有很多讓我不爽之處,這里列出我現(xiàn)在還能記起的其中一部分,排名基本上不分先后。讀者們耐心地看完之后,還能淡定地說(shuō)一句“我不在乎”嗎?
1.1 不允許左花括號(hào)另起一行
關(guān)于對(duì)花括號(hào)的擺放,在C語(yǔ)言、C++、Java、C#等社區(qū)中,十余年來(lái)存在持續(xù)爭(zhēng)議,從未形成一致意見(jiàn)。在我看來(lái),這本來(lái)就是主觀(guān)傾向很重的抉擇,不違反原則不涉及是非的情況下,不應(yīng)該搞一刀切,讓程序員或團(tuán)隊(duì)自己選擇就足夠了。編程語(yǔ)言本身強(qiáng)行限制,把自己的喜好強(qiáng)加給別人,得不償失。無(wú)論傾向于其中任意一種,必然得罪與其對(duì)立的一群人。雖然我現(xiàn)在已經(jīng)習(xí)慣了把左花括號(hào)放在行尾,但一想到被禁止其他選擇,就感到十分不爽。Go語(yǔ)言這這個(gè)問(wèn)題上,沒(méi)有做到“團(tuán)結(jié)一切可以團(tuán)結(jié)的力量”不說(shuō),還有意給自己樹(shù)敵,太失敗了。
我覺(jué)得Go最偉大的發(fā)明是 go fmt, 從此Go用戶(hù)不會(huì)再有花括弧的位置這種無(wú)聊爭(zhēng)論了(當(dāng)然也少了不少灌水和上tiobe排名的機(jī)會(huì)).
是這優(yōu)點(diǎn), Swift 語(yǔ)言也使用和 Go 類(lèi)似的風(fēng)格(當(dāng)然樓主也可能鄙視swift的作者).
1.2 編譯器莫名其妙地給行尾加上分號(hào)
對(duì)Go語(yǔ)言本身而言,行尾的分號(hào)是可以省略的。但是在其編譯器(gc)的實(shí)現(xiàn)中,為了方便編譯器開(kāi)發(fā)者,卻在詞法分析階段強(qiáng)行添加了行尾的分號(hào),反過(guò)來(lái)又影響到語(yǔ)言規(guī)范,對(duì)“怎樣添加分號(hào)”做出特殊規(guī)定。這種變態(tài)做法前無(wú)古人。在左花括號(hào)被意外放到下一行行首的情況下,它自動(dòng)在上一行行尾添加的分號(hào),會(huì)導(dǎo)致莫名其妙的編譯錯(cuò)誤(Go 1.0之前),連它自己都解釋不明白。如果實(shí)在處理不好分號(hào),干脆不要省略分號(hào)得了;或者,Scala和JavaScript的編譯器是開(kāi)源的,跟它們學(xué)學(xué)怎么處理省略行尾分號(hào)可以嗎?
又是樓主的 個(gè)人主觀(guān)感受, 不過(guò)我很喜歡這個(gè)特性. Swift 語(yǔ)言也是類(lèi)似.
1.3 極度強(qiáng)調(diào)編譯速度,不惜放棄本應(yīng)提供的功能
程序員是人不是神,編碼過(guò)程中免不了因?yàn)榇笠饣蚴韬龇敢恍╁e(cuò)。其中有一些,是大家集體性的很容易就中招的錯(cuò)誤(Go語(yǔ)言里的例子我暫時(shí)想不起來(lái),C++里的例子有“基類(lèi)析構(gòu)函數(shù)不是虛函數(shù)”)。這時(shí)候編譯器應(yīng)該站出來(lái),多做一些檢查、約束、核對(duì)性工作,盡量阻止常規(guī)錯(cuò)誤的發(fā)生,盡量不讓有潛在錯(cuò)誤的代碼編譯通過(guò),必要時(shí)給出一些警告或提示,讓程序員留意。編譯器不就是機(jī)器么,不就是應(yīng)該多做臟活累活雜活、減少人的心智負(fù)擔(dān)么?編譯器多做一項(xiàng)檢查,可能會(huì)避免數(shù)十萬(wàn)程序員今后多年內(nèi)無(wú)數(shù)次犯同樣的錯(cuò)誤,節(jié)省的時(shí)間不計(jì)其數(shù),這是功德無(wú)量的好事。但是Go編譯器的作者們可不這么想,他們不愿意自己多花幾個(gè)小時(shí)給編譯器增加新功能,覺(jué)得那是虧本,反而減慢了編譯速度。他們以影響編譯速度為由,拒絕了很多對(duì)編譯器改進(jìn)的要求。典型的因噎廢食。強(qiáng)調(diào)編譯速度固然值得贊賞,但如果因此放棄應(yīng)有的功能,我不贊成。
編譯速度是很重要的, 如果編譯速度夠慢, 語(yǔ)言再好也不會(huì)有人使用的.
比如C/C++的增量編譯/預(yù)編譯頭文件/并發(fā)編譯都是為了提高編譯速度.
Rust1.1 也號(hào)稱(chēng) 比 1.0 的編譯時(shí)間減少了32% (注意: 不是運(yùn)行速度).
當(dāng)然, Go剛面世的時(shí)候, 編譯速度是其中的一個(gè)設(shè)計(jì)目標(biāo).
不過(guò)我想樓主, 可能想說(shuō)的是因?yàn)榫幾g器自己添加分號(hào)而導(dǎo)致的編譯錯(cuò)誤的問(wèn)題.
我覺(jué)得Go中 { 不能另起一行是語(yǔ)言特性, 如果修復(fù)這個(gè)就是引入了新的錯(cuò)誤.
其他的我真想不起來(lái)還有哪些 調(diào)編譯速度,不惜放棄本應(yīng)提供的功能 (不要提泛型, 那是因?yàn)檫€沒(méi)有好的設(shè)計(jì)).
1.4 錯(cuò)誤處理機(jī)制太原始
在Go語(yǔ)言中處理錯(cuò)誤的基本模式是:函數(shù)通常返回多個(gè)值,其中最后一個(gè)值是error類(lèi)型,用于表示錯(cuò)誤類(lèi)型極其描述;調(diào)用者每次調(diào)用完一個(gè)函數(shù),都需要檢查這個(gè)error并進(jìn)行相應(yīng)的錯(cuò)誤處理:if err != nil { /*這種代碼寫(xiě)多了不想吐么*/ }。此模式跟C語(yǔ)言那種很原始的錯(cuò)誤處理相比如出一轍,并無(wú)實(shí)質(zhì)性改進(jìn)。實(shí)際應(yīng)用中很容易形成多層嵌套的if else語(yǔ)句,可以想一想這個(gè)編碼場(chǎng)景:先判斷文件是否存在,如果存在則打開(kāi)文件,如果打開(kāi)成功則讀取文件,如果讀取成功再寫(xiě)入一段數(shù)據(jù),最后關(guān)閉文件,別忘了還要處理每一步驟中出現(xiàn)錯(cuò)誤的情況,這代碼寫(xiě)出來(lái)得有多變態(tài)、多丑陋?實(shí)踐中普遍的做法是,判斷操作出錯(cuò)后提前return,以避免多層花括號(hào)嵌套,但這么做的后果是,許多錯(cuò)誤處理代碼被放在前面突出的位置,常規(guī)的處理邏輯反而被掩埋到后面去了,代碼可讀性極差。而且,error對(duì)象的標(biāo)準(zhǔn)接口只能返回一個(gè)錯(cuò)誤文本,有時(shí)候調(diào)用者為了區(qū)分不同的錯(cuò)誤類(lèi)型,甚至需要解析該文本。除此之外,你只能手工強(qiáng)制轉(zhuǎn)換error類(lèi)型到特定子類(lèi)型(靜態(tài)類(lèi)型的優(yōu)勢(shì)沒(méi)了)。至于panic - recover機(jī)制,致命的缺陷是不能跨越庫(kù)的邊界使用,注定是一個(gè)半成品,最多只能在自己的pkg里面玩一玩。Java的異常處理雖然也有自身的問(wèn)題(比如Checked Exceptions),但總體上還是比Go的錯(cuò)誤處理高明很多。
話(huà)說(shuō), 軟件開(kāi)發(fā)都發(fā)展了半個(gè)世紀(jì), 還是無(wú)實(shí)質(zhì)性改進(jìn). 不要以為弄一個(gè)異常的語(yǔ)法糖就是革命了.
我只能說(shuō)錯(cuò)誤和異常是2個(gè)不同的東西, 將所有錯(cuò)誤當(dāng)作異常那是SB行為.
正因?yàn)橛挟惓_@個(gè)所謂的銀彈, 導(dǎo)致很多等著別人幫忙擦屁股的行為(注意 shit 函數(shù)拋出的絕對(duì)不會(huì)是一種類(lèi)型的 shit, 而被其間接調(diào)用的各種 xxx_shit 也可能拋出各種類(lèi)型的異常, 這就導(dǎo)致 catch 失控了):
int main() {
try {
shit();
} catch( /* 到底有幾千種 shit ? */) {
...
}
}
Go的建議是 panic - recover 不跨越邊界, 也就是要求正常的錯(cuò)誤要由pkg的處理掉.
這是負(fù)責(zé)任的行為.
再說(shuō)Go是面向并發(fā)的編程語(yǔ)言, 在海量的 goroutine 中使用 try/catch 是不是有一種不倫不類(lèi)的感覺(jué)呢?
1.5 垃圾回收器(GC)不完善、有重大缺陷
在Go 1.0前夕,其垃圾回收器在32位環(huán)境下有內(nèi)存泄漏,一直拖著不肯改進(jìn),這且不說(shuō)。Go語(yǔ)言垃圾回收器真正致命的缺陷是,會(huì)導(dǎo)致整個(gè)進(jìn)程不可預(yù)知的間歇性停頓。像某些大型后臺(tái)服務(wù)程序,如游戲服務(wù)器、APP容器等,由于占用內(nèi)存巨大,其內(nèi)存對(duì)象數(shù)量極多,GC完成一次回收周期,可能需要數(shù)秒甚至更長(zhǎng)時(shí)間,這段時(shí)間內(nèi),整個(gè)服務(wù)進(jìn)程是阻塞的、停頓的,在外界看來(lái)就是服務(wù)中斷、無(wú)響應(yīng),再牛逼的并發(fā)機(jī)制到了這里統(tǒng)統(tǒng)失效。垃圾回收器定期啟動(dòng),每次啟動(dòng)就導(dǎo)致短暫的服務(wù)中斷,這樣下去,還有人敢用嗎?這可是后臺(tái)服務(wù)器進(jìn)程,是Go語(yǔ)言的重點(diǎn)應(yīng)用領(lǐng)域。以上現(xiàn)象可不是我假設(shè)出來(lái)的,而是事實(shí)存在的現(xiàn)實(shí)問(wèn)題,受其嚴(yán)重困擾的也不是一家兩家了(2013年底ECUG Con 2013,京東的劉奇提到了Go語(yǔ)言的GC、defer、標(biāo)準(zhǔn)庫(kù)實(shí)現(xiàn)是性能殺手,最大的痛苦是GC;美團(tuán)的沈鋒也提到Go語(yǔ)言的GC導(dǎo)致后臺(tái)服務(wù)間隔性停頓是最大的問(wèn)題。更早的網(wǎng)絡(luò)游戲仙俠道開(kāi)發(fā)團(tuán)隊(duì)也曾受Go垃圾回收的沉重打擊)。在實(shí)踐中,你必須努力減少進(jìn)程中的對(duì)象數(shù)量,以便把GC導(dǎo)致的間歇性停頓控制在可接受范圍內(nèi)。除此之外你別無(wú)選擇(難道你還想自己更換GC算法、甚至砍掉GC?那還是Go語(yǔ)言嗎?)。跳出圈外,我近期一直在思考,一定需要垃圾回收器嗎?沒(méi)有垃圾回收器就一定是歷史的倒退嗎?(可能會(huì)新寫(xiě)一篇博客文章專(zhuān)題探討。)
這是說(shuō)的是32位系統(tǒng), 這絕對(duì)不是Go語(yǔ)言的重點(diǎn)應(yīng)用領(lǐng)域!! 我可以說(shuō)Go出生就是面向64位系統(tǒng)和多核心CPU環(huán)境設(shè)計(jì)的. (再說(shuō) Rust 目前好像還不支持 XP 吧, 這可不可以算是影響巨大?)
32位當(dāng)時(shí)是有問(wèn)題, 但是對(duì)實(shí)際生產(chǎn)影響并不大(請(qǐng)問(wèn)樓主還是在用32位系統(tǒng)嗎, 還只安裝4GB的內(nèi)存嗎). 如果是8位單片機(jī)環(huán)境, 建議就不要用Go語(yǔ)言了, 直接C語(yǔ)言好了.
而且這個(gè)問(wèn)題早就不存在了(大家可以去看Go的發(fā)布日志).
Go的出生也就5年時(shí)間, GC的完善和改進(jìn)是一個(gè)持續(xù)的工作, 2015年8月將發(fā)布的 Go1.5將采用并行GC.
關(guān)于GC的被人詬病的地方是會(huì)導(dǎo)致卡頓, 但是我以為這個(gè)主要是因?yàn)镚C的實(shí)現(xiàn)還不夠完美而導(dǎo)致的.
如果是完美的并發(fā)和增量的GC, 那應(yīng)該不會(huì)出現(xiàn)大的卡頓問(wèn)題的.
當(dāng)然, 如果非要實(shí)時(shí)性, 那用C好了(實(shí)時(shí)并不表示性能高, 只是響應(yīng)時(shí)間可控).
對(duì)于Rust之類(lèi)沒(méi)有GC的語(yǔ)言來(lái)說(shuō), 想很方便的開(kāi)發(fā)并發(fā)的后臺(tái)程序那幾乎是不可能的.
不要總是吹Rust能代替底層/中層/上層的開(kāi)發(fā), 我們要看有誰(shuí)用Rust真的做了什么.
1.6 禁止未使用變量和多余import
Go編譯器不允許存在被未被使用的變量和多余的import,如果存在,必然導(dǎo)致編譯錯(cuò)誤。但是現(xiàn)實(shí)情況是,在代碼編寫(xiě)、重構(gòu)、調(diào)試過(guò)程中,例如,臨時(shí)性的注釋掉一行代碼,很容易就會(huì)導(dǎo)致同時(shí)出現(xiàn)未使用的變量和多余的import,直接編譯錯(cuò)誤了,你必須相應(yīng)的把變量定義注釋掉,再翻頁(yè)回到文件首部把多余的import也注釋掉,……等事情辦完了,想把剛才注釋的代碼找回來(lái),又要好幾個(gè)麻煩的步驟。還有一個(gè)讓人蛋疼的問(wèn)題,編寫(xiě)數(shù)據(jù)庫(kù)相關(guān)的代碼時(shí),如果你import某數(shù)據(jù)庫(kù)驅(qū)動(dòng)的pkg,它編譯給你報(bào)錯(cuò),說(shuō)不需要import這個(gè)未被使用的pkg;但如果你聽(tīng)信編譯器的話(huà)刪掉該import,編譯是通過(guò)了,運(yùn)行時(shí)必然報(bào)錯(cuò),說(shuō)找不到數(shù)據(jù)庫(kù)驅(qū)動(dòng);你看看程序員被折騰的兩邊不是人,最后不得不請(qǐng)出大神:import _。對(duì)待這種問(wèn)題,一個(gè)比較好的解決方案是,視其為編譯警告而非編譯錯(cuò)誤。但是Go語(yǔ)言開(kāi)發(fā)者很固執(zhí),不容許這種折中方案。
這個(gè)問(wèn)題我只能說(shuō)樓主的吐槽真的是沒(méi)水平.
為何不使用的是錯(cuò)誤而不是警告? 這是為了將低級(jí)的bug消滅在編譯階段(大家可以想下C/C++的那么多警告有什么卵用).
而且, import 即使沒(méi)有使用的話(huà), 也是用副作用的, 因?yàn)?import 會(huì)導(dǎo)致 init 和全局變量的初始化.
如果某些代碼沒(méi)有使用, 為何要執(zhí)行 init 這些初始化呢?
如果是因?yàn)檎{(diào)試而添加的變量, 那么調(diào)試完刪除不是很正常的要求嗎?
如果是因?yàn)檎{(diào)試而要導(dǎo)入fmt或log之類(lèi)的包, 刪除調(diào)試代碼后又導(dǎo)致 import 錯(cuò)誤的花,
樓主難道不知道在一個(gè)獨(dú)立的文件包裝下類(lèi)似的輔助調(diào)試的函數(shù)嗎?
import (
"fmt"
"log"
)
func logf(format string, a ...interface{}) {
file, line := callerFileLine()
fmt.Fprintf(os.Stderr, "%s:%d: ", file, line)
fmt.Fprintf(os.Stderr, format, a...)
}
func fatalf(format string, a ...interface{}) {
file, line := callerFileLine()
fmt.Fprintf(os.Stderr, "%s:%d: ", file, line)
fmt.Fprintf(os.Stderr, format, a...)
os.Exit(1)
}
import _ 是有明確行為的用法, 就是為了執(zhí)行包中的 init 等函數(shù)(可以做某些注冊(cè)操作).
將警告當(dāng)作錯(cuò)誤是Go的一個(gè)哲學(xué), 當(dāng)然在樓主看來(lái)這是白癡做法.
1.7 創(chuàng)建對(duì)象的方式太多令人糾結(jié)
創(chuàng)建對(duì)象的方式,調(diào)用new函數(shù)、調(diào)用make函數(shù)、調(diào)用New方法、使用花括號(hào)語(yǔ)法直接初始化結(jié)構(gòu)體,你選哪一種?不好選擇,因?yàn)闆](méi)有一個(gè)固定的模式。從實(shí)踐中看,如果要?jiǎng)?chuàng)建一個(gè)語(yǔ)言?xún)?nèi)置類(lèi)型(如channel、map)的對(duì)象,通常用make函數(shù)創(chuàng)建;如果要?jiǎng)?chuàng)建標(biāo)準(zhǔn)庫(kù)或第三方庫(kù)定義的類(lèi)型的對(duì)象,首先要去文檔里找一下有沒(méi)有New方法,如果有就最好調(diào)用New方法創(chuàng)建對(duì)象,如果沒(méi)有New方法,則退而求其次,用初始化結(jié)構(gòu)體的方式創(chuàng)建其對(duì)象。這個(gè)過(guò)程頗為周折,不像C++、Java、C#那樣直接new就行了。
C++的new是狗屎. new導(dǎo)致的問(wèn)題是構(gòu)造函數(shù)和普通函數(shù)的行為不一致, 這個(gè)補(bǔ)丁特性真的沒(méi)啥優(yōu)越的.
我還是喜歡C語(yǔ)言的 fopen 和 malloc 之類(lèi)構(gòu)造函數(shù), 構(gòu)造函數(shù)就是普通函數(shù), Go語(yǔ)言中也是這樣.
C++中, 除了構(gòu)造不兼容普通函數(shù), 析構(gòu)函數(shù)也是不兼容普通函數(shù). 這個(gè)而引入的坑有很多吧.
1.8 對(duì)象沒(méi)有構(gòu)造函數(shù)和析構(gòu)函數(shù)
沒(méi)有構(gòu)造函數(shù)還好說(shuō),畢竟還有自定義的New方法,大致也算是構(gòu)造函數(shù)了。沒(méi)有析構(gòu)函數(shù)就比較難受了,沒(méi)法實(shí)現(xiàn)RAII。額外的人工處理資源清理工作,無(wú)疑加重了程序員的心智負(fù)擔(dān)。沒(méi)人性啊,還嫌我們程序員加班還少嗎?C++里有析構(gòu)函數(shù),Java里雖然沒(méi)有析構(gòu)函數(shù)但是有人家finally語(yǔ)句啊,Go呢,什么都沒(méi)有。沒(méi)錯(cuò),你有個(gè)defer,可是那個(gè)defer問(wèn)題更大,詳見(jiàn)下文吧。
defer 可以覆蓋析構(gòu)函數(shù)的行為, 當(dāng)然 defer 還有其他的任務(wù). Swift2.0 也引入了一個(gè)簡(jiǎn)化版的 defer 特性.
1.9 defer語(yǔ)句的語(yǔ)義設(shè)定不甚合理
Go語(yǔ)言設(shè)計(jì)defer語(yǔ)句的出發(fā)點(diǎn)是好的,把釋放資源的“代碼”放在靠近創(chuàng)建資源的地方,但把釋放資源的“動(dòng)作”推遲(defer)到函數(shù)返回前執(zhí)行。遺憾的是其執(zhí)行時(shí)機(jī)的設(shè)置似乎有些不甚合理。設(shè)想有一個(gè)需要長(zhǎng)期運(yùn)行的函數(shù),其中有無(wú)限循環(huán)語(yǔ)句,在循環(huán)體內(nèi)不斷的創(chuàng)建資源(或分配內(nèi)存),并用defer語(yǔ)句確保釋放。由于函數(shù)一直運(yùn)行沒(méi)有返回,所有defer語(yǔ)句都得不到執(zhí)行,循環(huán)過(guò)程中創(chuàng)建的大量短暫性資源一直積累著,得不到回收。而且,系統(tǒng)為了存儲(chǔ)defer列表還要額外占用資源,也是持續(xù)增加的。這樣下去,過(guò)不了多久,整個(gè)系統(tǒng)就要因?yàn)橘Y源耗盡而崩潰。像這類(lèi)長(zhǎng)期運(yùn)行的函數(shù),http.ListenAndServe()就是典型的例子。在Go語(yǔ)言重點(diǎn)應(yīng)用領(lǐng)域,可以說(shuō)幾乎每一個(gè)后臺(tái)服務(wù)程序都必然有這么一類(lèi)函數(shù),往往還都是程序的核心部分。如果程序員不小心在這些函數(shù)中使用了defer語(yǔ)句,可以說(shuō)后患無(wú)窮。如果語(yǔ)言設(shè)計(jì)者把defer的語(yǔ)義設(shè)定為在所屬代碼塊結(jié)束時(shí)(而非函數(shù)返回時(shí))執(zhí)行,是不是更好一點(diǎn)呢?可是Go 1.0早已發(fā)布定型,為了保持向后兼容性,已經(jīng)不可能改變了。小心使用defer語(yǔ)句!一不小心就中招。
前面說(shuō)到 defer 還有其他的任務(wù), 也就是 defer 中執(zhí)行的 recover 可以捕獲 panic 拋出的異常.
還有 defer 可以在 return 之后修改命名的返回值.
上面2個(gè)工作要求 defer 只能在函數(shù)退出時(shí)來(lái)執(zhí)行.
樓主說(shuō)的 defer 是類(lèi)似 Swift2.0 中 defer 的行為, 但是 Swift2.0 中 defer 是沒(méi)有前面2個(gè)特性的.
Go中的defer是以函數(shù)作用域作為觸發(fā)的條件的, 是會(huì)導(dǎo)致樓主說(shuō)的在 for 中執(zhí)行的錯(cuò)誤用法(哪個(gè)語(yǔ)言沒(méi)有坑呢?).
不過(guò) for 中 局部 defer 也是有辦法的 (Go中的defer是以函數(shù)作用域):
for {
func(){
f, err := os.Open(...)
defer f.Close()
}()
}
在 for 中做一個(gè)閉包函數(shù)就可以了. 自己不會(huì)用不要怪別人沒(méi)告訴你.
1.10 許多語(yǔ)言?xún)?nèi)置設(shè)施不支持用戶(hù)定義的類(lèi)型
for in、make、range、channel、map等都僅支持語(yǔ)言?xún)?nèi)置類(lèi)型,不支持用戶(hù)定義的類(lèi)型(?)。用戶(hù)定義的類(lèi)型沒(méi)法支持for in循環(huán),用戶(hù)不能編寫(xiě)像make、range那樣“參數(shù)類(lèi)型和個(gè)數(shù)”甚至“返回值類(lèi)型和個(gè)數(shù)”都可變的函數(shù),不能編寫(xiě)像channel、map那樣類(lèi)似泛型的數(shù)據(jù)類(lèi)型。語(yǔ)言?xún)?nèi)置的那些東西,處處充斥著斧鑿的痕跡。這體現(xiàn)了語(yǔ)言設(shè)計(jì)的局限性、封閉性、不完善,可擴(kuò)展性差,像是新手作品——且不論其設(shè)計(jì)者和實(shí)現(xiàn)者如何權(quán)威。延伸閱讀:Go語(yǔ)言是30年前的陳舊設(shè)計(jì)思想,用戶(hù)定義的東西幾乎都是二等公民(Tikhon Jelvis)。
說(shuō)到底, 這個(gè)是因?yàn)閷?duì)泛型支持的不完備導(dǎo)致的.
Go語(yǔ)言是沒(méi)啥NB的特性, 但是Go的特性和工具組合在一起就是好用.
這就是Go語(yǔ)言NB的地方.
1.11 沒(méi)有泛型支持,常見(jiàn)數(shù)據(jù)類(lèi)型接口丑陋
沒(méi)有泛型的話(huà),List、Set、Tree這些常見(jiàn)的基礎(chǔ)性數(shù)據(jù)類(lèi)型的接口就只能很丑陋:放進(jìn)去的對(duì)象是一個(gè)具體的類(lèi)型,取出來(lái)之后成了無(wú)類(lèi)型的interface{}(可以視為所有類(lèi)型的基礎(chǔ)類(lèi)型),還得強(qiáng)制類(lèi)型轉(zhuǎn)換之后才能繼續(xù)使用,令人無(wú)語(yǔ)。Go語(yǔ)言缺少min、max這類(lèi)函數(shù),求數(shù)值絕對(duì)值的函數(shù)abs只接收/返回雙精度小數(shù)類(lèi)型,排序接口只能借助sort.Interface無(wú)奈的回避了被比較對(duì)象的類(lèi)型,等等等等,都是沒(méi)有泛型導(dǎo)致的結(jié)果。沒(méi)有泛型,接口很難優(yōu)雅起來(lái)。Go開(kāi)發(fā)者沒(méi)有明確拒絕泛型,只是說(shuō)還沒(méi)有找到很好的方法實(shí)現(xiàn)泛型(能不能學(xué)學(xué)已經(jīng)開(kāi)源的語(yǔ)言呀)。現(xiàn)實(shí)是,Go 1.0已經(jīng)定型,泛型還沒(méi)有,那些丑陋的接口為了保持向后兼容必須長(zhǎng)期存在著。
Go有自己的哲學(xué), 如果能有和目前哲學(xué)不沖突的泛型實(shí)現(xiàn), 他們是不會(huì)反對(duì)的.
如果只是簡(jiǎn)單學(xué)學(xué)(或者叫抄襲)已經(jīng)開(kāi)源的語(yǔ)言的語(yǔ)法, 那是C++的設(shè)計(jì)風(fēng)格(或者說(shuō)C++從來(lái)都是這樣設(shè)計(jì)的, 有什么特性就抄什么), 導(dǎo)致了各種腦裂的編程風(fēng)格.
編譯時(shí)泛型和運(yùn)行時(shí)泛型可能是無(wú)法完全兼容的, 看這個(gè)例子:
type AdderT interface {
Add(a, b T) T
}
在Golang語(yǔ)言開(kāi)發(fā)過(guò)程中,我們經(jīng)常會(huì)用到數(shù)組和切片數(shù)據(jù)結(jié)構(gòu),數(shù)組是固定長(zhǎng)度的,而切片是可以擴(kuò)張的數(shù)組,那么切片底層到底有什么不同?接下來(lái)我們來(lái)詳細(xì)分析一下內(nèi)部實(shí)現(xiàn)。
首先我們來(lái)看一下數(shù)據(jù)結(jié)構(gòu)
這里的array其實(shí)是指向切片管理的內(nèi)存塊首地址,而len就是切片的實(shí)際使用大小,cap就是切片的容量。
我們可以通過(guò)下面的代碼輸出slice:
這么分析下來(lái),我們可以了解如下內(nèi)容:
使用一個(gè)切片通常有兩種方法:
另一種是slice = make([]int, len, cap)這種方法,稱(chēng)為分配內(nèi)存。
創(chuàng)建一個(gè)slice,實(shí)質(zhì)上是在分配內(nèi)存。
這里跟一下細(xì)節(jié),math.MulUintptr是基于底層的指針計(jì)算乘法的,這樣計(jì)算不會(huì)導(dǎo)致超出int大小,這個(gè)方法在后面會(huì)經(jīng)常用到。
同樣,對(duì)于int64的長(zhǎng)度,也有對(duì)應(yīng)的方法
而實(shí)際分配內(nèi)存的操作調(diào)用mallocgc這個(gè)分配內(nèi)存的函數(shù),這個(gè)函數(shù)以后再分析。
我們了解切片和數(shù)組最大的不同就是切片能夠自動(dòng)擴(kuò)容,接下來(lái)看看切片是如何擴(kuò)容的
這里可以看到,growslice是返回了一個(gè)新的slice,也就是說(shuō)如果發(fā)生了擴(kuò)容,會(huì)發(fā)生拷貝。
所以我們?cè)谑褂眠^(guò)程中,如果預(yù)先知道容量,可以預(yù)先分配好容量再使用,能提高運(yùn)行效率。
copy這個(gè)函數(shù)在內(nèi)部實(shí)現(xiàn)為slicecopy
還有關(guān)于字符串的拷貝
這里顯示了可以把string拷貝成[]byte,不能把[]byte拷貝成string。
1、切片的數(shù)據(jù)結(jié)構(gòu)是 array內(nèi)存地址,len長(zhǎng)度,cap容量
2、make的時(shí)候需要注意 容量 * 長(zhǎng)度 分配的內(nèi)存大小要小于264,并且要小于可分配的內(nèi)存量,同時(shí)長(zhǎng)度不能大于容量。
3、內(nèi)存增長(zhǎng)的過(guò)程:
4、當(dāng)發(fā)生內(nèi)存擴(kuò)容時(shí),會(huì)發(fā)生拷貝數(shù)據(jù)的現(xiàn)象,影響程序運(yùn)行的效率,如果可以,要先分配好指定的容量
5、關(guān)于拷貝,可以把string拷貝成[]byte,不能把[]byte拷貝成string。
golang是一門(mén)自帶垃圾回收的語(yǔ)言,它的內(nèi)存分配器和tmalloc(thread-caching malloc)很像,大多數(shù)情況下是不需要用戶(hù)自己管理內(nèi)存的。最近了解了一下golang內(nèi)存管理,寫(xiě)出來(lái)分享一下,不正確的地方請(qǐng)大佬們指出。
1.內(nèi)存池:
應(yīng)該有一個(gè)主要管理內(nèi)存分配的部分,向系統(tǒng)申請(qǐng)大塊內(nèi)存,然后進(jìn)行管理和分配。
2.垃圾回收:
當(dāng)分配的內(nèi)存使用完之后,不直接歸還給系統(tǒng),而是歸還給內(nèi)存池,方便進(jìn)行下一次復(fù)用。至于垃圾回收選擇標(biāo)記回收,還是分代回收算法應(yīng)該符合語(yǔ)言設(shè)計(jì)初衷吧。
3.大小切分:
使用單獨(dú)的數(shù)組或者鏈表,把需要申請(qǐng)的內(nèi)存大小向上取整,直接從這個(gè)數(shù)組或鏈表拿出對(duì)應(yīng)的大小內(nèi)存塊,方便分配內(nèi)存。大的對(duì)象以頁(yè)申請(qǐng)內(nèi)存,小的對(duì)象以塊來(lái)申請(qǐng),避免內(nèi)存碎片,提高內(nèi)存使用率。
4.多線(xiàn)程管理:
每個(gè)線(xiàn)程應(yīng)該有自己的內(nèi)存塊,這樣避免同時(shí)訪(fǎng)問(wèn)共享區(qū)的時(shí)候加鎖,提升語(yǔ)言的并發(fā)性,線(xiàn)程之間通信使用消息隊(duì)列的形式,一定不要使用共享內(nèi)存的方式。提供全局性的分配鏈,如果線(xiàn)程內(nèi)存不夠用了,可向分配鏈申請(qǐng)內(nèi)存。
這樣的內(nèi)存分配設(shè)計(jì)涵蓋了大部分語(yǔ)言的,上面的想法其實(shí)是把golang語(yǔ)言?xún)?nèi)存分配抽象出來(lái)。其實(shí)Java語(yǔ)言也可以以同樣的方式理解。內(nèi)存池就是JVM堆,主要負(fù)責(zé)申請(qǐng)大塊內(nèi)存;多線(xiàn)程管理方面是使用棧內(nèi)存,每個(gè)線(xiàn)程有自己獨(dú)立的棧內(nèi)存進(jìn)行管理。
golang內(nèi)存分配器
golang內(nèi)存分配器主要包含三個(gè)數(shù)據(jù)結(jié)構(gòu):MHeap,MCentral以及MCache
1.MHeap:分配堆,主要是負(fù)責(zé)向系統(tǒng)申請(qǐng)大塊的內(nèi)存,為下層MCentral和MCache提供內(nèi)存服務(wù)。他管理的基本單位是MSpan(若干連續(xù)內(nèi)存頁(yè)的數(shù)據(jù)結(jié)構(gòu))
type MSpan struct
{
MSpan ? *next;
MSpan ? *prev;
PageId ?start; ?// 開(kāi)始的頁(yè)號(hào)
uintptr ? npages; // 頁(yè)數(shù)
…..
};
可以看出MSpan是一個(gè)雙端鏈表的形式,里面存儲(chǔ)了它的一些位置信息。
通過(guò)一個(gè)基地址+(頁(yè)號(hào)*頁(yè)大小),就可以定位到這個(gè)MSpan的實(shí)際內(nèi)存空間。
type MHeap struct
{
lock ?mutex;
free ?[_MaxMHeapList] mSpanList ?// free lists of given length
freelarge mSpanList ? // free lists length = _MaxMHeapList
busy ?[_MaxMHeapList] mSpanList ? // busy lists of large objects of given length
busylarge mSpanList
};
free數(shù)組以span為序號(hào)管理多個(gè)鏈表。當(dāng)central需要時(shí),只需從free找到頁(yè)數(shù)合適的鏈表。large鏈表用于保存所有超出free和busy頁(yè)數(shù)限制的MSpan。
MHeap示意圖:
2.MCache:運(yùn)行時(shí)分配池,不針對(duì)全局,而是每個(gè)線(xiàn)程都有自己的局部?jī)?nèi)存緩存MCache,他是實(shí)現(xiàn)goroutine高并發(fā)的重要因素,因?yàn)榉峙湫?duì)象可直接從MCache中分配,不用加鎖,提升了并發(fā)效率。
type MCache struct
{
tiny ? byte*; ?// Allocator cache for tiny objects w/o pointers.
tinysize ? uintptr;
alloc[NumSizeClasses] MSpan*; ?// spans to allocate from
};
盡可能將微小對(duì)象組合到一個(gè)tiny塊中,提高性能。
alloc[]用于分配對(duì)象,如果沒(méi)有了,則可以向?qū)?yīng)的MCentral獲取新的Span進(jìn)行操作。
線(xiàn)程中分配小對(duì)象(16~32K)的過(guò)程:
對(duì)于
size 介于 16 ~ 32K byte 的內(nèi)存分配先計(jì)算應(yīng)該分配的 sizeclass,然后去 mcache 里面
alloc[sizeclass] 申請(qǐng),如果 mcache.alloc[sizeclass] 不足以申請(qǐng),則 mcache 向 mcentral
申請(qǐng)mcentral 給 mcache 分配完之后會(huì)判斷自己需不需要擴(kuò)充,如果需要?jiǎng)t想 mheap 申請(qǐng)。
每個(gè)線(xiàn)程內(nèi)申請(qǐng)內(nèi)存是逐級(jí)向上的,首先看MCache是否有足夠空間,沒(méi)有就像MCentral申請(qǐng),再?zèng)]有就像MHeap,MHeap向系統(tǒng)申請(qǐng)內(nèi)存空間。
3.MCentral:作為MHeap和MCache的承上啟下的連接。承上,從MHeap申請(qǐng)MSpan;啟下,將MSpan劃分為各種尺寸的對(duì)象提供給MCache使用。
type MCentral struct
{
lock mutex;
sizeClass int32;
noempty mSpanList;
empty mSpanList;
int32 nfree;
……
};
type mSpanList struct {
first *mSpan
last ?*mSpan
};
sizeclass: 也有成員 sizeclass,用于將MSpan進(jìn)行切分。
lock: 因?yàn)闀?huì)有多個(gè) P 過(guò)來(lái)競(jìng)爭(zhēng)。
nonempty: mspan 的雙向鏈表,當(dāng)前 mcentral 中可用的 mSpan list。
empty: 已經(jīng)被使用的,可以認(rèn)為是一種對(duì)所有 mSpan 的 track。MCentral存在于MHeap內(nèi)。
給對(duì)象 object 分配內(nèi)存的主要流程:
1.object size 32K,則使用 mheap 直接分配。
2.object size 16 byte,使用 mcache 的小對(duì)象分配器 tiny 直接分配。 (其實(shí) tiny 就是一個(gè)指針,暫且這么說(shuō)吧。)
3.object size 16 byte size =32K byte 時(shí),先使用 mcache 中對(duì)應(yīng)的 size class 分配。
4.如果 mcache 對(duì)應(yīng)的 size class 的 span 已經(jīng)沒(méi)有可用的塊,則向 mcentral 請(qǐng)求。
5.如果 mcentral 也沒(méi)有可用的塊,則向 mheap 申請(qǐng),并切分。
6.如果 mheap 也沒(méi)有合適的 span,則想操作系統(tǒng)申請(qǐng)。
tcmalloc內(nèi)存分配器介紹
tcmalloc(thread-caching mallo)是google推出的一種內(nèi)存分配器。
具體策略:全局緩存堆和進(jìn)程的私有緩存。
1.對(duì)于一些小容量的內(nèi)存申請(qǐng)?jiān)囉眠M(jìn)程的私有緩存,私有緩存不足的時(shí)候可以再?gòu)娜志彺嫔暾?qǐng)一部分作為私有緩存。
2.對(duì)于大容量的內(nèi)存申請(qǐng)則需要從全局緩存中進(jìn)行申請(qǐng)。而大小容量的邊界就是32k。緩存的組織方式是一個(gè)單鏈表數(shù)組,數(shù)組的每個(gè)元素是一個(gè)單鏈表,鏈表中的每個(gè)元素具有相同的大小。
golang語(yǔ)言中MHeap就是全局緩存堆,MCache作為線(xiàn)程私有緩存。
在文章開(kāi)頭說(shuō)過(guò),內(nèi)存池就是利用MHeap實(shí)現(xiàn),大小切分則是在申請(qǐng)內(nèi)存的時(shí)候就做了,同時(shí)MCache分配內(nèi)存時(shí),可以用MCentral去取對(duì)應(yīng)的sizeClass,多線(xiàn)程管理方面則是通過(guò)MCache去實(shí)現(xiàn)。
總結(jié):
1.MHeap是一個(gè)全局變量,負(fù)責(zé)向系統(tǒng)申請(qǐng)內(nèi)存,mallocinit()函數(shù)進(jìn)行初始化。如果分配內(nèi)存對(duì)象大于32K直接向MHeap申請(qǐng)。
2.MCache線(xiàn)程級(jí)別管理內(nèi)存池,關(guān)聯(lián)結(jié)構(gòu)體P,主要是負(fù)責(zé)線(xiàn)程內(nèi)部?jī)?nèi)存申請(qǐng)。
3.MCentral連接MHeap與MCache的,MCache內(nèi)存不夠則向MCentral申請(qǐng),MCentral不夠時(shí)向MHeap申請(qǐng)內(nèi)存。
編寫(xiě)過(guò)C語(yǔ)言程序的肯定知道通過(guò)malloc()方法動(dòng)態(tài)申請(qǐng)內(nèi)存,其中內(nèi)存分配器使用的是glibc提供的ptmalloc2。 除了glibc,業(yè)界比較出名的內(nèi)存分配器有Google的tcmalloc和Facebook的jemalloc。二者在避免內(nèi)存碎片和性能上均比glic有比較大的優(yōu)勢(shì),在多線(xiàn)程環(huán)境中效果更明顯。
Golang中也實(shí)現(xiàn)了內(nèi)存分配器,原理與tcmalloc類(lèi)似,簡(jiǎn)單的說(shuō)就是維護(hù)一塊大的全局內(nèi)存,每個(gè)線(xiàn)程(Golang中為P)維護(hù)一塊小的私有內(nèi)存,私有內(nèi)存不足再?gòu)娜稚暾?qǐng)。另外,內(nèi)存分配與GC(垃圾回收)關(guān)系密切,所以了解GC前有必要了解內(nèi)存分配的原理。
為了方便自主管理內(nèi)存,做法便是先向系統(tǒng)申請(qǐng)一塊內(nèi)存,然后將內(nèi)存切割成小塊,通過(guò)一定的內(nèi)存分配算法管理內(nèi)存。 以64位系統(tǒng)為例,Golang程序啟動(dòng)時(shí)會(huì)向系統(tǒng)申請(qǐng)的內(nèi)存如下圖所示:
預(yù)申請(qǐng)的內(nèi)存劃分為spans、bitmap、arena三部分。其中arena即為所謂的堆區(qū),應(yīng)用中需要的內(nèi)存從這里分配。其中spans和bitmap是為了管理arena區(qū)而存在的。
arena的大小為512G,為了方便管理把a(bǔ)rena區(qū)域劃分成一個(gè)個(gè)的page,每個(gè)page為8KB,一共有512GB/8KB個(gè)頁(yè);
spans區(qū)域存放span的指針,每個(gè)指針對(duì)應(yīng)一個(gè)page,所以span區(qū)域的大小為(512GB/8KB)乘以指針大小8byte = 512M
bitmap區(qū)域大小也是通過(guò)arena計(jì)算出來(lái),不過(guò)主要用于GC。
span是用于管理arena頁(yè)的關(guān)鍵數(shù)據(jù)結(jié)構(gòu),每個(gè)span中包含1個(gè)或多個(gè)連續(xù)頁(yè),為了滿(mǎn)足小對(duì)象分配,span中的一頁(yè)會(huì)劃分更小的粒度,而對(duì)于大對(duì)象比如超過(guò)頁(yè)大小,則通過(guò)多頁(yè)實(shí)現(xiàn)。
根據(jù)對(duì)象大小,劃分了一系列class,每個(gè)class都代表一個(gè)固定大小的對(duì)象,以及每個(gè)span的大小。如下表所示:
上表中每列含義如下:
class: class ID,每個(gè)span結(jié)構(gòu)中都有一個(gè)class ID, 表示該span可處理的對(duì)象類(lèi)型
bytes/obj:該class代表對(duì)象的字節(jié)數(shù)
bytes/span:每個(gè)span占用堆的字節(jié)數(shù),也即頁(yè)數(shù)乘以頁(yè)大小
objects: 每個(gè)span可分配的對(duì)象個(gè)數(shù),也即(bytes/spans)/(bytes/obj)waste
bytes: 每個(gè)span產(chǎn)生的內(nèi)存碎片,也即(bytes/spans)%(bytes/obj)上表可見(jiàn)最大的對(duì)象是32K大小,超過(guò)32K大小的由特殊的class表示,該class ID為0,每個(gè)class只包含一個(gè)對(duì)象。
span是內(nèi)存管理的基本單位,每個(gè)span用于管理特定的class對(duì)象, 跟據(jù)對(duì)象大小,span將一個(gè)或多個(gè)頁(yè)拆分成多個(gè)塊進(jìn)行管理。src/runtime/mheap.go:mspan定義了其數(shù)據(jù)結(jié)構(gòu):
以class 10為例,span和管理的內(nèi)存如下圖所示:
spanclass為10,參照class表可得出npages=1,nelems=56,elemsize為144。其中startAddr是在span初始化時(shí)就指定了某個(gè)頁(yè)的地址。allocBits指向一個(gè)位圖,每位代表一個(gè)塊是否被分配,本例中有兩個(gè)塊已經(jīng)被分配,其allocCount也為2。next和prev用于將多個(gè)span鏈接起來(lái),這有利于管理多個(gè)span,接下來(lái)會(huì)進(jìn)行說(shuō)明。
有了管理內(nèi)存的基本單位span,還要有個(gè)數(shù)據(jù)結(jié)構(gòu)來(lái)管理span,這個(gè)數(shù)據(jù)結(jié)構(gòu)叫mcentral,各線(xiàn)程需要內(nèi)存時(shí)從mcentral管理的span中申請(qǐng)內(nèi)存,為了避免多線(xiàn)程申請(qǐng)內(nèi)存時(shí)不斷的加鎖,Golang為每個(gè)線(xiàn)程分配了span的緩存,這個(gè)緩存即是cache。src/runtime/mcache.go:mcache定義了cache的數(shù)據(jù)結(jié)構(gòu)
alloc為mspan的指針數(shù)組,數(shù)組大小為class總數(shù)的2倍。數(shù)組中每個(gè)元素代表了一種class類(lèi)型的span列表,每種class類(lèi)型都有兩組span列表,第一組列表中所表示的對(duì)象中包含了指針,第二組列表中所表示的對(duì)象不含有指針,這么做是為了提高GC掃描性能,對(duì)于不包含指針的span列表,沒(méi)必要去掃描。根據(jù)對(duì)象是否包含指針,將對(duì)象分為noscan和scan兩類(lèi),其中noscan代表沒(méi)有指針,而scan則代表有指針,需要GC進(jìn)行掃描。mcache和span的對(duì)應(yīng)關(guān)系如下圖所示:
mchache在初始化時(shí)是沒(méi)有任何span的,在使用過(guò)程中會(huì)動(dòng)態(tài)的從central中獲取并緩存下來(lái),跟據(jù)使用情況,每種class的span個(gè)數(shù)也不相同。上圖所示,class 0的span數(shù)比class1的要多,說(shuō)明本線(xiàn)程中分配的小對(duì)象要多一些。
cache作為線(xiàn)程的私有資源為單個(gè)線(xiàn)程服務(wù),而central則是全局資源,為多個(gè)線(xiàn)程服務(wù),當(dāng)某個(gè)線(xiàn)程內(nèi)存不足時(shí)會(huì)向central申請(qǐng),當(dāng)某個(gè)線(xiàn)程釋放內(nèi)存時(shí)又會(huì)回收進(jìn)central。src/runtime/mcentral.go:mcentral定義了central數(shù)據(jù)結(jié)構(gòu):
lock: 線(xiàn)程間互斥鎖,防止多線(xiàn)程讀寫(xiě)沖突
spanclass : 每個(gè)mcentral管理著一組有相同class的span列表
nonempty: 指還有內(nèi)存可用的span列表
empty: 指沒(méi)有內(nèi)存可用的span列表
nmalloc: 指累計(jì)分配的對(duì)象個(gè)數(shù)線(xiàn)程從central獲取span步驟如下:
將span歸還步驟如下:
從mcentral數(shù)據(jù)結(jié)構(gòu)可見(jiàn),每個(gè)mcentral對(duì)象只管理特定的class規(guī)格的span。事實(shí)上每種class都會(huì)對(duì)應(yīng)一個(gè)mcentral,這個(gè)mcentral的集合存放于mheap數(shù)據(jù)結(jié)構(gòu)中。src/runtime/mheap.go:mheap定義了heap的數(shù)據(jù)結(jié)構(gòu):
lock: 互斥鎖
spans: 指向spans區(qū)域,用于映射span和page的關(guān)系
bitmap:bitmap的起始地址
arena_start: arena區(qū)域首地址
arena_used: 當(dāng)前arena已使用區(qū)域的最大地址
central: 每種class對(duì)應(yīng)的兩個(gè)mcentral
從數(shù)據(jù)結(jié)構(gòu)可見(jiàn),mheap管理著全部的內(nèi)存,事實(shí)上Golang就是通過(guò)一個(gè)mheap類(lèi)型的全局變量進(jìn)行內(nèi)存管理的。mheap內(nèi)存管理示意圖如下:
系統(tǒng)預(yù)分配的內(nèi)存分為spans、bitmap、arean三個(gè)區(qū)域,通過(guò)mheap管理起來(lái)。接下來(lái)看內(nèi)存分配過(guò)程。
針對(duì)待分配對(duì)象的大小不同有不同的分配邏輯:
(0, 16B) 且不包含指針的對(duì)象: Tiny分配
(0, 16B) 包含指針的對(duì)象:正常分配
[16B, 32KB] : 正常分配
(32KB, -) : 大對(duì)象分配其中Tiny分配和大對(duì)象分配都屬于內(nèi)存管理的優(yōu)化范疇,這里暫時(shí)僅關(guān)注一般的分配方法。
以申請(qǐng)size為n的內(nèi)存為例,分配步驟如下:
Golang內(nèi)存分配是個(gè)相當(dāng)復(fù)雜的過(guò)程,其中還摻雜了GC的處理,這里僅僅對(duì)其關(guān)鍵數(shù)據(jù)結(jié)構(gòu)進(jìn)行了說(shuō)明,了解其原理而又不至于深陷實(shí)現(xiàn)細(xì)節(jié)。1、Golang程序啟動(dòng)時(shí)申請(qǐng)一大塊內(nèi)存并劃分成spans、bitmap、arena區(qū)域
2、arena區(qū)域按頁(yè)劃分成一個(gè)個(gè)小塊。
3、span管理一個(gè)或多個(gè)頁(yè)。
4、mcentral管理多個(gè)span供線(xiàn)程申請(qǐng)使用
5、mcache作為線(xiàn)程私有資源,資源來(lái)源于mcentral。
Go 語(yǔ)言較之 C 語(yǔ)言一個(gè)很大的優(yōu)勢(shì)就是自帶 GC 功能,可 GC 并不是沒(méi)有代價(jià)的。寫(xiě) C 語(yǔ)言的時(shí)候,在一個(gè)函數(shù)內(nèi)聲明的變量,在函數(shù)退出后會(huì)自動(dòng)釋放掉,因?yàn)檫@些變量分配在棧上。如果你期望變量的數(shù)據(jù)可以在函數(shù)退出后仍然能被訪(fǎng)問(wèn),就需要調(diào)用 malloc 方法在堆上申請(qǐng)內(nèi)存,如果程序不再需要這塊內(nèi)存了,再調(diào)用 free 方法釋放掉。Go 語(yǔ)言不需要你主動(dòng)調(diào)用 malloc 來(lái)分配堆空間,編譯器會(huì)自動(dòng)分析,找出需要 malloc 的變量,使用堆內(nèi)存。編譯器的這個(gè)分析過(guò)程就叫做逃逸分析。
所以你在一個(gè)函數(shù)中通過(guò) dict := make(map[string]int) 創(chuàng)建一個(gè) map 變量,其背后的數(shù)據(jù)是放在??臻g上還是堆空間上,是不一定的。這要看編譯器分析的結(jié)果。
可逃逸分析并不是百分百準(zhǔn)確的,它有缺陷。有的時(shí)候你會(huì)發(fā)現(xiàn)有些變量其實(shí)在棧空間上分配完全沒(méi)問(wèn)題的,但編譯后程序還是把這些數(shù)據(jù)放在了堆上。如果你了解 Go 語(yǔ)言編譯器逃逸分析的機(jī)制,在寫(xiě)代碼的時(shí)候就可以有意識(shí)地繞開(kāi)這些缺陷,使你的程序更高效。
Go 語(yǔ)言雖然在內(nèi)存管理方面降低了編程門(mén)檻,即使你不了解堆棧也能正常開(kāi)發(fā),但如果你要在性能上較真的話(huà),還是要掌握這些基礎(chǔ)知識(shí)。
這里不對(duì)堆內(nèi)存和棧內(nèi)存的區(qū)別做太多闡述。簡(jiǎn)單來(lái)說(shuō)就是, 棧分配廉價(jià),堆分配昂貴。 棧空間會(huì)隨著一個(gè)函數(shù)的結(jié)束自動(dòng)釋放,堆空間需要時(shí)間 GC 模塊不斷地跟蹤掃描回收。如果對(duì)這兩個(gè)概念有些迷糊,建議閱讀下面 2 個(gè)文章:
這里舉一個(gè)小例子,來(lái)對(duì)比下堆棧的差別:
stack 函數(shù)中的變量 i 在函數(shù)退出會(huì)自動(dòng)釋放;而 heap 函數(shù)返回的是對(duì)變量 i 的引用,也就是說(shuō) heap() 退出后,表示變量 i 還要能被訪(fǎng)問(wèn),它會(huì)自動(dòng)被分配到堆空間上。
他們編譯出來(lái)的代碼如下:
邏輯的復(fù)雜度不言而喻,從上面的匯編中可看到, heap() 函數(shù)調(diào)用了 runtime.newobject() 方法,它會(huì)調(diào)用 mallocgc 方法從 mcache 上申請(qǐng)內(nèi)存,申請(qǐng)的內(nèi)部邏輯前面文章已經(jīng)講述過(guò)。堆內(nèi)存分配不僅分配上邏輯比??臻g分配復(fù)雜,它最致命的是會(huì)帶來(lái)很大的管理成本,Go 語(yǔ)言要消耗很多的計(jì)算資源對(duì)其進(jìn)行標(biāo)記回收(也就是 GC 成本)。
Go 編輯器會(huì)自動(dòng)幫我們找出需要進(jìn)行動(dòng)態(tài)分配的變量,它是在編譯時(shí)追蹤一個(gè)變量的生命周期,如果能確認(rèn)一個(gè)數(shù)據(jù)只在函數(shù)空間內(nèi)訪(fǎng)問(wèn),不會(huì)被外部使用,則使用??臻g,否則就要使用堆空間。
我們?cè)? go build 編譯代碼時(shí),可使用 -gcflags '-m' 參數(shù)來(lái)查看逃逸分析日志。
以上面的兩個(gè)函數(shù)為例,編譯的日志輸出是:
日志中的 i escapes to heap 表示該變量數(shù)據(jù)逃逸到了堆上。
需要使用堆空間,所以逃逸,這沒(méi)什么可爭(zhēng)議的。但編譯器有時(shí)會(huì)將 不需要 使用堆空間的變量,也逃逸掉。這里是容易出現(xiàn)性能問(wèn)題的大坑。網(wǎng)上有很多相關(guān)文章,列舉了一些導(dǎo)致逃逸情況,其實(shí)總結(jié)起來(lái)就一句話(huà):
多級(jí)間接賦值容易導(dǎo)致逃逸 。
這里的多級(jí)間接指的是,對(duì)某個(gè)引用類(lèi)對(duì)象中的引用類(lèi)成員進(jìn)行賦值。Go 語(yǔ)言中的引用類(lèi)數(shù)據(jù)類(lèi)型有 func , interface , slice , map , chan , *Type(指針) 。
記住公式 Data.Field = Value ,如果 Data , Field 都是引用類(lèi)的數(shù)據(jù)類(lèi)型,則會(huì)導(dǎo)致 Value 逃逸。這里的等號(hào) = 不單單只賦值,也表示參數(shù)傳遞。
根據(jù)公式,我們假設(shè)一個(gè)變量 data 是以下幾種類(lèi)型,相應(yīng)的可以得出結(jié)論:
下面給出一些實(shí)際的例子:
如果變量值是一個(gè)函數(shù),函數(shù)的參數(shù)又是引用類(lèi)型,則傳遞給它的參數(shù)都會(huì)逃逸。
上例中 te 的類(lèi)型是 func(*int) ,屬于引用類(lèi)型,參數(shù) *int 也是引用類(lèi)型,則調(diào)用 te(j) 形成了為 te 的參數(shù)(成員) *int 賦值的現(xiàn)象,即 te.i = j 會(huì)導(dǎo)致逃逸。代碼中其他幾種調(diào)用都沒(méi)有形成 多級(jí)間接賦值 情況。
同理,如果函數(shù)的參數(shù)類(lèi)型是 slice , map 或 interface{} 都會(huì)導(dǎo)致參數(shù)逃逸。
匿名函數(shù)的調(diào)用也是一樣的,它本質(zhì)上也是一個(gè)函數(shù)變量。有興趣的可以自己測(cè)試一下。
只要使用了 Interface 類(lèi)型(不是 interafce{} ),那么賦值給它的變量一定會(huì)逃逸。因?yàn)? interfaceVariable.Method() 先是間接的定位到它的實(shí)際值,再調(diào)用實(shí)際值的同名方法,執(zhí)行時(shí)實(shí)際值作為參數(shù)傳遞給方法。相當(dāng)于 interfaceVariable.Method.this = realValue
向 channel 中發(fā)送數(shù)據(jù),本質(zhì)上就是為 channel 內(nèi)部的成員賦值,就像給一個(gè) slice 中的某一項(xiàng)賦值一樣。所以 chan *Type , chan map[Type]Type , chan []Type , chan interface{} 類(lèi)型都會(huì)導(dǎo)致發(fā)送到 channel 中的數(shù)據(jù)逃逸。
這本來(lái)也是情理之中的,發(fā)送給 channel 的數(shù)據(jù)是要與其他函數(shù)分享的,為了保證發(fā)送過(guò)去的指針依然可用,只能使用堆分配。
可變參數(shù)如 func(arg ...string) 實(shí)際與 func(arg []string) 是一樣的,會(huì)增加一層訪(fǎng)問(wèn)路徑。這也是 fmt.Sprintf 總是會(huì)使參數(shù)逃逸的原因。
例子非常多,這里不能一一列舉,我們只需要記住分析方法就好,即,2 級(jí)或更多級(jí)的訪(fǎng)問(wèn)賦值會(huì) 容易 導(dǎo)致數(shù)據(jù)逃逸。這里加上 容易 二字是因?yàn)殡S著語(yǔ)言的發(fā)展,相信這些問(wèn)題會(huì)被慢慢解決,但現(xiàn)階段,這個(gè)可以作為我們分析逃逸現(xiàn)象的依據(jù)。
下面代碼中包含 2 種很常規(guī)的寫(xiě)法,但他們卻有著很大的性能差距,建議自己想下為什么。
Benchmark 和 pprof 給出的結(jié)果:
熟悉堆棧概念可以讓我們更容易看透 Go 程序的性能問(wèn)題,并進(jìn)行優(yōu)化。
多級(jí)間接賦值會(huì)導(dǎo)致 Go 編譯器出現(xiàn)不必要的逃逸,在一些情況下可能我們只需要修改一下數(shù)據(jù)結(jié)構(gòu)就會(huì)使性能有大幅提升。這也是很多人不推薦在 Go 中使用指針的原因,因?yàn)樗鼤?huì)增加一級(jí)訪(fǎng)問(wèn)路徑,而 map , slice , interface{} 等類(lèi)型是不可避免要用到的,為了減少不必要的逃逸,只能拿指針開(kāi)刀了。
大多數(shù)情況下,性能優(yōu)化都會(huì)為程序帶來(lái)一定的復(fù)雜度。建議實(shí)際項(xiàng)目中還是怎么方便怎么寫(xiě),功能完成后通過(guò)性能分析找到瓶頸所在,再對(duì)局部進(jìn)行優(yōu)化。