這個問題說來話長,我先表達一下我的觀點,Go語言從語法層面提供區(qū)分錯誤和異常的機制是很好的做法,比自己用單個返回值做值判斷要方便很多。
作為一家“創(chuàng)意+整合+營銷”的成都網(wǎng)站建設機構,我們在業(yè)內(nèi)良好的客戶口碑。創(chuàng)新互聯(lián)建站提供從前期的網(wǎng)站品牌分析策劃、網(wǎng)站設計、成都網(wǎng)站設計、做網(wǎng)站、創(chuàng)意表現(xiàn)、網(wǎng)頁制作、系統(tǒng)開發(fā)以及后續(xù)網(wǎng)站營銷運營等一系列服務,幫助企業(yè)打造創(chuàng)新的互聯(lián)網(wǎng)品牌經(jīng)營模式與有效的網(wǎng)絡營銷方法,創(chuàng)造更大的價值。
上面看到很多知乎大牛把異常和錯誤混在一起說,有認為Go沒有異常機制的,有認為Go純粹只有異常機制的,我覺得這些觀點都太片面了。
具體對于錯誤和異常的討論,我轉發(fā)一下前陣子寫的一篇日志拋磚引玉吧。
============================
最近連續(xù)遇到朋友問我項目里錯誤和異常管理的事情,之前也多次跟團隊強調(diào)過錯誤和異常管理的一些概念,所以趁今天有動力就趕緊寫一篇Go語言項目錯誤和異常管理的經(jīng)驗分享。
首先我們要理清:什么是錯誤、什么是異常、為什么需要管理。然后才是怎樣管理。
錯誤和異常從語言機制上面講,就是error和panic的區(qū)別,放到別的語言也一樣,別的語言沒有error類型,但是有錯誤碼之類的,沒有panic,但是有throw之類的。
在語言層面它們是兩種概念,導致的是兩種不同的結果。如果程序遇到錯誤不處理,那么可能進一步的產(chǎn)生業(yè)務上的錯誤,比如給用戶多扣錢了,或者進一步產(chǎn)生了異常;如果程序遇到異常不處理,那么結果就是進程異常退出。
在項目里面是不是應該處理所有的錯誤情況和捕捉所有的異常呢?我只能說,你可以這么做,但是估計效果不會太好。我的理由是:
如果所有東西都處理和記錄,那么重要信息可能被淹沒在信息的海洋里。
不應該處理的錯誤被處理了,很容易導出BUG暴露不出來,直到出現(xiàn)更嚴重錯誤的時候才暴露出問題,到時候排查就很困難了,因為已經(jīng)不是錯誤的第一現(xiàn)場。
所以錯誤和異常最好能按一定的規(guī)則進行分類和管理,在第一時間能暴露錯誤和還原現(xiàn)場。
對于錯誤處理,Erlang有一個很好的概念叫速錯,就是有錯誤第一時間暴露它。我們的項目從Erlang到Go一直是沿用這一設計原則。但是應用這個原則的前提是先得區(qū)分錯誤和異常這兩個概念。
錯誤和異常上面已經(jīng)提到了,從語言機制層面比較容易區(qū)分它們,但是語言取決于人為,什么情況下用錯誤表達,什么情況下用異常表達,就得有一套規(guī)則,否則很容易出現(xiàn)全部靠異常來做錯誤處理的情況,似乎Java項目特別容易出現(xiàn)這樣的設計。
這里我先假想有這樣一個業(yè)務:游戲玩家通過購買按鈕,用銅錢購買寶石。
在實現(xiàn)這個業(yè)務的時候,程序邏輯會進一步分化成客戶端邏輯和服務端邏輯,客戶端邏輯又進一步因為設計方式的不同分化成兩種結構:胖客戶端結構、瘦客戶端結構。
胖客戶端結構,有更多的本地數(shù)據(jù)和懂得更多的業(yè)務邏輯,所以在胖客戶端結構的應用中,以上的業(yè)務會實現(xiàn)成這樣:客戶端檢查緩存中的銅錢數(shù)量,銅錢數(shù)量足夠的時候購買按鈕為可用的亮起狀態(tài),用戶點擊購買按鈕后客戶端發(fā)送購買請求到服務端;服務端收到請求后校驗用戶的銅錢數(shù)量,如果銅錢數(shù)量不足就拋出異常,終止請求過程并斷開客戶端的連接,如果銅錢數(shù)量足夠就進一步完成寶石購買過程,這里不繼續(xù)描述正常過程。
因為正常的客戶端是有一步數(shù)據(jù)校驗的過程的,所以當服務端收到不合理的請求(銅錢不足以購買寶石)時,拋出異常比返回錯誤更為合理,因為這個請求只可能來自兩種客戶端:外掛或者有BUG的客戶端。如果不通過拋出異常來終止業(yè)務過程和斷開客戶端連接,那么程序的錯誤就很難被第一時間發(fā)現(xiàn),攻擊行為也很難被發(fā)現(xiàn)。
我們再回頭看瘦客戶端結構的設計,瘦客戶端不會存有太多狀態(tài)數(shù)據(jù)和用戶數(shù)據(jù)也不清楚業(yè)務邏輯,所以客戶端的設計會是這樣:用戶點擊購買按鈕,客戶端發(fā)送購買請求;服務端收到請求后檢查銅錢數(shù)量,數(shù)量不足就返回數(shù)量不足的錯誤碼,數(shù)量足夠就繼續(xù)完成業(yè)務并返回成功信息;客戶端收到服務端的處理結果后,在界面上做出反映。
在這種結構下,銅錢不足就變成了業(yè)務邏輯范圍內(nèi)的一種失敗情況,但不能提升為異常,否則銅錢不足的用戶一點購買按鈕都會出錯掉線。
所以,異常和錯誤在不同程序結構下是互相轉換的,我們沒辦法一句話的給所有類型所有結構的程序一個統(tǒng)一的異常和錯誤分類規(guī)則。
但是,異常和錯誤的分類是有跡可循的。比如上面提到的痩客戶端結構,銅錢不足是業(yè)務邏輯范圍內(nèi)的一種失敗情況,它屬于業(yè)務錯誤,再比如程序邏輯上嘗試請求某個URL,最多三次,重試三次的過程中請求失敗是錯誤,重試到第三次,失敗就被提升為異常了。
所以我們可以這樣來歸類異常和錯誤:不會終止程序邏輯運行的歸類為錯誤,會終止程序邏輯運行的歸類為異常。
因為錯誤不會終止邏輯運行,所以錯誤是邏輯的一部分,比如上面提到的瘦客戶端結構,銅錢不足的錯誤就是業(yè)務邏輯處理過程中需要考慮和處理的一個邏輯分支。而異常就是那些不應該出現(xiàn)在業(yè)務邏輯中的東西,比如上面提到的胖客戶端結構,銅錢不足已經(jīng)不是業(yè)務邏輯需要考慮的一部分了,所以它應該是一個異常。
錯誤和異常的分類需要通過一定的思維訓練來強化分類能力,就類似于面向?qū)ο蟮脑O計方式一樣的,技術實現(xiàn)就擺在那邊,但是要用好需要不斷的思維訓練不斷的歸類和總結,以上提到的歸類方式希望可以作為一個參考,期待大家能發(fā)現(xiàn)更多更有效的歸類方式。
接下來我們講一下速錯和Go語言里面怎么做到速錯。
速錯我最早接觸是在做的時候就體驗到的,當然跟Erlang的速錯不完全一致,那時候也沒有那么高大上的一個名字,但是對待異常的理念是一樣的。
在.NET項目開發(fā)的時候,有經(jīng)驗的程序員都應該知道,不能隨便re-throw,就是catch錯誤再拋出,原因是異常的第一現(xiàn)場會被破壞,堆棧跟蹤信息會丟失,因為外部最后拿到異常的堆棧跟蹤信息,是最后那次throw的異常的堆棧跟蹤信息;其次,不能隨便try catch,隨便catch很容易導出異常暴露不出來,升級為更嚴重的業(yè)務漏洞。
到了Erlang時期,大家學到了速錯概念,簡單來講就是:讓它掛。只有掛了你才會第一時間知道錯誤,但是Erlang的掛,只是Erlang進程的異常退出,不會導致整個Erlang節(jié)點退出,所以它掛的影響層面比較低。
在Go語言項目中,雖然有類似Erlang進程的Goroutine,但是Goroutine如果panic了,并且沒有recover,那么整個Go進程就會異常退出。所以我們在Go語言項目中要應用速錯的設計理念,就要對Goroutine做一定的管理。
在我們的游戲服務端項目中,我把Goroutine按掛掉后的結果分為兩類:1、掛掉后不影響其他業(yè)務或功能的;2、掛掉后業(yè)務就無法正常進行的。
第一類Goroutine典型的有:處理各個玩家請求的Goroutine,因為每個玩家連接各自有一個Goroutine,所以掛掉了只會影響單個玩家,不會影響整體業(yè)務進行。
第二類Goroutine典型的有:數(shù)據(jù)庫同步用的Goroutine,如果它掛了,數(shù)據(jù)就無法同步到數(shù)據(jù)庫,游戲如果繼續(xù)運行下去只會導致數(shù)據(jù)回檔,還不如讓整個游戲都異常退出。
這樣一分類,就可以比較清楚哪些Goroutine該做recover處理,哪些不該做recover處理了。
那么在做recover處理時,要怎樣才能盡量保留第一現(xiàn)場來幫組開發(fā)者排查問題原因呢?我們項目中通常是會在最外層的recover中把錯誤和堆棧跟蹤信息記進日志,同時把關鍵的業(yè)務信息,比如:用戶ID、來源IP、請求數(shù)據(jù)等也一起記錄進去。
為此,我們還特地設計了一個庫,用來格式化輸出堆棧跟蹤信息和對象信息,項目地址:funny/debug · GitHub
通篇寫下來發(fā)現(xiàn)比我預期的長很多,所以這里我做一下歸納總結,幫組大家理解這篇文章所要表達的:
錯誤和異常需要分類和管理,不能一概而論
錯誤和異常的分類可以以是否終止業(yè)務過程作為標準
錯誤是業(yè)務過程的一部分,異常不是
不要隨便捕獲異常,更不要隨便捕獲再重新拋出異常
Go語言項目需要把Goroutine分為兩類,區(qū)別處理異常
在捕獲到異常時,需要盡可能的保留第一現(xiàn)場的關鍵數(shù)據(jù)
以上僅為一家之言,拋磚引玉,希望對大家有所幫助。
先介紹幾種常用的方法:
1、使用MatchString函數(shù)或Match函數(shù)
regexp.MatchString(pattern string, s string) pattern為正則表達式,s為需要校驗的字符串
regexp.Match(pattern string, b []byte) pattern為正則表達式,s為需要校驗的字符串
它們的作用都是匹配,區(qū)別在于參數(shù)為字符串和切片
實例如下:
2、使用 Compile函數(shù)或MustCompile函數(shù)
它們的區(qū)別是Compile返回兩個參數(shù) Regexp,error類型,而MustCompile只返回 Regexp類型
它們的作用是將正則表達式進行編譯,返回優(yōu)化的 Regexp 結構體,該結構體有需多方法。
實例如下:
3、查找正則匹配字串( 注:函數(shù)名包含string的所傳參數(shù)為string 其他的均為[]byte 帶All是所有)
查找正則匹配的字符串位置( 注:函數(shù)名包含string的所傳參數(shù)為string 其他的均為[]byte 帶All是所有)
4、替換
正則替換
按原文替換
函數(shù)處理替換源字串
5、Regexp結構體中一些常用的方法
我并沒有什么編程的經(jīng)驗,覺得編程實在是太復雜了,不喜歡去研究太多,對這個也不怎么懂,只能說自己是個半吊子,就是所掌握的知識,也是東拼西湊的,朋友和我說點兒,自己去書上看一點兒,只能說根據(jù)自己的體驗給出一些體會吧。
Rust的優(yōu)勢是:
1、Rust把安全、精確的內(nèi)存管理作為一切的中心放在首要的位置。
2、Rust同時擁有特別強的控制性和特別強的安全性。
3、Rust語言通過: 優(yōu)秀的類型系統(tǒng)設計、 嚴格的編譯器靜態(tài)審查、 配合程序員局部核對、加上少量的運行時校驗,保障了內(nèi)存安全。
4、Rust的語言特別的復雜,導致學習曲線比較陡峭,對于初學者來說難度較大。但學通之后將終生受益。
5、效率高,速度特別的快
6、 支持范型
7、 社區(qū)活躍度很高,更加的強調(diào)了社區(qū)的作用。
8、Rust 有更強的語義,更容易捕獲錯誤的邏輯,編譯器直接檢查出你代碼中的不安全的部分
Rust的劣勢是:
1、 語言相對來說比較復雜,對于新手來說,讓新手摸不著頭腦。
2、還不算太穩(wěn)定。
其實我覺得什么代碼啊編程啊這些東西還是比較適合理工的學生去研究,我一看腦袋就大,完全不明白在講什么。我大概了解的就是這些,語言的話大家可以多方面的去了解,也不是說有缺點就是不好,看配置看個人吧,每個人習慣不一樣,也許有的人用不穩(wěn)定的還覺得挺好呢,有的人就喜歡比較完美的,在我看來編程這個東西真的是很復雜,會有很多的代碼,這些代碼弄得我自己頭都大了,有的時候還得去惡補一下。
上圖是Golang官網(wǎng)FAQ的部分截圖,看來關于Go不支持重載的這個問題困擾了很多從面向?qū)ο笳Z言轉到Go的開發(fā)者。官方在這里做出了解答。
在上面的回答中有這樣一句話:
其意思是: 使用其他語言的經(jīng)驗告訴我們,使用具有相同名稱但簽名不同的多種方法有時會很有用,但在實踐中也可能會造成混淆和脆弱。
接下來又說: 在Go的類型系統(tǒng)中,僅按名稱進行匹配并要求類型一致是一個簡化的主要決定。
最后一句話: 關于操作員重載,似乎比絕對要求更方便。 同樣,沒有它,事情會變得更簡單。
整個的解答非常漂亮、簡潔。我們看完之后就會理解,Go語言的設計者之所以沒有在Go中實現(xiàn)方法的重載,并沒有復雜的理由,核心原則就是: 讓Go保持足夠的簡單。 這也能看出來Go語言的設計者有著極大的選擇和克制。
其實,筆者認為重載在本質(zhì)上并沒有很大的實際意義。只是表現(xiàn)力和表現(xiàn)形式上有一定的差別。明確某個上下文中的函數(shù)調(diào)用的關鍵就是函數(shù)簽名,支持重載的語言中一般是函數(shù)名加函數(shù)參數(shù)構成函數(shù)簽名。而Go中可以認為函數(shù)名就是簽名。邏輯上沒有太大的區(qū)別,就是把工作做在了臺前 還是幕后的區(qū)別。
當然如果非要較真的話,我們或許可以在Go中聲明方法的時候?qū)?shù)寫成 interface{} 或者 ... 切片的方式。在傳進來參數(shù)的時候做一步校驗,判斷參數(shù)的類型和個數(shù),然后分別處理之。
仁者見仁智者見智,大家有什么不同的理解歡迎一起溝通。
當您的代碼使用外部包時,這些包(作為模塊分發(fā))成為依賴項。隨著時間的推移,您可能需要升級或更換它們。Go 提供了依賴管理工具,可幫助您在合并外部依賴項時確保 Go 應用程序的安全。
本主題介紹如何執(zhí)行任務以管理您在代碼中承擔的依賴項。您可以使用 Go 工具執(zhí)行其中的大部分操作。本主題還介紹了如何執(zhí)行其他一些您可能會覺得有用的依賴相關任務。
您可以通過 Go 工具獲取和使用有用的包。在 pkg.go.dev 上,您可以搜索您可能覺得有用的包,然后使用go命令將這些包導入您自己的代碼中以調(diào)用它們的功能。
下面列出了最常見的依賴項管理步驟。
在 Go 中,您將依賴項作為包含您導入的包的模塊來管理。此過程由以下機構支持:
您可以搜索pkg.go.dev以查找具有您可能覺得有用的功能的軟件包。
找到要在代碼中使用的包后,在頁面頂部找到包路徑,然后單擊復制路徑按鈕將路徑復制到剪貼板。在您自己的代碼中,將路徑粘貼到導入語句中,如下例所示:
在您的代碼導入包后,啟用依賴項跟蹤并獲取包的代碼進行編譯。
要跟蹤和管理您添加的依賴項,您首先要將代碼放入其自己的模塊中。這會在源代碼樹的根目錄創(chuàng)建一個 go.mod 文件。您添加的依賴項將列在該文件中。
要將您的代碼添加到它自己的模塊中,請使用 go mod init命令。例如,從命令行切換到代碼的根目錄,然后按照以下示例運行命令:
該go mod init命令的參數(shù)是您的模塊的模塊路徑。如果可能,模塊路徑應該是源代碼的存儲庫位置。
如果一開始您不知道模塊的最終存儲庫位置,請使用安全的替代品。這可能是您擁有的域的名稱或您控制的另一個名稱(例如您的公司名稱),以及來自模塊名稱或源目錄的路徑。
當您使用 Go 工具管理依賴項時,這些工具會更新 go.mod 文件,以便它維護您的依賴項的當前列表。
添加依賴項時,Go 工具還會創(chuàng)建一個 go.sum 文件,其中包含您所依賴的模塊的校驗和。Go 使用它來驗證下載的模塊文件的完整性,特別是對于在您的項目上工作的其他開發(fā)人員。
在代碼中包含存儲庫中的 go.mod 和 go.sum 文件。
當您運行go mod init創(chuàng)建用于跟蹤依賴項的模塊時,您指定一個模塊路徑作為模塊的名稱。模塊路徑成為模塊中包的導入路徑前綴。一定要指定一個不會與其他模塊的模塊路徑?jīng)_突的模塊路徑。
至少,一個模塊路徑只需要表明它的來源,例如公司或作者或所有者名稱。但是路徑也可能更能描述模塊是什么或做什么。
模塊路徑通常采用以下形式:
1、Go 工具可以在其中找到模塊源代碼的存儲庫的位置。
例如,它可能是github.com/ /.
如果您認為您可能會發(fā)布模塊供其他人使用,請使用此最佳實踐。
2、一個你控制的名字。
如果您不使用存儲庫名稱,請務必選擇一個您確信不會被其他人使用的前綴。一個不錯的選擇是您公司的名稱。避免使用常用術語,例如widgets、utilities或 app。
Go 保證以下字符串不會在包名稱中使用。
1、test– 您可以將test用作模塊路徑前綴以便代碼用于在另一個模塊中本地測試功能進行測試。
使用test作為模塊路徑前綴是測試的一部分。例如,您的測試本身可能會運行go mod init test,然后以某種特定方式設置該模塊,以便使用 Go 源代碼分析工具進行測試。
2、example– 在某些 Go 文檔中用作模塊路徑前綴,例如在創(chuàng)建模塊以跟蹤依賴關系的教程中。
請注意,Go 文檔還用于example.com說明示例何時可能是已發(fā)布的模塊。
此篇文章流傳甚廣, 其實里面沒啥干貨, 而且里面很多觀點是有問題的. 這個文章在 golang-china 很早就討論過了.
最近因為 Rust 1.0 和 1.1 的發(fā)布, 導致這個文章又出來毒害讀者.
所以寫了這篇反駁文章, 指出其中的問題.
有好幾次,當我想起來的時候,總是會問自己:我為什么要放棄Go語言?這個決定是正確的嗎?是明智和理性的嗎?其實我一直在認真思考這個問題。
開門見山地說,我當初放棄Go語言(golang),就是因為兩個“不爽”:第一,對Go語言本身不爽;第二,對Go語言社區(qū)里的某些人不爽。毫無疑問,這是非常主觀的結論。但是我有足夠詳實的客觀的論據(jù),用以支撐這個看似主觀的結論。
文末附有本文更新日志。
確實是非常主觀的結論, 因為里面有不少有問題的觀點(用來忽悠Go小白還行).
第0節(jié):我的Go語言經(jīng)歷
先說說我的經(jīng)歷吧,以避免被無緣無故地當作Go語言的低級黑。
2009年底,Go語言(golang)第一個公開版本發(fā)布,籠罩著“Google公司制造”的光環(huán),吸引了許多慕名而來的嘗鮮者,我(Liigo)也身居其中,籠統(tǒng)的看了一些Go語言的資料,學習了基礎的教程,因?qū)ζ湔Z法中的分號和花括號不滿,很快就遺忘掉了,沒拿它當一回事。
在2009年Go剛發(fā)布時, 確實是因為“Google公司制造”的光環(huán)而吸引了(包括文章作者和諸多IT記者)很多低級的嘗鮮者.
還好, 經(jīng)過5年的發(fā)展, 這些純粹因為光環(huán)來的投機者所剩已經(jīng)不多了(Google趨勢).
目前, 真正的Go用戶早就將Go用于實際的生產(chǎn)了.
說到 其語法中的分號和花括號不滿, 我想說這只是你的 個人主觀感受, 還有很多人對Go的分號和花括號很滿意,
包括水果公司的的 Swift 的語言設計者也很滿意這種風格(Swift中的分號和花括號和Go基本相同).
如果只談 個人主觀感受, 我也可以說 Rust 的 fn 縮寫也很蛋疼!
兩年之后,2011年底,Go語言發(fā)布1.0的計劃被提上日程,相關的報道又多起來,我再次關注它,重新評估之后決定深入?yún)⑴cGo語言。我訂閱了其users、nuts、dev、commits等官方郵件組,堅持每天閱讀其中的電子郵件,以及開發(fā)者提交的每一次源代碼更新,給Go提交了許多改進意見,甚至包括修改Go語言編譯器源代碼直接參與開發(fā)任務。如此持續(xù)了數(shù)月時間。
這個到是事實, 在 golang-china 有不少吵架的帖子, 感興趣的可以去挖下, 我就不展開說了.
到2012年初,Go 1.0發(fā)布,語言和標準庫都已經(jīng)基本定型,不可能再有大幅改進,我對Go語言未能在1.0定型之前更上一個臺階、實現(xiàn)自我突破,甚至帶著諸多明顯缺陷走向1.0,感到非常失望,因而逐漸疏遠了它(所以Go 1.0之后的事情我很少關心)。后來看到即將發(fā)布的Go 1.1的Release Note,發(fā)現(xiàn)語言層面沒有太大改變,只是在庫和工具層面有所修補和改進,感到它尚在幼年就失去成長的動力,越發(fā)失望。外加Go語言社區(qū)里的某些人,其中也包括Google公司負責開發(fā)Go語言的某些人,其態(tài)度、言行,讓我極度厭惡,促使我決絕地離棄Go語言。
真的不清楚樓主說的可以在 Go1.0 之前短時間內(nèi)能實現(xiàn)的 重大改進和諸多明顯缺陷 是什么.
如果是樓主說前面的 其語法中的分號和花括號不滿 之類的重大改進, 我只能說這只是你的 個人主觀感受 而已,
你的很多想法只能說服你自己, 沒辦法說服其他絕大部分人(不要以為像C++或Rust那樣什么特性都有就NB了, 各種NB特性加到一起只能是 要你命3000, 而絕對不會是什么 銀彈).
Go 1.1的Release Note,發(fā)現(xiàn)語言層面沒有太大改變. 語言層沒有改變是是因為 Go1 作出的向后兼容的承諾. 對于工業(yè)級的語言來說, Go1 這個只能是優(yōu)點. 如果連語言層在每個版本都會出現(xiàn)諸多大幅改進, 那誰還敢用Go語言來做生產(chǎn)開發(fā)呢(我承認Rust的改動很大膽, 但也說明了Rust還處于比較幼稚和任性的階段)?
說 Go語言社區(qū)里的某些人固執(zhí) 的觀點我是同意的. 但是這些 固執(zhí) 的人是可以講道理的, 但是他們對很多東西的要求很高(特別是關于Go的設計哲學部分).
只要你給的建議有依據(jù)(語言的設計哲學是另外一回事情), 他們絕對不會盲目的拒絕(只是討論的周期會比較長).
關于樓主提交的給Go文件添加BOM的文章, 需要補充說明下.
在Go1.0發(fā)布的時候, Go語言的源文件(.go)明確要求必須是UTF8編碼的, 而且是無BOM的UTF8編碼的.
注意: 這個 無BOM的UTF8編碼 的限制僅僅是 針對 Go語言的源文件(.go).
這個限制并不是說不允許用戶處理帶BOM的UTF8的txt文件!
我覺得對于寫Go程序來說, 這個限制是沒有任何問題的, 到目前為止, 我還從來沒有使用過帶BOM的.go文件.
不僅是因為帶BOM的.go文件沒有太多的意義, 而且有很多的缺陷.
BOM的原意是用來表示編碼是大端還是小端的, 主要用于UTF16和UTF32. 對于 UTF8 來說, BOM 沒有任何存在的意義(正是Go的2個作者發(fā)明了UTF8, 徹底解決了全球的編碼問題).
但是, 在現(xiàn)實中, 因為MS的txt記事本, 對于中文環(huán)境會將txt(甚至是C/C++源文件)當作GBK編碼(GBK是個爛編碼),
為了區(qū)別到底是GBK還是UTF8, MS的記事本在前面加了BOM這個垃圾(被GBK占了茅坑), 這里的bom已經(jīng)不是表示字節(jié)序本意了. 不知道有沒有人用ms的記事本寫網(wǎng)頁, 然后生成一個帶bom的utf8網(wǎng)頁肯定很有意思.
這是MS的記事本的BUG: 它不支持生成無BOM的UTF8編碼的文本文件!
這些是現(xiàn)實存在的帶BOM的UTF8編碼的文本文件, 但是它們肯定都不是Go語言源文件!
所以說, Go語言的源文件即使強制限制了無BOM的UTF8編碼要求, 也是沒有任何問題的(而且我還希望有這個限制).
雖然后來Go源文件接受帶BOM的UTF8了, 但是運行 go fmt 之后, 還是會刪除掉BOM的(因為BOM就是然并卵). 也就是說 帶 BOM 的 Go 源文件是不符合 Go語言的編碼風格的, go fmt 會強制刪除 BOM 頭.
前面說了BOM是MS帶來的垃圾, 但是BOM的UTF8除了然并卵之外還有很多問題, 因為BOM在string的開頭嵌入了垃圾,
導致正則表達式, string的鏈接運算等操作都被會被BOM這個垃圾所污染. 對于.go語言, 即使代碼完全一樣, 有BOM和無BOM會導致文件的MD5之類的校驗碼不同.
所以, 我覺得Go用戶不用糾結BOM這個無關緊要的東西.
在上一個10年,我(Liigo)在我所屬的公司里,深度參與了兩個編程語言項目的開發(fā)。我想,對于如何判斷某個編程語言的優(yōu)劣,或者說至少對于如何判斷某個編程語言是否適合于我自己,我應該還是有一點發(fā)言權的。
第1節(jié):我為什么對Go語言不爽?
Go語言有很多讓我不爽之處,這里列出我現(xiàn)在還能記起的其中一部分,排名基本上不分先后。讀者們耐心地看完之后,還能淡定地說一句“我不在乎”嗎?
1.1 不允許左花括號另起一行
關于對花括號的擺放,在C語言、C++、Java、C#等社區(qū)中,十余年來存在持續(xù)爭議,從未形成一致意見。在我看來,這本來就是主觀傾向很重的抉擇,不違反原則不涉及是非的情況下,不應該搞一刀切,讓程序員或團隊自己選擇就足夠了。編程語言本身強行限制,把自己的喜好強加給別人,得不償失。無論傾向于其中任意一種,必然得罪與其對立的一群人。雖然我現(xiàn)在已經(jīng)習慣了把左花括號放在行尾,但一想到被禁止其他選擇,就感到十分不爽。Go語言這這個問題上,沒有做到“團結一切可以團結的力量”不說,還有意給自己樹敵,太失敗了。
我覺得Go最偉大的發(fā)明是 go fmt, 從此Go用戶不會再有花括弧的位置這種無聊爭論了(當然也少了不少灌水和上tiobe排名的機會).
是這優(yōu)點, Swift 語言也使用和 Go 類似的風格(當然樓主也可能鄙視swift的作者).
1.2 編譯器莫名其妙地給行尾加上分號
對Go語言本身而言,行尾的分號是可以省略的。但是在其編譯器(gc)的實現(xiàn)中,為了方便編譯器開發(fā)者,卻在詞法分析階段強行添加了行尾的分號,反過來又影響到語言規(guī)范,對“怎樣添加分號”做出特殊規(guī)定。這種變態(tài)做法前無古人。在左花括號被意外放到下一行行首的情況下,它自動在上一行行尾添加的分號,會導致莫名其妙的編譯錯誤(Go 1.0之前),連它自己都解釋不明白。如果實在處理不好分號,干脆不要省略分號得了;或者,Scala和JavaScript的編譯器是開源的,跟它們學學怎么處理省略行尾分號可以嗎?
又是樓主的 個人主觀感受, 不過我很喜歡這個特性. Swift 語言也是類似.
1.3 極度強調(diào)編譯速度,不惜放棄本應提供的功能
程序員是人不是神,編碼過程中免不了因為大意或疏忽犯一些錯。其中有一些,是大家集體性的很容易就中招的錯誤(Go語言里的例子我暫時想不起來,C++里的例子有“基類析構函數(shù)不是虛函數(shù)”)。這時候編譯器應該站出來,多做一些檢查、約束、核對性工作,盡量阻止常規(guī)錯誤的發(fā)生,盡量不讓有潛在錯誤的代碼編譯通過,必要時給出一些警告或提示,讓程序員留意。編譯器不就是機器么,不就是應該多做臟活累活雜活、減少人的心智負擔么?編譯器多做一項檢查,可能會避免數(shù)十萬程序員今后多年內(nèi)無數(shù)次犯同樣的錯誤,節(jié)省的時間不計其數(shù),這是功德無量的好事。但是Go編譯器的作者們可不這么想,他們不愿意自己多花幾個小時給編譯器增加新功能,覺得那是虧本,反而減慢了編譯速度。他們以影響編譯速度為由,拒絕了很多對編譯器改進的要求。典型的因噎廢食。強調(diào)編譯速度固然值得贊賞,但如果因此放棄應有的功能,我不贊成。
編譯速度是很重要的, 如果編譯速度夠慢, 語言再好也不會有人使用的.
比如C/C++的增量編譯/預編譯頭文件/并發(fā)編譯都是為了提高編譯速度.
Rust1.1 也號稱 比 1.0 的編譯時間減少了32% (注意: 不是運行速度).
當然, Go剛面世的時候, 編譯速度是其中的一個設計目標.
不過我想樓主, 可能想說的是因為編譯器自己添加分號而導致的編譯錯誤的問題.
我覺得Go中 { 不能另起一行是語言特性, 如果修復這個就是引入了新的錯誤.
其他的我真想不起來還有哪些 調(diào)編譯速度,不惜放棄本應提供的功能 (不要提泛型, 那是因為還沒有好的設計).
1.4 錯誤處理機制太原始
在Go語言中處理錯誤的基本模式是:函數(shù)通常返回多個值,其中最后一個值是error類型,用于表示錯誤類型極其描述;調(diào)用者每次調(diào)用完一個函數(shù),都需要檢查這個error并進行相應的錯誤處理:if err != nil { /*這種代碼寫多了不想吐么*/ }。此模式跟C語言那種很原始的錯誤處理相比如出一轍,并無實質(zhì)性改進。實際應用中很容易形成多層嵌套的if else語句,可以想一想這個編碼場景:先判斷文件是否存在,如果存在則打開文件,如果打開成功則讀取文件,如果讀取成功再寫入一段數(shù)據(jù),最后關閉文件,別忘了還要處理每一步驟中出現(xiàn)錯誤的情況,這代碼寫出來得有多變態(tài)、多丑陋?實踐中普遍的做法是,判斷操作出錯后提前return,以避免多層花括號嵌套,但這么做的后果是,許多錯誤處理代碼被放在前面突出的位置,常規(guī)的處理邏輯反而被掩埋到后面去了,代碼可讀性極差。而且,error對象的標準接口只能返回一個錯誤文本,有時候調(diào)用者為了區(qū)分不同的錯誤類型,甚至需要解析該文本。除此之外,你只能手工強制轉換error類型到特定子類型(靜態(tài)類型的優(yōu)勢沒了)。至于panic - recover機制,致命的缺陷是不能跨越庫的邊界使用,注定是一個半成品,最多只能在自己的pkg里面玩一玩。Java的異常處理雖然也有自身的問題(比如Checked Exceptions),但總體上還是比Go的錯誤處理高明很多。
話說, 軟件開發(fā)都發(fā)展了半個世紀, 還是無實質(zhì)性改進. 不要以為弄一個異常的語法糖就是革命了.
我只能說錯誤和異常是2個不同的東西, 將所有錯誤當作異常那是SB行為.
正因為有異常這個所謂的銀彈, 導致很多等著別人幫忙擦屁股的行為(注意 shit 函數(shù)拋出的絕對不會是一種類型的 shit, 而被其間接調(diào)用的各種 xxx_shit 也可能拋出各種類型的異常, 這就導致 catch 失控了):
int main() {
try {
shit();
} catch( /* 到底有幾千種 shit ? */) {
...
}
}
Go的建議是 panic - recover 不跨越邊界, 也就是要求正常的錯誤要由pkg的處理掉.
這是負責任的行為.
再說Go是面向并發(fā)的編程語言, 在海量的 goroutine 中使用 try/catch 是不是有一種不倫不類的感覺呢?
1.5 垃圾回收器(GC)不完善、有重大缺陷
在Go 1.0前夕,其垃圾回收器在32位環(huán)境下有內(nèi)存泄漏,一直拖著不肯改進,這且不說。Go語言垃圾回收器真正致命的缺陷是,會導致整個進程不可預知的間歇性停頓。像某些大型后臺服務程序,如游戲服務器、APP容器等,由于占用內(nèi)存巨大,其內(nèi)存對象數(shù)量極多,GC完成一次回收周期,可能需要數(shù)秒甚至更長時間,這段時間內(nèi),整個服務進程是阻塞的、停頓的,在外界看來就是服務中斷、無響應,再牛逼的并發(fā)機制到了這里統(tǒng)統(tǒng)失效。垃圾回收器定期啟動,每次啟動就導致短暫的服務中斷,這樣下去,還有人敢用嗎?這可是后臺服務器進程,是Go語言的重點應用領域。以上現(xiàn)象可不是我假設出來的,而是事實存在的現(xiàn)實問題,受其嚴重困擾的也不是一家兩家了(2013年底ECUG Con 2013,京東的劉奇提到了Go語言的GC、defer、標準庫實現(xiàn)是性能殺手,最大的痛苦是GC;美團的沈鋒也提到Go語言的GC導致后臺服務間隔性停頓是最大的問題。更早的網(wǎng)絡游戲仙俠道開發(fā)團隊也曾受Go垃圾回收的沉重打擊)。在實踐中,你必須努力減少進程中的對象數(shù)量,以便把GC導致的間歇性停頓控制在可接受范圍內(nèi)。除此之外你別無選擇(難道你還想自己更換GC算法、甚至砍掉GC?那還是Go語言嗎?)。跳出圈外,我近期一直在思考,一定需要垃圾回收器嗎?沒有垃圾回收器就一定是歷史的倒退嗎?(可能會新寫一篇博客文章專題探討。)
這是說的是32位系統(tǒng), 這絕對不是Go語言的重點應用領域!! 我可以說Go出生就是面向64位系統(tǒng)和多核心CPU環(huán)境設計的. (再說 Rust 目前好像還不支持 XP 吧, 這可不可以算是影響巨大?)
32位當時是有問題, 但是對實際生產(chǎn)影響并不大(請問樓主還是在用32位系統(tǒng)嗎, 還只安裝4GB的內(nèi)存嗎). 如果是8位單片機環(huán)境, 建議就不要用Go語言了, 直接C語言好了.
而且這個問題早就不存在了(大家可以去看Go的發(fā)布日志).
Go的出生也就5年時間, GC的完善和改進是一個持續(xù)的工作, 2015年8月將發(fā)布的 Go1.5將采用并行GC.
關于GC的被人詬病的地方是會導致卡頓, 但是我以為這個主要是因為GC的實現(xiàn)還不夠完美而導致的.
如果是完美的并發(fā)和增量的GC, 那應該不會出現(xiàn)大的卡頓問題的.
當然, 如果非要實時性, 那用C好了(實時并不表示性能高, 只是響應時間可控).
對于Rust之類沒有GC的語言來說, 想很方便的開發(fā)并發(fā)的后臺程序那幾乎是不可能的.
不要總是吹Rust能代替底層/中層/上層的開發(fā), 我們要看有誰用Rust真的做了什么.
1.6 禁止未使用變量和多余import
Go編譯器不允許存在被未被使用的變量和多余的import,如果存在,必然導致編譯錯誤。但是現(xiàn)實情況是,在代碼編寫、重構、調(diào)試過程中,例如,臨時性的注釋掉一行代碼,很容易就會導致同時出現(xiàn)未使用的變量和多余的import,直接編譯錯誤了,你必須相應的把變量定義注釋掉,再翻頁回到文件首部把多余的import也注釋掉,……等事情辦完了,想把剛才注釋的代碼找回來,又要好幾個麻煩的步驟。還有一個讓人蛋疼的問題,編寫數(shù)據(jù)庫相關的代碼時,如果你import某數(shù)據(jù)庫驅(qū)動的pkg,它編譯給你報錯,說不需要import這個未被使用的pkg;但如果你聽信編譯器的話刪掉該import,編譯是通過了,運行時必然報錯,說找不到數(shù)據(jù)庫驅(qū)動;你看看程序員被折騰的兩邊不是人,最后不得不請出大神:import _。對待這種問題,一個比較好的解決方案是,視其為編譯警告而非編譯錯誤。但是Go語言開發(fā)者很固執(zhí),不容許這種折中方案。
這個問題我只能說樓主的吐槽真的是沒水平.
為何不使用的是錯誤而不是警告? 這是為了將低級的bug消滅在編譯階段(大家可以想下C/C++的那么多警告有什么卵用).
而且, import 即使沒有使用的話, 也是用副作用的, 因為 import 會導致 init 和全局變量的初始化.
如果某些代碼沒有使用, 為何要執(zhí)行 init 這些初始化呢?
如果是因為調(diào)試而添加的變量, 那么調(diào)試完刪除不是很正常的要求嗎?
如果是因為調(diào)試而要導入fmt或log之類的包, 刪除調(diào)試代碼后又導致 import 錯誤的花,
樓主難道不知道在一個獨立的文件包裝下類似的輔助調(diào)試的函數(shù)嗎?
import (
"fmt"
"log"
)
func logf(format string, a ...interface{}) {
file, line := callerFileLine()
fmt.Fprintf(os.Stderr, "%s:%d: ", file, line)
fmt.Fprintf(os.Stderr, format, a...)
}
func fatalf(format string, a ...interface{}) {
file, line := callerFileLine()
fmt.Fprintf(os.Stderr, "%s:%d: ", file, line)
fmt.Fprintf(os.Stderr, format, a...)
os.Exit(1)
}
import _ 是有明確行為的用法, 就是為了執(zhí)行包中的 init 等函數(shù)(可以做某些注冊操作).
將警告當作錯誤是Go的一個哲學, 當然在樓主看來這是白癡做法.
1.7 創(chuàng)建對象的方式太多令人糾結
創(chuàng)建對象的方式,調(diào)用new函數(shù)、調(diào)用make函數(shù)、調(diào)用New方法、使用花括號語法直接初始化結構體,你選哪一種?不好選擇,因為沒有一個固定的模式。從實踐中看,如果要創(chuàng)建一個語言內(nèi)置類型(如channel、map)的對象,通常用make函數(shù)創(chuàng)建;如果要創(chuàng)建標準庫或第三方庫定義的類型的對象,首先要去文檔里找一下有沒有New方法,如果有就最好調(diào)用New方法創(chuàng)建對象,如果沒有New方法,則退而求其次,用初始化結構體的方式創(chuàng)建其對象。這個過程頗為周折,不像C++、Java、C#那樣直接new就行了。
C++的new是狗屎. new導致的問題是構造函數(shù)和普通函數(shù)的行為不一致, 這個補丁特性真的沒啥優(yōu)越的.
我還是喜歡C語言的 fopen 和 malloc 之類構造函數(shù), 構造函數(shù)就是普通函數(shù), Go語言中也是這樣.
C++中, 除了構造不兼容普通函數(shù), 析構函數(shù)也是不兼容普通函數(shù). 這個而引入的坑有很多吧.
1.8 對象沒有構造函數(shù)和析構函數(shù)
沒有構造函數(shù)還好說,畢竟還有自定義的New方法,大致也算是構造函數(shù)了。沒有析構函數(shù)就比較難受了,沒法實現(xiàn)RAII。額外的人工處理資源清理工作,無疑加重了程序員的心智負擔。沒人性啊,還嫌我們程序員加班還少嗎?C++里有析構函數(shù),Java里雖然沒有析構函數(shù)但是有人家finally語句啊,Go呢,什么都沒有。沒錯,你有個defer,可是那個defer問題更大,詳見下文吧。
defer 可以覆蓋析構函數(shù)的行為, 當然 defer 還有其他的任務. Swift2.0 也引入了一個簡化版的 defer 特性.
1.9 defer語句的語義設定不甚合理
Go語言設計defer語句的出發(fā)點是好的,把釋放資源的“代碼”放在靠近創(chuàng)建資源的地方,但把釋放資源的“動作”推遲(defer)到函數(shù)返回前執(zhí)行。遺憾的是其執(zhí)行時機的設置似乎有些不甚合理。設想有一個需要長期運行的函數(shù),其中有無限循環(huán)語句,在循環(huán)體內(nèi)不斷的創(chuàng)建資源(或分配內(nèi)存),并用defer語句確保釋放。由于函數(shù)一直運行沒有返回,所有defer語句都得不到執(zhí)行,循環(huán)過程中創(chuàng)建的大量短暫性資源一直積累著,得不到回收。而且,系統(tǒng)為了存儲defer列表還要額外占用資源,也是持續(xù)增加的。這樣下去,過不了多久,整個系統(tǒng)就要因為資源耗盡而崩潰。像這類長期運行的函數(shù),http.ListenAndServe()就是典型的例子。在Go語言重點應用領域,可以說幾乎每一個后臺服務程序都必然有這么一類函數(shù),往往還都是程序的核心部分。如果程序員不小心在這些函數(shù)中使用了defer語句,可以說后患無窮。如果語言設計者把defer的語義設定為在所屬代碼塊結束時(而非函數(shù)返回時)執(zhí)行,是不是更好一點呢?可是Go 1.0早已發(fā)布定型,為了保持向后兼容性,已經(jīng)不可能改變了。小心使用defer語句!一不小心就中招。
前面說到 defer 還有其他的任務, 也就是 defer 中執(zhí)行的 recover 可以捕獲 panic 拋出的異常.
還有 defer 可以在 return 之后修改命名的返回值.
上面2個工作要求 defer 只能在函數(shù)退出時來執(zhí)行.
樓主說的 defer 是類似 Swift2.0 中 defer 的行為, 但是 Swift2.0 中 defer 是沒有前面2個特性的.
Go中的defer是以函數(shù)作用域作為觸發(fā)的條件的, 是會導致樓主說的在 for 中執(zhí)行的錯誤用法(哪個語言沒有坑呢?).
不過 for 中 局部 defer 也是有辦法的 (Go中的defer是以函數(shù)作用域):
for {
func(){
f, err := os.Open(...)
defer f.Close()
}()
}
在 for 中做一個閉包函數(shù)就可以了. 自己不會用不要怪別人沒告訴你.
1.10 許多語言內(nèi)置設施不支持用戶定義的類型
for in、make、range、channel、map等都僅支持語言內(nèi)置類型,不支持用戶定義的類型(?)。用戶定義的類型沒法支持for in循環(huán),用戶不能編寫像make、range那樣“參數(shù)類型和個數(shù)”甚至“返回值類型和個數(shù)”都可變的函數(shù),不能編寫像channel、map那樣類似泛型的數(shù)據(jù)類型。語言內(nèi)置的那些東西,處處充斥著斧鑿的痕跡。這體現(xiàn)了語言設計的局限性、封閉性、不完善,可擴展性差,像是新手作品——且不論其設計者和實現(xiàn)者如何權威。延伸閱讀:Go語言是30年前的陳舊設計思想,用戶定義的東西幾乎都是二等公民(Tikhon Jelvis)。
說到底, 這個是因為對泛型支持的不完備導致的.
Go語言是沒啥NB的特性, 但是Go的特性和工具組合在一起就是好用.
這就是Go語言NB的地方.
1.11 沒有泛型支持,常見數(shù)據(jù)類型接口丑陋
沒有泛型的話,List、Set、Tree這些常見的基礎性數(shù)據(jù)類型的接口就只能很丑陋:放進去的對象是一個具體的類型,取出來之后成了無類型的interface{}(可以視為所有類型的基礎類型),還得強制類型轉換之后才能繼續(xù)使用,令人無語。Go語言缺少min、max這類函數(shù),求數(shù)值絕對值的函數(shù)abs只接收/返回雙精度小數(shù)類型,排序接口只能借助sort.Interface無奈的回避了被比較對象的類型,等等等等,都是沒有泛型導致的結果。沒有泛型,接口很難優(yōu)雅起來。Go開發(fā)者沒有明確拒絕泛型,只是說還沒有找到很好的方法實現(xiàn)泛型(能不能學學已經(jīng)開源的語言呀)?,F(xiàn)實是,Go 1.0已經(jīng)定型,泛型還沒有,那些丑陋的接口為了保持向后兼容必須長期存在著。
Go有自己的哲學, 如果能有和目前哲學不沖突的泛型實現(xiàn), 他們是不會反對的.
如果只是簡單學學(或者叫抄襲)已經(jīng)開源的語言的語法, 那是C++的設計風格(或者說C++從來都是這樣設計的, 有什么特性就抄什么), 導致了各種腦裂的編程風格.
編譯時泛型和運行時泛型可能是無法完全兼容的, 看這個例子:
type AdderT interface {
Add(a, b T) T
}