這個(gè)問題說來話長,我先表達(dá)一下我的觀點(diǎn),Go語言從語法層面提供區(qū)分錯(cuò)誤和異常的機(jī)制是很好的做法,比自己用單個(gè)返回值做值判斷要方便很多。
為洮南等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計(jì)制作服務(wù),及洮南網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為網(wǎng)站制作、網(wǎng)站建設(shè)、洮南網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會(huì)得到認(rèn)可,從而選擇與我們長期合作。這樣,我們也可以走得更遠(yuǎn)!
上面看到很多知乎大牛把異常和錯(cuò)誤混在一起說,有認(rèn)為Go沒有異常機(jī)制的,有認(rèn)為Go純粹只有異常機(jī)制的,我覺得這些觀點(diǎn)都太片面了。
具體對于錯(cuò)誤和異常的討論,我轉(zhuǎn)發(fā)一下前陣子寫的一篇日志拋磚引玉吧。
============================
最近連續(xù)遇到朋友問我項(xiàng)目里錯(cuò)誤和異常管理的事情,之前也多次跟團(tuán)隊(duì)強(qiáng)調(diào)過錯(cuò)誤和異常管理的一些概念,所以趁今天有動(dòng)力就趕緊寫一篇Go語言項(xiàng)目錯(cuò)誤和異常管理的經(jīng)驗(yàn)分享。
首先我們要理清:什么是錯(cuò)誤、什么是異常、為什么需要管理。然后才是怎樣管理。
錯(cuò)誤和異常從語言機(jī)制上面講,就是error和panic的區(qū)別,放到別的語言也一樣,別的語言沒有error類型,但是有錯(cuò)誤碼之類的,沒有panic,但是有throw之類的。
在語言層面它們是兩種概念,導(dǎo)致的是兩種不同的結(jié)果。如果程序遇到錯(cuò)誤不處理,那么可能進(jìn)一步的產(chǎn)生業(yè)務(wù)上的錯(cuò)誤,比如給用戶多扣錢了,或者進(jìn)一步產(chǎn)生了異常;如果程序遇到異常不處理,那么結(jié)果就是進(jìn)程異常退出。
在項(xiàng)目里面是不是應(yīng)該處理所有的錯(cuò)誤情況和捕捉所有的異常呢?我只能說,你可以這么做,但是估計(jì)效果不會(huì)太好。我的理由是:
如果所有東西都處理和記錄,那么重要信息可能被淹沒在信息的海洋里。
不應(yīng)該處理的錯(cuò)誤被處理了,很容易導(dǎo)出BUG暴露不出來,直到出現(xiàn)更嚴(yán)重錯(cuò)誤的時(shí)候才暴露出問題,到時(shí)候排查就很困難了,因?yàn)橐呀?jīng)不是錯(cuò)誤的第一現(xiàn)場。
所以錯(cuò)誤和異常最好能按一定的規(guī)則進(jìn)行分類和管理,在第一時(shí)間能暴露錯(cuò)誤和還原現(xiàn)場。
對于錯(cuò)誤處理,Erlang有一個(gè)很好的概念叫速錯(cuò),就是有錯(cuò)誤第一時(shí)間暴露它。我們的項(xiàng)目從Erlang到Go一直是沿用這一設(shè)計(jì)原則。但是應(yīng)用這個(gè)原則的前提是先得區(qū)分錯(cuò)誤和異常這兩個(gè)概念。
錯(cuò)誤和異常上面已經(jīng)提到了,從語言機(jī)制層面比較容易區(qū)分它們,但是語言取決于人為,什么情況下用錯(cuò)誤表達(dá),什么情況下用異常表達(dá),就得有一套規(guī)則,否則很容易出現(xiàn)全部靠異常來做錯(cuò)誤處理的情況,似乎Java項(xiàng)目特別容易出現(xiàn)這樣的設(shè)計(jì)。
這里我先假想有這樣一個(gè)業(yè)務(wù):游戲玩家通過購買按鈕,用銅錢購買寶石。
在實(shí)現(xiàn)這個(gè)業(yè)務(wù)的時(shí)候,程序邏輯會(huì)進(jìn)一步分化成客戶端邏輯和服務(wù)端邏輯,客戶端邏輯又進(jìn)一步因?yàn)樵O(shè)計(jì)方式的不同分化成兩種結(jié)構(gòu):胖客戶端結(jié)構(gòu)、瘦客戶端結(jié)構(gòu)。
胖客戶端結(jié)構(gòu),有更多的本地?cái)?shù)據(jù)和懂得更多的業(yè)務(wù)邏輯,所以在胖客戶端結(jié)構(gòu)的應(yīng)用中,以上的業(yè)務(wù)會(huì)實(shí)現(xiàn)成這樣:客戶端檢查緩存中的銅錢數(shù)量,銅錢數(shù)量足夠的時(shí)候購買按鈕為可用的亮起狀態(tài),用戶點(diǎn)擊購買按鈕后客戶端發(fā)送購買請求到服務(wù)端;服務(wù)端收到請求后校驗(yàn)用戶的銅錢數(shù)量,如果銅錢數(shù)量不足就拋出異常,終止請求過程并斷開客戶端的連接,如果銅錢數(shù)量足夠就進(jìn)一步完成寶石購買過程,這里不繼續(xù)描述正常過程。
因?yàn)檎5目蛻舳耸怯幸徊綌?shù)據(jù)校驗(yàn)的過程的,所以當(dāng)服務(wù)端收到不合理的請求(銅錢不足以購買寶石)時(shí),拋出異常比返回錯(cuò)誤更為合理,因?yàn)檫@個(gè)請求只可能來自兩種客戶端:外掛或者有BUG的客戶端。如果不通過拋出異常來終止業(yè)務(wù)過程和斷開客戶端連接,那么程序的錯(cuò)誤就很難被第一時(shí)間發(fā)現(xiàn),攻擊行為也很難被發(fā)現(xiàn)。
我們再回頭看瘦客戶端結(jié)構(gòu)的設(shè)計(jì),瘦客戶端不會(huì)存有太多狀態(tài)數(shù)據(jù)和用戶數(shù)據(jù)也不清楚業(yè)務(wù)邏輯,所以客戶端的設(shè)計(jì)會(huì)是這樣:用戶點(diǎn)擊購買按鈕,客戶端發(fā)送購買請求;服務(wù)端收到請求后檢查銅錢數(shù)量,數(shù)量不足就返回?cái)?shù)量不足的錯(cuò)誤碼,數(shù)量足夠就繼續(xù)完成業(yè)務(wù)并返回成功信息;客戶端收到服務(wù)端的處理結(jié)果后,在界面上做出反映。
在這種結(jié)構(gòu)下,銅錢不足就變成了業(yè)務(wù)邏輯范圍內(nèi)的一種失敗情況,但不能提升為異常,否則銅錢不足的用戶一點(diǎn)購買按鈕都會(huì)出錯(cuò)掉線。
所以,異常和錯(cuò)誤在不同程序結(jié)構(gòu)下是互相轉(zhuǎn)換的,我們沒辦法一句話的給所有類型所有結(jié)構(gòu)的程序一個(gè)統(tǒng)一的異常和錯(cuò)誤分類規(guī)則。
但是,異常和錯(cuò)誤的分類是有跡可循的。比如上面提到的痩客戶端結(jié)構(gòu),銅錢不足是業(yè)務(wù)邏輯范圍內(nèi)的一種失敗情況,它屬于業(yè)務(wù)錯(cuò)誤,再比如程序邏輯上嘗試請求某個(gè)URL,最多三次,重試三次的過程中請求失敗是錯(cuò)誤,重試到第三次,失敗就被提升為異常了。
所以我們可以這樣來歸類異常和錯(cuò)誤:不會(huì)終止程序邏輯運(yùn)行的歸類為錯(cuò)誤,會(huì)終止程序邏輯運(yùn)行的歸類為異常。
因?yàn)殄e(cuò)誤不會(huì)終止邏輯運(yùn)行,所以錯(cuò)誤是邏輯的一部分,比如上面提到的瘦客戶端結(jié)構(gòu),銅錢不足的錯(cuò)誤就是業(yè)務(wù)邏輯處理過程中需要考慮和處理的一個(gè)邏輯分支。而異常就是那些不應(yīng)該出現(xiàn)在業(yè)務(wù)邏輯中的東西,比如上面提到的胖客戶端結(jié)構(gòu),銅錢不足已經(jīng)不是業(yè)務(wù)邏輯需要考慮的一部分了,所以它應(yīng)該是一個(gè)異常。
錯(cuò)誤和異常的分類需要通過一定的思維訓(xùn)練來強(qiáng)化分類能力,就類似于面向?qū)ο蟮脑O(shè)計(jì)方式一樣的,技術(shù)實(shí)現(xiàn)就擺在那邊,但是要用好需要不斷的思維訓(xùn)練不斷的歸類和總結(jié),以上提到的歸類方式希望可以作為一個(gè)參考,期待大家能發(fā)現(xiàn)更多更有效的歸類方式。
接下來我們講一下速錯(cuò)和Go語言里面怎么做到速錯(cuò)。
速錯(cuò)我最早接觸是在做的時(shí)候就體驗(yàn)到的,當(dāng)然跟Erlang的速錯(cuò)不完全一致,那時(shí)候也沒有那么高大上的一個(gè)名字,但是對待異常的理念是一樣的。
在.NET項(xiàng)目開發(fā)的時(shí)候,有經(jīng)驗(yàn)的程序員都應(yīng)該知道,不能隨便re-throw,就是catch錯(cuò)誤再拋出,原因是異常的第一現(xiàn)場會(huì)被破壞,堆棧跟蹤信息會(huì)丟失,因?yàn)橥獠孔詈竽玫疆惓5亩褩8櫺畔ⅲ亲詈竽谴蝨hrow的異常的堆棧跟蹤信息;其次,不能隨便try catch,隨便catch很容易導(dǎo)出異常暴露不出來,升級為更嚴(yán)重的業(yè)務(wù)漏洞。
到了Erlang時(shí)期,大家學(xué)到了速錯(cuò)概念,簡單來講就是:讓它掛。只有掛了你才會(huì)第一時(shí)間知道錯(cuò)誤,但是Erlang的掛,只是Erlang進(jìn)程的異常退出,不會(huì)導(dǎo)致整個(gè)Erlang節(jié)點(diǎn)退出,所以它掛的影響層面比較低。
在Go語言項(xiàng)目中,雖然有類似Erlang進(jìn)程的Goroutine,但是Goroutine如果panic了,并且沒有recover,那么整個(gè)Go進(jìn)程就會(huì)異常退出。所以我們在Go語言項(xiàng)目中要應(yīng)用速錯(cuò)的設(shè)計(jì)理念,就要對Goroutine做一定的管理。
在我們的游戲服務(wù)端項(xiàng)目中,我把Goroutine按掛掉后的結(jié)果分為兩類:1、掛掉后不影響其他業(yè)務(wù)或功能的;2、掛掉后業(yè)務(wù)就無法正常進(jìn)行的。
第一類Goroutine典型的有:處理各個(gè)玩家請求的Goroutine,因?yàn)槊總€(gè)玩家連接各自有一個(gè)Goroutine,所以掛掉了只會(huì)影響單個(gè)玩家,不會(huì)影響整體業(yè)務(wù)進(jìn)行。
第二類Goroutine典型的有:數(shù)據(jù)庫同步用的Goroutine,如果它掛了,數(shù)據(jù)就無法同步到數(shù)據(jù)庫,游戲如果繼續(xù)運(yùn)行下去只會(huì)導(dǎo)致數(shù)據(jù)回檔,還不如讓整個(gè)游戲都異常退出。
這樣一分類,就可以比較清楚哪些Goroutine該做recover處理,哪些不該做recover處理了。
那么在做recover處理時(shí),要怎樣才能盡量保留第一現(xiàn)場來幫組開發(fā)者排查問題原因呢?我們項(xiàng)目中通常是會(huì)在最外層的recover中把錯(cuò)誤和堆棧跟蹤信息記進(jìn)日志,同時(shí)把關(guān)鍵的業(yè)務(wù)信息,比如:用戶ID、來源IP、請求數(shù)據(jù)等也一起記錄進(jìn)去。
為此,我們還特地設(shè)計(jì)了一個(gè)庫,用來格式化輸出堆棧跟蹤信息和對象信息,項(xiàng)目地址:funny/debug · GitHub
通篇寫下來發(fā)現(xiàn)比我預(yù)期的長很多,所以這里我做一下歸納總結(jié),幫組大家理解這篇文章所要表達(dá)的:
錯(cuò)誤和異常需要分類和管理,不能一概而論
錯(cuò)誤和異常的分類可以以是否終止業(yè)務(wù)過程作為標(biāo)準(zhǔn)
錯(cuò)誤是業(yè)務(wù)過程的一部分,異常不是
不要隨便捕獲異常,更不要隨便捕獲再重新拋出異常
Go語言項(xiàng)目需要把Goroutine分為兩類,區(qū)別處理異常
在捕獲到異常時(shí),需要盡可能的保留第一現(xiàn)場的關(guān)鍵數(shù)據(jù)
以上僅為一家之言,拋磚引玉,希望對大家有所幫助。
go語言調(diào)取包會(huì)先找vendor下的包 ,這個(gè)錯(cuò)說明vendor下有sirupsen這個(gè)包
github.com/Sirupsen/logrus" and "github.com/sirupsen/logrus,
直接把Sirupsen換為sirupsen就可以使用了
有好幾次,當(dāng)我想起來的時(shí)候,總是會(huì)問自己:我為什么要放棄Go語言?這個(gè)決定是正確的嗎?是明智和理性的嗎?其實(shí)我一直在認(rèn)真思考這個(gè)問題。開門見山地說,我當(dāng)初放棄Go語言(golang),就是因?yàn)閮蓚€(gè)“不爽”:第一,對Go語言本身不爽;第二,對Go語言社區(qū)里的某些人不爽。毫無疑問,這是非常主觀的結(jié)論。轉(zhuǎn)載1.1 不允許左花括號(hào)另起一行1.2 編譯器莫名其妙地給行尾加上分號(hào)1.3 極度強(qiáng)調(diào)編譯速度,不惜放棄本應(yīng)提供的功能1.4 錯(cuò)誤處理機(jī)制太原始1.5 垃圾回收器(GC)不完善、有重大缺陷1.6 禁止未使用變量和多余import1.7 創(chuàng)建對象的方式太多令人糾結(jié)1.8 對象沒有構(gòu)造函數(shù)和析構(gòu)函數(shù)1.9 defer語句的語義設(shè)定不甚合理1.10 許多語言內(nèi)置設(shè)施不支持用戶定義的類型1.11 沒有泛型支持,常見數(shù)據(jù)類型接口丑陋1.12 實(shí)現(xiàn)接口不需要明確聲明1.13 省掉小括號(hào)卻省不掉花括號(hào)1.14 編譯生成的可執(zhí)行文件尺寸非常大1.15 不支持動(dòng)態(tài)加載類庫
1:go與c語言相比,go有垃圾回收,不會(huì)造成內(nèi)存泄露問題,go的語法簡潔優(yōu)美,同樣的c++100行代碼go大概50行可以做到,go的目標(biāo)是能做C++能做的事,雖然目前可能不太實(shí)際
2:go的并行機(jī)制并不是一般的線程,通過channel和goroutine來實(shí)現(xiàn),比線程還要輕量級很多,所以go適合高并發(fā)的服務(wù)器端
3:go是系統(tǒng)級別的語言,相當(dāng)于c語言,java c#都是算比較高級的語言,這個(gè)不太好比,效率的話目前確實(shí)是要高一些,而且不需要外部依賴,所以go還是很強(qiáng)大的
json是一種經(jīng)常使用的數(shù)據(jù)格式,下面總結(jié)一下json的使用
json與struct轉(zhuǎn)換的話struct的屬性必須首字母大寫。
當(dāng)用的多了就會(huì)發(fā)現(xiàn)一個(gè)致命的問題:go默認(rèn)會(huì)將特殊字符轉(zhuǎn)義采用以下方法可以解決:
處理方法1
處理方法2
不管是屬性組成的還是Tag組成的json字符串,都可以正常的解析
tag:
json:"-" // 表示不進(jìn)行序列化
IsOnSale bool json:"is_on_sale,string" //序列化后轉(zhuǎn)成string
ProductID int64 json:"product_id,omitempty" //為零值時(shí)忽略
序列化或者反序列化時(shí)可以指定類型,支持string,number和boolean
IsOnSale bool json:"is_on_sale,string"
注意:
正確使用第一個(gè),第二個(gè)回報(bào)錯(cuò)