福哥答案2020-08-20:
讓客戶滿意是我們工作的目標,不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價值的長期合作伙伴,公司提供的服務(wù)項目有:主機域名、虛擬空間、營銷軟件、網(wǎng)站建設(shè)、渭源網(wǎng)站維護、網(wǎng)站推廣。
1.golang的協(xié)程是基于gpm機制,是可以多核多線程的。Python的協(xié)程是eventloop模型(IO多路復(fù)用技術(shù))實現(xiàn),協(xié)程是嚴格的 1:N 關(guān)系,也就是一個線程對應(yīng)了多個協(xié)程。雖然可以實現(xiàn)異步I/O,但是不能有效利用多核(GIL)。
2.golang用go func。python用import asyncio,async/await表達式。
評論
Goroutine調(diào)度是一個很復(fù)雜的機制,下面嘗試用簡單的語言描述一下Goroutine調(diào)度機制,想要對其有更深入的了解可以去研讀一下源碼。
首先介紹一下GMP什么意思:
G ----------- goroutine: 即Go協(xié)程,每個go關(guān)鍵字都會創(chuàng)建一個協(xié)程。
M ---------- thread內(nèi)核級線程,所有的G都要放在M上才能運行。
P ----------- processor處理器,調(diào)度G到M上,其維護了一個隊列,存儲了所有需要它來調(diào)度的G。
Goroutine 調(diào)度器P和 OS 調(diào)度器是通過 M 結(jié)合起來的,每個 M 都代表了 1 個內(nèi)核線程,OS 調(diào)度器負責把內(nèi)核線程分配到 CPU 的核上執(zhí)行
模型圖:
避免頻繁的創(chuàng)建、銷毀線程,而是對線程的復(fù)用。
1)work stealing機制
當本線程無可運行的G時,嘗試從其他線程綁定的P偷取G,而不是銷毀線程。
2)hand off機制
當本線程M0因為G0進行系統(tǒng)調(diào)用阻塞時,線程釋放綁定的P,把P轉(zhuǎn)移給其他空閑的線程執(zhí)行。進而某個空閑的M1獲取P,繼續(xù)執(zhí)行P隊列中剩下的G。而M0由于陷入系統(tǒng)調(diào)用而進被阻塞,M1接替M0的工作,只要P不空閑,就可以保證充分利用CPU。M1的來源有可能是M的緩存池,也可能是新建的。當G0系統(tǒng)調(diào)用結(jié)束后,根據(jù)M0是否能獲取到P,將會將G0做不同的處理:
如果有空閑的P,則獲取一個P,繼續(xù)執(zhí)行G0。
如果沒有空閑的P,則將G0放入全局隊列,等待被其他的P調(diào)度。然后M0將進入緩存池睡眠。
如下圖
GOMAXPROCS設(shè)置P的數(shù)量,最多有GOMAXPROCS個線程分布在多個CPU上同時運行
在Go中一個goroutine最多占用CPU 10ms,防止其他goroutine被餓死。
具體可以去看另一篇文章
【Golang詳解】go語言調(diào)度機制 搶占式調(diào)度
當創(chuàng)建一個新的G之后優(yōu)先加入本地隊列,如果本地隊列滿了,會將本地隊列的G移動到全局隊列里面,當M執(zhí)行work stealing從其他P偷不到G時,它可以從全局G隊列獲取G。
協(xié)程經(jīng)歷過程
我們創(chuàng)建一個協(xié)程 go func()經(jīng)歷過程如下圖:
說明:
這里有兩個存儲G的隊列,一個是局部調(diào)度器P的本地隊列、一個是全局G隊列。新創(chuàng)建的G會先保存在P的本地隊列中,如果P的本地隊列已經(jīng)滿了就會保存在全局的隊列中;處理器本地隊列是一個使用數(shù)組構(gòu)成的環(huán)形鏈表,它最多可以存儲 256 個待執(zhí)行任務(wù)。
G只能運行在M中,一個M必須持有一個P,M與P是1:1的關(guān)系。M會從P的本地隊列彈出一個可執(zhí)行狀態(tài)的G來執(zhí)行,如果P的本地隊列為空,就會想其他的MP組合偷取一個可執(zhí)行的G來執(zhí)行;
一個M調(diào)度G執(zhí)行的過程是一個循環(huán)機制;會一直從本地隊列或全局隊列中獲取G
上面說到P的個數(shù)默認等于CPU核數(shù),每個M必須持有一個P才可以執(zhí)行G,一般情況下M的個數(shù)會略大于P的個數(shù),這多出來的M將會在G產(chǎn)生系統(tǒng)調(diào)用時發(fā)揮作用。類似線程池,Go也提供一個M的池子,需要時從池子中獲取,用完放回池子,不夠用時就再創(chuàng)建一個。
work-stealing調(diào)度算法:當M執(zhí)行完了當前P的本地隊列隊列里的所有G后,P也不會就這么在那躺尸啥都不干,它會先嘗試從全局隊列隊列尋找G來執(zhí)行,如果全局隊列為空,它會隨機挑選另外一個P,從它的隊列里中拿走一半的G到自己的隊列中執(zhí)行。
如果一切正常,調(diào)度器會以上述的那種方式順暢地運行,但這個世界沒這么美好,總有意外發(fā)生,以下分析goroutine在兩種例外情況下的行為。
Go runtime會在下面的goroutine被阻塞的情況下運行另外一個goroutine:
用戶態(tài)阻塞/喚醒
當goroutine因為channel操作或者network I/O而阻塞時(實際上golang已經(jīng)用netpoller實現(xiàn)了goroutine網(wǎng)絡(luò)I/O阻塞不會導(dǎo)致M被阻塞,僅阻塞G,這里僅僅是舉個栗子),對應(yīng)的G會被放置到某個wait隊列(如channel的waitq),該G的狀態(tài)由_Gruning變?yōu)開Gwaitting,而M會跳過該G嘗試獲取并執(zhí)行下一個G,如果此時沒有可運行的G供M運行,那么M將解綁P,并進入sleep狀態(tài);當阻塞的G被另一端的G2喚醒時(比如channel的可讀/寫通知),G被標記為,嘗試加入G2所在P的runnext(runnext是線程下一個需要執(zhí)行的 Goroutine。), 然后再是P的本地隊列和全局隊列。
系統(tǒng)調(diào)用阻塞
當M執(zhí)行某一個G時候如果發(fā)生了阻塞操作,M會阻塞,如果當前有一些G在執(zhí)行,調(diào)度器會把這個線程M從P中摘除,然后再創(chuàng)建一個新的操作系統(tǒng)的線程(如果有空閑的線程可用就復(fù)用空閑線程)來服務(wù)于這個P。當M系統(tǒng)調(diào)用結(jié)束時候,這個G會嘗試獲取一個空閑的P執(zhí)行,并放入到這個P的本地隊列。如果獲取不到P,那么這個線程M變成休眠狀態(tài), 加入到空閑線程中,然后這個G會被放入全局隊列中。
隊列輪轉(zhuǎn)
可見每個P維護著一個包含G的隊列,不考慮G進入系統(tǒng)調(diào)用或IO操作的情況下,P周期性的將G調(diào)度到M中執(zhí)行,執(zhí)行一小段時間,將上下文保存下來,然后將G放到隊列尾部,然后從隊列中重新取出一個G進行調(diào)度。
除了每個P維護的G隊列以外,還有一個全局的隊列,每個P會周期性地查看全局隊列中是否有G待運行并將其調(diào)度到M中執(zhí)行,全局隊列中G的來源,主要有從系統(tǒng)調(diào)用中恢復(fù)的G。之所以P會周期性地查看全局隊列,也是為了防止全局隊列中的G被餓死。
除了每個P維護的G隊列以外,還有一個全局的隊列,每個P會周期性地查看全局隊列中是否有G待運行并將其調(diào)度到M中執(zhí)行,全局隊列中G的來源,主要有從系統(tǒng)調(diào)用中恢復(fù)的G。之所以P會周期性地查看全局隊列,也是為了防止全局隊列中的G被餓死。
M0
M0是啟動程序后的編號為0的主線程,這個M對應(yīng)的實例會在全局變量rutime.m0中,不需要在heap上分配,M0負責執(zhí)行初始化操作和啟動第一個G,在之后M0就和其他的M一樣了
G0
G0是每次啟動一個M都會第一個創(chuàng)建的goroutine,G0僅用于負責調(diào)度G,G0不指向任何可執(zhí)行的函數(shù),每個M都會有一個自己的G0,在調(diào)度或系統(tǒng)調(diào)用時會使用G0的??臻g,全局變量的G0是M0的G0
一個G由于調(diào)度被中斷,此后如何恢復(fù)?
中斷的時候?qū)⒓拇嫫骼锏臈P畔ⅲ4娴阶约旱腉對象里面。當再次輪到自己執(zhí)行時,將自己保存的棧信息復(fù)制到寄存器里面,這樣就接著上次之后運行了。
我這里只是根據(jù)自己的理解進行了簡單的介紹,想要詳細了解有關(guān)GMP的底層原理可以去看Go調(diào)度器 G-P-M 模型的設(shè)計者的文檔或直接看源碼
參考: ()
()
golang中最大協(xié)程數(shù)的限制
golang中有最大協(xié)程數(shù)的限制嗎?如果有的話,是通過什么參數(shù)控制呢?還是通過每個協(xié)程占用的資源計算?
通過channel控制協(xié)程數(shù)的就忽略吧。
以我的理解,計算機資源肯定是有限的,所以goroutine肯定也是有限制的,單純的goroutine,一開始每個占用4K內(nèi)存,所以這里會受到內(nèi)存使用量的限制,還有g(shù)oroutine是通過系統(tǒng)線程來執(zhí)行的,golang默認最大的線程數(shù)是10000個??梢酝ㄟ^
來修改。但要注意線程和goroutine不是一一對應(yīng)關(guān)系,理論上內(nèi)存足夠大,而且goroutine不是計算密集型的話,可以開啟無限個goroutine。
golang學(xué)習(xí)筆記
頻繁創(chuàng)建線程會造成不必要的開銷,所以才有了線程池。在線程池中預(yù)先保存一定數(shù)量的線程,新任務(wù)發(fā)布到任務(wù)隊列,線程池中的線程不斷地從任務(wù)隊列中取出任務(wù)并執(zhí)行,可以有效的減少創(chuàng)建和銷毀帶來的開銷。
過多的線程會導(dǎo)致爭搶cpu資源,且上下文的切換的開銷變大。而工作在用戶態(tài)的協(xié)程能大大減少上下文切換的開銷。協(xié)程調(diào)度器把可運行的協(xié)程逐個調(diào)度到線程中執(zhí)行,同時即時把阻塞的協(xié)程調(diào)度出協(xié)程,從而有效地避免了線程的頻繁切換,達到了少量線程實現(xiàn)高并發(fā)的效果。
多個協(xié)程分享操作系統(tǒng)分給線程的時間片,從而達到充分利用CPU的目的,協(xié)程調(diào)度器決定了則決定了協(xié)程運行的順序。每個線程同一時刻只能運行一個協(xié)程。
go調(diào)度模型包含三個實體:
每個處理器維護者一個協(xié)程G的隊列,處理器依次將協(xié)程G調(diào)度到M中執(zhí)行。
每個P會周期性地查看全局隊列中是否有G待運行并將其調(diào)度到M中執(zhí)行,全局隊列中的G主要來自系統(tǒng)調(diào)用中恢復(fù)的G.
如果協(xié)程發(fā)起系統(tǒng)調(diào)用,則整個工作線程M被阻塞,協(xié)程隊列中的其他協(xié)程都會阻塞。
一般情況下M的個數(shù)會略大于P個數(shù),多出來的M將會在G產(chǎn)生系統(tǒng)調(diào)用時發(fā)揮作用。與線程池類似,Go也提供M池子。當協(xié)程G1發(fā)起系統(tǒng)掉用時,M1會釋放P,由 M1-P-G1 G2 ... 轉(zhuǎn)變成 M1-G1 , M2會接管P的其他協(xié)程 M2-P-G2 G3 G4... 。
冗余的M可能來源于緩存池,也可能是新建的。
當G1結(jié)束系統(tǒng)調(diào)用后,根據(jù)M1是否獲取到P,進行不用的處理。
多個處理P維護隊列可能不均衡,導(dǎo)致部分處理器非常繁忙,而其余相對空閑。產(chǎn)生原因是有些協(xié)程自身不斷地派生協(xié)程。
為此Go調(diào)度器提供了工作量竊取策略,當某個處理器P沒有需要調(diào)度的協(xié)程時,將從其他處理中偷取協(xié)程,每次偷取一半。
搶占式調(diào)度,是指避免某個協(xié)程長時間執(zhí)行,而阻礙其他協(xié)程被調(diào)度的機制。
調(diào)度器監(jiān)控每個協(xié)程執(zhí)行時間,一旦執(zhí)行時間過長且有其他協(xié)程等待,會把協(xié)程暫停,轉(zhuǎn)而調(diào)度等待的協(xié)程,以達到類似時間片輪轉(zhuǎn)的效果。比如for循環(huán)會一直占用執(zhí)行權(quán)。
在IO密集型應(yīng)用,GOMAXPROCS大小設(shè)置大一些,獲取性能會更好。
IO密集型會經(jīng)常發(fā)生系統(tǒng)調(diào)用,會有一個新的M啟用或創(chuàng)建,但由于Go調(diào)度器檢測M到被阻塞有一定延遲。如果P數(shù)量多,則P管理協(xié)程隊列會變小。
有以下方法:
方法一:使用帶有緩沖的channel的特性
直到緩沖區(qū)被填滿后,寫端才會阻塞。
緩沖區(qū)被讀空,讀端才會阻塞。
代碼中channel數(shù)據(jù)結(jié)構(gòu)為什么定義struct?
因為空結(jié)構(gòu)體變量的內(nèi)存占用大小為0,而bool類型內(nèi)存占用大小為1,這樣可以更加最大化利用我們服務(wù)器的內(nèi)存空間。
方法二:使用sync.WaitGroup
WaitGroup對象內(nèi)部有一個計數(shù)器,最初從0開始,它有三個方法:Add(),Done(),Wait()用來控制計數(shù)器的數(shù)量。