這篇文章將為大家詳細講解有關(guān)高并發(fā)高性能服務(wù)器是怎么實現(xiàn)的,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關(guān)知識有一定的了解。
目前創(chuàng)新互聯(lián)建站已為成百上千家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)絡(luò)空間、網(wǎng)站托管、企業(yè)網(wǎng)站設(shè)計、尚志網(wǎng)站維護等服務(wù),公司將堅持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
說簡單也簡單,不就是一個用戶請求嗎?服務(wù)器根據(jù)請求從數(shù)據(jù)庫中撈出這篇文章,然后通過網(wǎng)絡(luò)發(fā)回去。
說復(fù)雜也復(fù)雜,服務(wù)器是如何并行處理成千上萬個用戶請求呢?這里面涉及到哪些技術(shù)呢?
多進程
歷史上最早出現(xiàn)也是最簡單的一種并行處理多個請求的方法就是利用多進程。
比如在Linux世界中,我們可以使用fork、exec等系統(tǒng)調(diào)用創(chuàng)建多個進程,我們可以在父進程中接收用戶的連接請求,然后創(chuàng)建子進程去處理用戶請求,就像這樣:
這種方法的優(yōu)點就在于:
編程簡單,非常容易理解
由于各個進程的地址空間是相互隔離的,因此一個進程崩潰后并不會影響其它進程
充分利用多核資源
多進程并行處理的優(yōu)點很明顯,但是缺點同樣明顯:
各個進程地址空間相互隔離,這一優(yōu)點也會變成缺點,那就是進程間要想通信就會變得比較困難,你需要借助進程間通信(IPC,interprocess communications)機制,想一想你現(xiàn)在知道哪些進程間通信機制,然后讓你用代碼實現(xiàn)呢?顯然,進程間通信編程相對復(fù)雜,而且性能也是一大問題
我們知道創(chuàng)建進程開銷是比線程要大的,頻繁的創(chuàng)建銷毀進程無疑會加重系統(tǒng)負擔(dān)。
幸好,除了進程,我們還有線程。
多線程
不是創(chuàng)建進程開銷大嗎?不是進程間通信困難嗎?這些對于線程來說統(tǒng)統(tǒng)不是問題。
什么?你還不了解線程,趕緊看看這篇《看完這篇還不懂線程與線程池你來打我》,這里詳細講解了線程這個概念是怎么來的。
由于線程共享進程地址空間,因此線程間通信天然不需要借助任何通信機制,直接讀取內(nèi)存就好了。
線程創(chuàng)建銷毀的開銷也變小了,要知道線程就像寄居蟹一樣,房子(地址空間)都是進程的,自己只是一個租客,因此非常的輕量級,創(chuàng)建銷毀的開銷也非常小。
我們可以為每個請求創(chuàng)建一個線程,即使一個線程因執(zhí)行I/O操作——比如讀取數(shù)據(jù)庫等——被阻塞暫停運行也不會影響到其它線程,就像這樣:
但線程就是完美的、包治百病的嗎,顯然,計算機世界從來沒有那么簡單。
由于線程共享進程地址空間,這在為線程間通信帶來便利的同時也帶來了無盡的麻煩。
正是由于線程間共享地址空間,因此一個線程崩潰會導(dǎo)致整個進程崩潰退出,同時線程間通信簡直太簡單了,簡單到線程間通信只需要直接讀取內(nèi)存就可以了,也簡單到出現(xiàn)問題也極其容易,死鎖、線程間的同步互斥、等等,這些極容易產(chǎn)生bug,無數(shù)程序員寶貴的時間就有相當一部分用來解決多線程帶來的無盡問題。
雖然線程也有缺點,但是相比多進程來說,線程更有優(yōu)勢,但想單純的利用多線程就能解決高并發(fā)問題也是不切實際的。
因為雖然線程創(chuàng)建開銷相比進程小,但依然也是有開銷的,對于動輒數(shù)萬數(shù)十萬的鏈接的高并發(fā)服務(wù)器來說,創(chuàng)建數(shù)萬個線程會有性能問題,這包括內(nèi)存占用、線程間切換,也就是調(diào)度的開銷。
因此,我們需要進一步思考。
Event Loop:事件驅(qū)動
到目前為止,我們提到“并行”二字就會想到進程、線程。但是,并行編程只能依賴這兩項技術(shù)嗎,并不是這樣的。
還有另一項并行技術(shù)廣泛應(yīng)用在GUI編程以及服務(wù)器編程中,這就是近幾年非常流行的事件驅(qū)動編程,event-based concurrency。
大家不要覺得這是一項很難懂的技術(shù),實際上事件驅(qū)動編程原理上非常簡單。
這一技術(shù)需要兩種原料:
event
處理event的函數(shù),這一函數(shù)通常被稱為event handler
剩下的就簡單了:
你只需要安靜的等待event到來就好,當event到來之后,檢查一下event的類型,并根據(jù)該類型找到對應(yīng)的event處理函數(shù),也就是event handler,然后直接調(diào)用該event handler就好了。
That's it !
以上就是事件驅(qū)動編程的全部內(nèi)容,是不是很簡單!
從上面的討論可以看到,我們需要不斷的接收event然后處理event,因此我們需要一個循環(huán)(用while或者for循環(huán)都可以),這個循環(huán)被稱為Event loop。
使用偽代碼表示就是這樣:
while(true) { event = getEvent(); handler(event); }
Event loop中要做的事情其實是非常簡單的,只需要等待event的帶來,然后調(diào)用相應(yīng)的event處理函數(shù)即可。
注意,這段代碼只需要運行在一個線程或者進程中,只需要這一個event loop就可以同時處理多個用戶請求。
有的同學(xué)可以依然不明白為什么這樣一個event loop可以同時處理多個請求呢?
原因很簡單,對于web服務(wù)器來說,處理一個用戶請求時大部分時間其實都用在了I/O操作上,像數(shù)據(jù)庫讀寫、文件讀寫、網(wǎng)絡(luò)讀寫等。當一個請求到來,簡單處理之后可能就需要查詢數(shù)據(jù)庫等I/O操作,我們知道I/O是非常慢的,當發(fā)起I/O后我們大可以不用等待該I/O操作完成就可以繼續(xù)處理接下來的用戶請求。
現(xiàn)在你應(yīng)該明白了吧,雖然上一個用戶請求還沒有處理完我們其實就可以處理下一個用戶請求了,這也是并行,這種并行就可以用事件驅(qū)動編程來處理。
這就好比餐廳服務(wù)員一樣,一個服務(wù)員不可能一直等上一個顧客下單、上菜、吃飯、買單之后才接待下一個顧客,服務(wù)員是怎么做的呢?當一個顧客下完單后直接處理下一個顧客,當顧客吃完飯后會自己回來買單結(jié)賬的。
看到了吧,同樣是一個服務(wù)員也可以同時處理多個顧客,這個服務(wù)員就相當于這里的Event loop,即使這個event loop只運行在一個線程(進程)中也可以同時處理多個用戶請求。
相信你已經(jīng)對事件驅(qū)動編程有一個清晰的認知了,那么接下來的問題就是事件驅(qū)動、事件驅(qū)動,那么這個事件也就是event該怎么獲取呢?
事件來源:IO多路復(fù)用
在《終于明白了,一文徹底理解I/O多路復(fù)用》這篇文章中我們知道,在Linux/Unix世界中一切皆文件,而我們的程序都是通過文件描述符來進行I/O操作的,當然對于socket也不例外,那我們該如何同時處理多個文件描述符呢?
IO多路復(fù)用技術(shù)正是用來解決這一問題的,通過IO多路復(fù)用技術(shù),我們一次可以監(jiān)控多個文件描述,當某個文件(socket)可讀或者可寫的時候我們就能得到通知啦。
這樣IO多路復(fù)用技術(shù)就成了event loop的原材料供應(yīng)商,源源不斷的給我們提供各種event,這樣關(guān)于event來源的問題就解決了。
當然關(guān)于IO多路復(fù)用技術(shù)的詳細講解請參見《終于明白了,一文徹底理解I/O多路復(fù)用》。
至此,關(guān)于利用事件驅(qū)動來實現(xiàn)并發(fā)編程的所有問題都解決了嗎?event的來源問題解決了,當?shù)玫絜vent后調(diào)用相應(yīng)的handler,看上去大功告成了。
想一想還有沒有其它問題?
問題:阻塞式IO
現(xiàn)在,我們可以使用一個線程(進程)就能基于事件驅(qū)動進行并行編程,再也沒有了多線程中讓人惱火的各種鎖、同步互斥、死鎖等問題了。
但是,計算機科學(xué)中從來沒有出現(xiàn)過一種能解決所有問題的技術(shù),現(xiàn)在沒有,在可預(yù)期的將來也不會有。
那上述方法有什么問題嗎?
不要忘了,我們event loop是運行在一個線程(進程),這雖然解決了多線程問題,但是如果在處理某個event時需要進行IO操作會怎么樣呢?
在《讀取文件時,程序經(jīng)歷了什么》一文中,我們講解了最常用的文件讀取在底層是如何實現(xiàn)的,程序員最常用的這種IO方式被稱為阻塞式IO,也就是說,當我們進行IO操作,比如讀取文件時,如果文件沒有讀取完成,那么我們的程序(線程)會被阻塞而暫停執(zhí)行,這在多線程中不是問題,因為操作系統(tǒng)還可以調(diào)度其它線程。
但是在單線程的event loop中是有問題的,原因就在于當我們在event loop中執(zhí)行阻塞式IO操作時整個線程(event loop)會被暫停運行,這時操作系統(tǒng)將沒有其它線程可以調(diào)度,因為系統(tǒng)中只有一個event loop在處理用戶請求,這樣當event loop線程被阻塞暫停運行時所有用戶請求都沒有辦法被處理,你能想象當服務(wù)器在處理其它用戶請求讀取數(shù)據(jù)庫導(dǎo)致你的請求被暫停嗎?
因此,在基于事件驅(qū)動編程時有一條注意事項,那就是不允許發(fā)起阻塞式IO。
有的同學(xué)可能會問,如果不能發(fā)起阻塞式IO的話,那么該怎樣進行IO操作呢?
有阻塞式IO,就有非阻塞式IO。
非阻塞IO
為克服阻塞式IO所帶來的問題,現(xiàn)代操作系統(tǒng)開始提供一種新的發(fā)起IO請求的方法,這種方法就是異步IO,對應(yīng)的,阻塞式IO就是同步IO,關(guān)于同步和異步這兩個概念可以參考《從小白到高手,你需要理解同步與異步》。
異步IO時,假設(shè)調(diào)用aio_read函數(shù)(具體的異步IO API請參考具體的操作系統(tǒng)平臺),也就是異步讀取,當我們調(diào)用該函數(shù)后可以立即返回,并繼續(xù)其它事情,雖然此時該文件可能還沒有被讀取,這樣就不會阻塞調(diào)用線程了。此外,操作系統(tǒng)還會提供其它方法供調(diào)用線程來檢測IO操作是否完成。
就這樣,在操作系統(tǒng)的幫助下IO的阻塞調(diào)用問題也解決了。
基于事件編程的難點
雖然有異步IO來解決event loop可能被阻塞的問題,但是基于事件編程依然是困難的。
首先,我們提到,event loop是運行在一個線程中的,顯然一個線程是沒有辦法充分利用多核資源的,有的同學(xué)可能會說那就創(chuàng)建多個event loop實例不就可以了,這樣就有多個event loop線程了,但是這樣一來多線程問題又會出現(xiàn)。
另一點在于編程方面,在《從小白到高手,你需要理解同步與異步》這篇文章中我們講到過,異步編程需要結(jié)合回調(diào)函數(shù)(關(guān)于回調(diào)函數(shù)請才參考《程序員應(yīng)如何徹底理解回調(diào)函數(shù)》),這種編程方式需要把處理邏輯分為兩部分,一部分調(diào)用方自己處理,另一部分在回調(diào)函數(shù)中處理,這一編程方式的改變加重了程序員在理解上的負擔(dān),基于事件編程的項目后期會很難擴展以及維護。
那么有沒有更好的方法呢?
要找到更好的方法,我們需要解決問題的本質(zhì),那么這個本質(zhì)問題是什么呢?
更好的方法
為什么我們要使用異步這種難以理解的方式編程呢?
是因為阻塞式編程雖然容易理解但會導(dǎo)致線程被阻塞而暫停運行。
那么聰明的你一定會問了,有沒有一種方法既能結(jié)合同步IO的簡單理解又不會因同步調(diào)用導(dǎo)致線程被阻塞呢?
答案是肯定的,這就是用戶態(tài)線程,user level thread,也就是大名鼎鼎的協(xié)程,關(guān)于協(xié)程值得單獨拿出一篇文章來講解,就在下一篇。
雖然基于事件編程有這樣那樣的缺點,但是在當今的高性能高并發(fā)服務(wù)器上基于事件編程方式依然非常流行,但已經(jīng)不是純粹的基于單一線程的事件驅(qū)動了,而是event loop + multi thread + user level thread。
關(guān)于高并發(fā)高性能服務(wù)器是怎么實現(xiàn)的就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。