1.python中數(shù)據(jù)類型,int,float,復(fù)數(shù),字符,元組,做全局變量時(shí)需要在函數(shù)里面用global申明變量,才能對(duì)變量進(jìn)行操作。
我們提供的服務(wù)有:成都網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)、微信公眾號(hào)開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、泉山ssl等。為數(shù)千家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務(wù),是有科學(xué)管理、有技術(shù)的泉山網(wǎng)站制作公司
而,對(duì)象,列表,詞典,不需要聲明,直接就是全局的。
2.線程鎖mutex=threading.Lock()
創(chuàng)建后就是全局的。線程調(diào)用函數(shù)可以直接在函數(shù)中使用。
mutex.acquire()開啟鎖
mutex=release()關(guān)閉鎖
要注意,死鎖的情況發(fā)生。
注意運(yùn)行效率的變化:
正常1秒,完成56997921
加鎖之后,1秒只運(yùn)行了531187,相差10倍多。
3.繼承.threading.Thread的類,無法調(diào)用__init__函數(shù),無法在創(chuàng)建對(duì)象時(shí)初始化新建的屬性。
4.線程在cpu的執(zhí)行,有隨機(jī)性
5. 新建線程時(shí),需要傳參數(shù)時(shí),args是一個(gè)元組,如果只有一個(gè)參數(shù),一定后面要加一個(gè),符號(hào)。不能只有一個(gè)參數(shù)否則線程會(huì)報(bào)創(chuàng)建參數(shù)錯(cuò)誤。threading.Thread(target=fuc,args=(arg,))
使用Python中的線程模塊,能夠同時(shí)運(yùn)行程序的不同部分,并簡(jiǎn)化設(shè)計(jì)。如果你已經(jīng)入門Python,并且想用線程來提升程序運(yùn)行速度的話,希望這篇教程會(huì)對(duì)你有所幫助。
線程與進(jìn)程
什么是進(jìn)程
進(jìn)程是系統(tǒng)進(jìn)行資源分配和調(diào)度的一個(gè)獨(dú)立單位 進(jìn)程是具有一定獨(dú)立功能的程序關(guān)于某個(gè)數(shù)據(jù)集合上的一次運(yùn)行活動(dòng),進(jìn)程是系統(tǒng)進(jìn)行資源分配和調(diào)度的一個(gè)獨(dú)立單位。每個(gè)進(jìn)程都有自己的獨(dú)立內(nèi)存空間,不同進(jìn)程通過進(jìn)程間通信來通信。由于進(jìn)程比較重量,占據(jù)獨(dú)立的內(nèi)存,所以上下文進(jìn)程間的切換開銷(棧、寄存器、虛擬內(nèi)存、文件句柄等)比較大,但相對(duì)比較穩(wěn)定安全。
什么是線程
CPU調(diào)度和分派的基本單位 線程是進(jìn)程的一個(gè)實(shí)體,是CPU調(diào)度和分派的基本單位,它是比進(jìn)程更小的能獨(dú)立運(yùn)行的基本單位.線程自己基本上不擁有系統(tǒng)資源,只擁有一點(diǎn)在運(yùn)行中必不可少的資源(如程序計(jì)數(shù)器,一組寄存器和棧),但是它可與同屬一個(gè)進(jìn)程的其他的線程共享進(jìn)程所擁有的全部資源。線程間通信主要通過共享內(nèi)存,上下文切換很快,資源開銷較少,但相比進(jìn)程不夠穩(wěn)定容易丟失數(shù)據(jù)。
進(jìn)程與線程的關(guān)系圖
線程與進(jìn)程的區(qū)別:
進(jìn)程
現(xiàn)實(shí)生活中,有很多的場(chǎng)景中的事情是同時(shí)進(jìn)行的,比如開車的時(shí)候 手和腳共同來駕駛 汽車 ,比如唱歌跳舞也是同時(shí)進(jìn)行的,再比如邊吃飯邊打電話;試想如果我們吃飯的時(shí)候有一個(gè)領(lǐng)導(dǎo)來電,我們肯定是立刻就接聽了。但是如果你吃完飯?jiān)俳勇牷蛘呋仉娫?,很可能?huì)被開除。
注意:
多任務(wù)的概念
什么叫 多任務(wù) 呢?簡(jiǎn)單地說,就是操作系統(tǒng)可以同時(shí)運(yùn)行多個(gè)任務(wù)。打個(gè)比方,你一邊在用瀏覽器上網(wǎng),一邊在聽MP3,一邊在用Word趕作業(yè),這就是多任務(wù),至少同時(shí)有3個(gè)任務(wù)正在運(yùn)行。還有很多任務(wù)悄悄地在后臺(tái)同時(shí)運(yùn)行著,只是桌面上沒有顯示而已。
現(xiàn)在,多核CPU已經(jīng)非常普及了,但是,即使過去的單核CPU,也可以執(zhí)行多任務(wù)。由于CPU執(zhí)行代碼都是順序執(zhí)行的,那么,單核CPU是怎么執(zhí)行多任務(wù)的呢?
答案就是操作系統(tǒng)輪流讓各個(gè)任務(wù)交替執(zhí)行,任務(wù)1執(zhí)行0.01秒,切換到任務(wù)2,任務(wù)2執(zhí)行0.01秒,再切換到任務(wù)3,執(zhí)行0.01秒,這樣反復(fù)執(zhí)行下去。表面上看,每個(gè)任務(wù)都是交替執(zhí)行的,但是,由于CPU的執(zhí)行速度實(shí)在是太快了,我們感覺就像所有任務(wù)都在同時(shí)執(zhí)行一樣。
真正的并行執(zhí)行多任務(wù)只能在多核CPU上實(shí)現(xiàn),但是,由于任務(wù)數(shù)量遠(yuǎn)遠(yuǎn)多于CPU的核心數(shù)量,所以,操作系統(tǒng)也會(huì)自動(dòng)把很多任務(wù)輪流調(diào)度到每個(gè)核心上執(zhí)行。 其實(shí)就是CPU執(zhí)行速度太快啦!以至于我們感受不到在輪流調(diào)度。
并行與并發(fā)
并行(Parallelism)
并行:指兩個(gè)或兩個(gè)以上事件(或線程)在同一時(shí)刻發(fā)生,是真正意義上的不同事件或線程在同一時(shí)刻,在不同CPU資源呢上(多核),同時(shí)執(zhí)行。
特點(diǎn)
并發(fā)(Concurrency)
指一個(gè)物理CPU(也可以多個(gè)物理CPU) 在若干道程序(或線程)之間多路復(fù)用,并發(fā)性是對(duì)有限物理資源強(qiáng)制行使多用戶共享以提高效率。
特點(diǎn)
multiprocess.Process模塊
process模塊是一個(gè)創(chuàng)建進(jìn)程的模塊,借助這個(gè)模塊,就可以完成進(jìn)程的創(chuàng)建。
語法:Process([group [, target [, name [, args [, kwargs]]]]])
由該類實(shí)例化得到的對(duì)象,表示一個(gè)子進(jìn)程中的任務(wù)(尚未啟動(dòng))。
注意:1. 必須使用關(guān)鍵字方式來指定參數(shù);2. args指定的為傳給target函數(shù)的位置參數(shù),是一個(gè)元祖形式,必須有逗號(hào)。
參數(shù)介紹:
group:參數(shù)未使用,默認(rèn)值為None。
target:表示調(diào)用對(duì)象,即子進(jìn)程要執(zhí)行的任務(wù)。
args:表示調(diào)用的位置參數(shù)元祖。
kwargs:表示調(diào)用對(duì)象的字典。如kwargs = {'name':Jack, 'age':18}。
name:子進(jìn)程名稱。
代碼:
除了上面這些開啟進(jìn)程的方法之外,還有一種以繼承Process的方式開啟進(jìn)程的方式:
通過上面的研究,我們千方百計(jì)實(shí)現(xiàn)了程序的異步,讓多個(gè)任務(wù)可以同時(shí)在幾個(gè)進(jìn)程中并發(fā)處理,他們之間的運(yùn)行沒有順序,一旦開啟也不受我們控制。盡管并發(fā)編程讓我們能更加充分的利用IO資源,但是也給我們帶來了新的問題。
當(dāng)多個(gè)進(jìn)程使用同一份數(shù)據(jù)資源的時(shí)候,就會(huì)引發(fā)數(shù)據(jù)安全或順序混亂問題,我們可以考慮加鎖,我們以模擬搶票為例,來看看數(shù)據(jù)安全的重要性。
加鎖可以保證多個(gè)進(jìn)程修改同一塊數(shù)據(jù)時(shí),同一時(shí)間只能有一個(gè)任務(wù)可以進(jìn)行修改,即串行的修改。加鎖犧牲了速度,但是卻保證了數(shù)據(jù)的安全。
因此我們最好找尋一種解決方案能夠兼顧:1、效率高(多個(gè)進(jìn)程共享一塊內(nèi)存的數(shù)據(jù))2、幫我們處理好鎖問題。
mutiprocessing模塊為我們提供的基于消息的IPC通信機(jī)制:隊(duì)列和管道。隊(duì)列和管道都是將數(shù)據(jù)存放于內(nèi)存中 隊(duì)列又是基于(管道+鎖)實(shí)現(xiàn)的,可以讓我們從復(fù)雜的鎖問題中解脫出來, 我們應(yīng)該盡量避免使用共享數(shù)據(jù),盡可能使用消息傳遞和隊(duì)列,避免處理復(fù)雜的同步和鎖問題,而且在進(jìn)程數(shù)目增多時(shí),往往可以獲得更好的可獲展性( 后續(xù)擴(kuò)展該內(nèi)容 )。
線程
Python的threading模塊
Python 供了幾個(gè)用于多線程編程的模塊,包括 thread, threading 和 Queue 等。thread 和 threading 模塊允許程序員創(chuàng)建和管理線程。thread 模塊 供了基本的線程和鎖的支持,而 threading 供了更高級(jí)別,功能更強(qiáng)的線程管理的功能。Queue 模塊允許用戶創(chuàng)建一個(gè)可以用于多個(gè)線程之間 共享數(shù)據(jù)的隊(duì)列數(shù)據(jù)結(jié)構(gòu)。
python創(chuàng)建和執(zhí)行線程
創(chuàng)建線程代碼
1. 創(chuàng)建方法一:
2. 創(chuàng)建方法二:
進(jìn)程和線程都是實(shí)現(xiàn)多任務(wù)的一種方式,例如:在同一臺(tái)計(jì)算機(jī)上能同時(shí)運(yùn)行多個(gè)QQ(進(jìn)程),一個(gè)QQ可以打開多個(gè)聊天窗口(線程)。資源共享:進(jìn)程不能共享資源,而線程共享所在進(jìn)程的地址空間和其他資源,同時(shí),線程有自己的棧和棧指針。所以在一個(gè)進(jìn)程內(nèi)的所有線程共享全局變量,但多線程對(duì)全局變量的更改會(huì)導(dǎo)致變量值得混亂。
代碼演示:
得到的結(jié)果是:
首先需要明確的一點(diǎn)是GIL并不是Python的特性,它是在實(shí)現(xiàn)Python解析器(CPython)時(shí)所引入的一個(gè)概念。就好比C++是一套語言(語法)標(biāo)準(zhǔn),但是可以用不同的編譯器來編譯成可執(zhí)行代碼。同樣一段代碼可以通過CPython,PyPy,Psyco等不同的Python執(zhí)行環(huán)境來執(zhí)行(其中的JPython就沒有GIL)。
那么CPython實(shí)現(xiàn)中的GIL又是什么呢?GIL全稱Global Interpreter Lock為了避免誤導(dǎo),我們還是來看一下官方給出的解釋:
主要意思為:
因此,解釋器實(shí)際上被一個(gè)全局解釋器鎖保護(hù)著,它確保任何時(shí)候都只有一個(gè)Python線程執(zhí)行。在多線程環(huán)境中,Python 虛擬機(jī)按以下方式執(zhí)行:
由于GIL的存在,Python的多線程不能稱之為嚴(yán)格的多線程。因?yàn)? 多線程下每個(gè)線程在執(zhí)行的過程中都需要先獲取GIL,保證同一時(shí)刻只有一個(gè)線程在運(yùn)行。
由于GIL的存在,即使是多線程,事實(shí)上同一時(shí)刻只能保證一個(gè)線程在運(yùn)行, 既然這樣多線程的運(yùn)行效率不就和單線程一樣了嗎,那為什么還要使用多線程呢?
由于以前的電腦基本都是單核CPU,多線程和單線程幾乎看不出差別,可是由于計(jì)算機(jī)的迅速發(fā)展,現(xiàn)在的電腦幾乎都是多核CPU了,最少也是兩個(gè)核心數(shù)的,這時(shí)差別就出來了:通過之前的案例我們已經(jīng)知道,即使在多核CPU中,多線程同一時(shí)刻也只有一個(gè)線程在運(yùn)行,這樣不僅不能利用多核CPU的優(yōu)勢(shì),反而由于每個(gè)線程在多個(gè)CPU上是交替執(zhí)行的,導(dǎo)致在不同CPU上切換時(shí)造成資源的浪費(fèi),反而會(huì)更慢。即原因是一個(gè)進(jìn)程只存在一把gil鎖,當(dāng)在執(zhí)行多個(gè)線程時(shí),內(nèi)部會(huì)爭(zhēng)搶gil鎖,這會(huì)造成當(dāng)某一個(gè)線程沒有搶到鎖的時(shí)候會(huì)讓cpu等待,進(jìn)而不能合理利用多核cpu資源。
但是在使用多線程抓取網(wǎng)頁內(nèi)容時(shí),遇到IO阻塞時(shí),正在執(zhí)行的線程會(huì)暫時(shí)釋放GIL鎖,這時(shí)其它線程會(huì)利用這個(gè)空隙時(shí)間,執(zhí)行自己的代碼,因此多線程抓取比單線程抓取性能要好,所以我們還是要使用多線程的。
GIL對(duì)多線程Python程序的影響
程序的性能受到計(jì)算密集型(CPU)的程序限制和I/O密集型的程序限制影響,那什么是計(jì)算密集型和I/O密集型程序呢?
計(jì)算密集型:要進(jìn)行大量的數(shù)值計(jì)算,例如進(jìn)行上億的數(shù)字計(jì)算、計(jì)算圓周率、對(duì)視頻進(jìn)行高清解碼等等。這種計(jì)算密集型任務(wù)雖然也可以用多任務(wù)完成,但是花費(fèi)的主要時(shí)間在任務(wù)切換的時(shí)間,此時(shí)CPU執(zhí)行任務(wù)的效率比較低。
IO密集型:涉及到網(wǎng)絡(luò)請(qǐng)求(time.sleep())、磁盤IO的任務(wù)都是IO密集型任務(wù),這類任務(wù)的特點(diǎn)是CPU消耗很少,任務(wù)的大部分時(shí)間都在等待IO操作完成(因?yàn)镮O的速度遠(yuǎn)遠(yuǎn)低于CPU和內(nèi)存的速度)。對(duì)于IO密集型任務(wù),任務(wù)越多,CPU效率越高,但也有一個(gè)限度。
當(dāng)然為了避免GIL對(duì)我們程序產(chǎn)生影響,我們也可以使用,線程鎖。
LockRLock
常用的資源共享鎖機(jī)制:有Lock、RLock、Semphore、Condition等,簡(jiǎn)單給大家分享下Lock和RLock。
Lock
特點(diǎn)就是執(zhí)行速度慢,但是保證了數(shù)據(jù)的安全性
RLock
使用鎖代碼操作不當(dāng)就會(huì)產(chǎn)生死鎖的情況。
什么是死鎖
死鎖:當(dāng)線程A持有獨(dú)占鎖a,并嘗試去獲取獨(dú)占鎖b的同時(shí),線程B持有獨(dú)占鎖b,并嘗試獲取獨(dú)占鎖a的情況下,就會(huì)發(fā)生AB兩個(gè)線程由于互相持有對(duì)方需要的鎖,而發(fā)生的阻塞現(xiàn)象,我們稱為死鎖。即死鎖是指多個(gè)進(jìn)程因競(jìng)爭(zhēng)資源而造成的一種僵局,若無外力作用,這些進(jìn)程都將無法向前推進(jìn)。
所以,在系統(tǒng)設(shè)計(jì)、進(jìn)程調(diào)度等方面注意如何不讓這四個(gè)必要條件成立,如何確定資源的合理分配算法,避免進(jìn)程永久占據(jù)系統(tǒng)資源。
死鎖代碼
python線程間通信
如果各個(gè)線程之間各干各的,確實(shí)不需要通信,這樣的代碼也十分的簡(jiǎn)單。但這一般是不可能的,至少線程要和主線程進(jìn)行通信,不然計(jì)算結(jié)果等內(nèi)容無法取回。而實(shí)際情況中要復(fù)雜的多,多個(gè)線程間需要交換數(shù)據(jù),才能得到正確的執(zhí)行結(jié)果。
python中Queue是消息隊(duì)列,提供線程間通信機(jī)制,python3中重名為為queue,queue模塊塊下提供了幾個(gè)阻塞隊(duì)列,這些隊(duì)列主要用于實(shí)現(xiàn)線程通信。
在 queue 模塊下主要提供了三個(gè)類,分別代表三種隊(duì)列,它們的主要區(qū)別就在于進(jìn)隊(duì)列、出隊(duì)列的不同。
簡(jiǎn)單代碼演示
此時(shí)代碼會(huì)阻塞,因?yàn)閝ueue中內(nèi)容已滿,此時(shí)可以在第四個(gè)queue.put('蘋果')后面添加timeout,則成為 queue.put('蘋果',timeout=1)如果等待1秒鐘仍然是滿的就會(huì)拋出異常,可以捕獲異常。
同理如果隊(duì)列是空的,無法獲取到內(nèi)容默認(rèn)也會(huì)阻塞,如果不阻塞可以使用queue.get_nowait()。
在掌握了 Queue 阻塞隊(duì)列的特性之后,在下面程序中就可以利用 Queue 來實(shí)現(xiàn)線程通信了。
下面演示一個(gè)生產(chǎn)者和一個(gè)消費(fèi)者,當(dāng)然都可以多個(gè)
使用queue模塊,可在線程間進(jìn)行通信,并保證了線程安全。
協(xié)程
協(xié)程,又稱微線程,纖程。英文名Coroutine。
協(xié)程是python個(gè)中另外一種實(shí)現(xiàn)多任務(wù)的方式,只不過比線程更小占用更小執(zhí)行單元(理解為需要的資源)。為啥說它是一個(gè)執(zhí)行單元,因?yàn)樗詭PU上下文。這樣只要在合適的時(shí)機(jī), 我們可以把一個(gè)協(xié)程 切換到另一個(gè)協(xié)程。只要這個(gè)過程中保存或恢復(fù) CPU上下文那么程序還是可以運(yùn)行的。
通俗的理解:在一個(gè)線程中的某個(gè)函數(shù),可以在任何地方保存當(dāng)前函數(shù)的一些臨時(shí)變量等信息,然后切換到另外一個(gè)函數(shù)中執(zhí)行,注意不是通過調(diào)用函數(shù)的方式做到的,并且切換的次數(shù)以及什么時(shí)候再切換到原來的函數(shù)都由開發(fā)者自己確定。
在實(shí)現(xiàn)多任務(wù)時(shí),線程切換從系統(tǒng)層面遠(yuǎn)不止保存和恢復(fù) CPU上下文這么簡(jiǎn)單。操作系統(tǒng)為了程序運(yùn)行的高效性每個(gè)線程都有自己緩存Cache等等數(shù)據(jù),操作系統(tǒng)還會(huì)幫你做這些數(shù)據(jù)的恢復(fù)操作。所以線程的切換非常耗性能。但是協(xié)程的切換只是單純的操作CPU的上下文,所以一秒鐘切換個(gè)上百萬次系統(tǒng)都抗的住。
greenlet與gevent
為了更好使用協(xié)程來完成多任務(wù),除了使用原生的yield完成模擬協(xié)程的工作,其實(shí)python還有的greenlet模塊和gevent模塊,使實(shí)現(xiàn)協(xié)程變的更加簡(jiǎn)單高效。
greenlet雖說實(shí)現(xiàn)了協(xié)程,但需要我們手工切換,太麻煩了,gevent是比greenlet更強(qiáng)大的并且能夠自動(dòng)切換任務(wù)的模塊。
其原理是當(dāng)一個(gè)greenlet遇到IO(指的是input output 輸入輸出,比如網(wǎng)絡(luò)、文件操作等)操作時(shí),比如訪問網(wǎng)絡(luò),就自動(dòng)切換到其他的greenlet,等到IO操作完成,再在適當(dāng)?shù)臅r(shí)候切換回來繼續(xù)執(zhí)行。
模擬耗時(shí)操作:
如果有耗時(shí)操作也可以換成,gevent中自己實(shí)現(xiàn)的模塊,這時(shí)候就需要打補(bǔ)丁了。
使用協(xié)程完成一個(gè)簡(jiǎn)單的二手房信息的爬蟲代碼吧!
以下文章來源于Python專欄 ,作者宋宋
文章鏈接:
目錄
眾所周知,CPU是計(jì)算機(jī)的核心,它承擔(dān)了所有的計(jì)算任務(wù)。而操作系統(tǒng)是計(jì)算機(jī)的管理者,是一個(gè)大管家,它負(fù)責(zé)任務(wù)的調(diào)度,資源的分配和管理,統(tǒng)領(lǐng)整個(gè)計(jì)算機(jī)硬件。應(yīng)用程序是具有某種功能的程序,程序運(yùn)行與操作系統(tǒng)之上
在很早的時(shí)候計(jì)算機(jī)并沒有線程這個(gè)概念,但是隨著時(shí)代的發(fā)展,只用進(jìn)程來處理程序出現(xiàn)很多的不足。如當(dāng)一個(gè)進(jìn)程堵塞時(shí),整個(gè)程序會(huì)停止在堵塞處,并且如果頻繁的切換進(jìn)程,會(huì)浪費(fèi)系統(tǒng)資源。所以線程出現(xiàn)了
線程是能擁有資源和獨(dú)立運(yùn)行的最小單位,也是程序執(zhí)行的最小單位。一個(gè)進(jìn)程可以擁有多個(gè)線程,而且屬于同一個(gè)進(jìn)程的多個(gè)線程間會(huì)共享該進(jìn)行的資源
① 200 多本 Python 電子書(和經(jīng)典的書籍)應(yīng)該有
② Python標(biāo)準(zhǔn)庫(kù)資料(最全中文版)
③ 項(xiàng)目源碼(四五十個(gè)有趣且可靠的練手項(xiàng)目及源碼)
④ Python基礎(chǔ)入門、爬蟲、網(wǎng)絡(luò)開發(fā)、大數(shù)據(jù)分析方面的視頻(適合小白學(xué)習(xí))
⑤ Python學(xué)習(xí)路線圖(告別不入流的學(xué)習(xí))
私信我01即可獲取大量Python學(xué)習(xí)資源
進(jìn)程時(shí)一個(gè)具有一定功能的程序在一個(gè)數(shù)據(jù)集上的一次動(dòng)態(tài)執(zhí)行過程。進(jìn)程由程序,數(shù)據(jù)集合和進(jìn)程控制塊三部分組成。程序用于描述進(jìn)程要完成的功能,是控制進(jìn)程執(zhí)行的指令集;數(shù)據(jù)集合是程序在執(zhí)行時(shí)需要的數(shù)據(jù)和工作區(qū);程序控制塊(PCB)包含程序的描述信息和控制信息,是進(jìn)程存在的唯一標(biāo)志
在Python中,通過兩個(gè)標(biāo)準(zhǔn)庫(kù) thread 和 Threading 提供對(duì)線程的支持, threading 對(duì) thread 進(jìn)行了封裝。 threading 模塊中提供了 Thread , Lock , RLOCK , Condition 等組件
在Python中線程和進(jìn)程的使用就是通過 Thread 這個(gè)類。這個(gè)類在我們的 thread 和 threading 模塊中。我們一般通過 threading 導(dǎo)入
默認(rèn)情況下,只要在解釋器中,如果沒有報(bào)錯(cuò),則說明線程可用
守護(hù)模式:
現(xiàn)在我們程序代碼中,有多個(gè)線程, 并且在這個(gè)幾個(gè)線程中都會(huì)去 操作同一部分內(nèi)容,那么如何實(shí)現(xiàn)這些數(shù)據(jù)的共享呢?
這時(shí),可以使用 threading庫(kù)里面的鎖對(duì)象 Lock 去保護(hù)
Lock 對(duì)象的acquire方法 是申請(qǐng)鎖
每個(gè)線程在操作共享數(shù)據(jù)對(duì)象之前,都應(yīng)該申請(qǐng)獲取操作權(quán),也就是調(diào)用該共享數(shù)據(jù)對(duì)象對(duì)應(yīng)的鎖對(duì)象的acquire方法,如果線程A 執(zhí)行了 acquire() 方法,別的線程B 已經(jīng)申請(qǐng)到了這個(gè)鎖, 并且還沒有釋放,那么 線程A的代碼就在此處 等待 線程B 釋放鎖,不去執(zhí)行后面的代碼。
直到線程B 執(zhí)行了鎖的 release 方法釋放了這個(gè)鎖, 線程A 才可以獲取這個(gè)鎖,就可以執(zhí)行下面的代碼了
如:
到在使用多線程時(shí),如果數(shù)據(jù)出現(xiàn)和自己預(yù)期不符的問題,就可以考慮是否是共享的數(shù)據(jù)被調(diào)用覆蓋的問題
使用 threading 庫(kù)里面的鎖對(duì)象 Lock 去保護(hù)
Python中的多進(jìn)程是通過multiprocessing包來實(shí)現(xiàn)的,和多線程的threading.Thread差不多,它可以利用multiprocessing.Process對(duì)象來創(chuàng)建一個(gè)進(jìn)程對(duì)象。這個(gè)進(jìn)程對(duì)象的方法和線程對(duì)象的方法差不多也有start(), run(), join()等方法,其中有一個(gè)方法不同Thread線程對(duì)象中的守護(hù)線程方法是setDeamon,而Process進(jìn)程對(duì)象的守護(hù)進(jìn)程是通過設(shè)置daemon屬性來完成的
守護(hù)模式:
其使用方法和線程的那個(gè) Lock 使用方法類似
Manager的作用是提供多進(jìn)程共享的全局變量,Manager()方法會(huì)返回一個(gè)對(duì)象,該對(duì)象控制著一個(gè)服務(wù)進(jìn)程,該進(jìn)程中保存的對(duì)象運(yùn)行其他進(jìn)程使用代理進(jìn)行操作
語法:
線程池的基類是 concurrent.futures 模塊中的 Executor , Executor 提供了兩個(gè)子類,即 ThreadPoolExecutor 和 ProcessPoolExecutor ,其中 ThreadPoolExecutor 用于創(chuàng)建線程池,而 ProcessPoolExecutor 用于創(chuàng)建進(jìn)程池
如果使用線程池/進(jìn)程池來管理并發(fā)編程,那么只要將相應(yīng)的 task 函數(shù)提交給線程池/進(jìn)程池,剩下的事情就由線程池/進(jìn)程池來搞定
Exectuor 提供了如下常用方法:
程序?qū)?task 函數(shù)提交(submit)給線程池后,submit 方法會(huì)返回一個(gè) Future 對(duì)象,F(xiàn)uture 類主要用于獲取線程任務(wù)函數(shù)的返回值。由于線程任務(wù)會(huì)在新線程中以異步方式執(zhí)行,因此,線程執(zhí)行的函數(shù)相當(dāng)于一個(gè)“將來完成”的任務(wù),所以 Python 使用 Future 來代表
Future 提供了如下方法:
使用線程池來執(zhí)行線程任務(wù)的步驟如下:
最佳線程數(shù)目 = ((線程等待時(shí)間+線程CPU時(shí)間)/線程CPU時(shí)間 )* CPU數(shù)目
也可以低于 CPU 核心數(shù)
使用線程池來執(zhí)行線程任務(wù)的步驟如下:
關(guān)于進(jìn)程的開啟代碼一定要放在 if __name__ == '__main__': 代碼之下,不能放到函數(shù)中或其他地方
開啟進(jìn)程的技巧
開啟進(jìn)程的數(shù)量最好低于最大 CPU 核心數(shù)
并發(fā):邏輯上具備同時(shí)處理多個(gè)任務(wù)的能力。
并行:物理上在同一時(shí)刻執(zhí)行多個(gè)并發(fā)任務(wù)。
舉例:開個(gè)QQ,開了一個(gè)進(jìn)程,開了微信,開了一個(gè)進(jìn)程。在QQ這個(gè)進(jìn)程里面,傳輸文字開一個(gè)線程、傳輸語音開了一個(gè)線程、彈出對(duì)話框又開了一個(gè)線程。
總結(jié):開一個(gè)軟件,相當(dāng)于開了一個(gè)進(jìn)程。在這個(gè)軟件運(yùn)行的過程里,多個(gè)工作同時(shí)運(yùn)轉(zhuǎn),完成了QQ的運(yùn)行,那么這個(gè)多個(gè)工作分別有多個(gè)線程。
線程和進(jìn)程之間的區(qū)別:
進(jìn)程在python中的使用,對(duì)模塊threading進(jìn)行操作,調(diào)用的這個(gè)三方庫(kù)。可以通過 help(threading) 了解其中的方法、變量使用情況。也可以使用 dir(threading) 查看目錄結(jié)構(gòu)。
current_thread_num = threading.active_count() # 返回正在運(yùn)行的線程數(shù)量
run_thread_len = len(threading.enumerate()) # 返回正在運(yùn)行的線程數(shù)量
run_thread_list = threading.enumerate() # 返回當(dāng)前運(yùn)行線程的列表
t1=threading.Thread(target=dance) #創(chuàng)建兩個(gè)子線程,參數(shù)傳遞為函數(shù)名
t1.setDaemon(True) # 設(shè)置守護(hù)進(jìn)程,守護(hù)進(jìn)程:主線程結(jié)束時(shí)自動(dòng)退出子線程。
t1.start() # 啟動(dòng)子線程
t1.join() # 等待進(jìn)程結(jié)束 exit()`# 主線程退出,t1子線程設(shè)置了守護(hù)進(jìn)程,會(huì)自動(dòng)退出。其他子線程會(huì)繼續(xù)執(zhí)行。