本文轉(zhuǎn)載自并發(fā)編程網(wǎng),侵刪
創(chuàng)新互聯(lián)公司主要從事網(wǎng)站設(shè)計(jì)制作、成都網(wǎng)站設(shè)計(jì)、網(wǎng)頁設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)嘉魚,十年網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專業(yè),歡迎來電咨詢建站服務(wù):13518219792本系列文章將整理到我在GitHub上的《Java面試指南》倉庫,更多精彩內(nèi)容請(qǐng)到我的倉庫里查看
https://github.com/h3pl/Java-Tutorial
喜歡的話麻煩點(diǎn)下Star哈
文章同步發(fā)于我的個(gè)人博客:
www.how2playlife.com
本文是微信公眾號(hào)【Java技術(shù)江湖】的《Java并發(fā)指南》其中一篇,本文大部分內(nèi)容來源于網(wǎng)絡(luò),為了把本文主題講得清晰透徹,也整合了很多我認(rèn)為不錯(cuò)的技術(shù)博客內(nèi)容,引用其中了一些比較好的博客文章,如有侵權(quán),請(qǐng)聯(lián)系作者。
該系列博文會(huì)告訴你如何全面深入地學(xué)習(xí)Java并發(fā)技術(shù),從Java多線程基礎(chǔ),再到并發(fā)編程的基礎(chǔ)知識(shí),從Java并發(fā)包的入門和實(shí)戰(zhàn),再到JUC的源碼剖析,一步步地學(xué)習(xí)Java并發(fā)編程,并上手進(jìn)行實(shí)戰(zhàn),以便讓你更完整地了解整個(gè)Java并發(fā)編程知識(shí)體系,形成自己的知識(shí)框架。
為了更好地總結(jié)和檢驗(yàn)?zāi)愕膶W(xué)習(xí)成果,本系列文章也會(huì)提供一些對(duì)應(yīng)的面試題以及參考答案。
如果對(duì)本系列文章有什么建議,或者是有什么疑問的話,也可以關(guān)注公眾號(hào)【Java技術(shù)江湖】聯(lián)系作者,歡迎你參與本系列博文的創(chuàng)作和修訂。
在并發(fā)編程中,我們需要處理兩個(gè)關(guān)鍵問題:線程之間如何通信及線程之間如何同步(這里的線程是指并發(fā)執(zhí)行的活動(dòng)實(shí)體)。通信是指線程之間以何種機(jī)制來交換信息。在命令式編程中,線程之間的通信機(jī)制有兩種:共享內(nèi)存和消息傳遞。
在共享內(nèi)存的并發(fā)模型里,線程之間共享程序的公共狀態(tài),線程之間通過寫-讀內(nèi)存中的公共狀態(tài)來隱式進(jìn)行通信。在消息傳遞的并發(fā)模型里,線程之間沒有公共狀態(tài),線程之間必須通過明確的發(fā)送消息來顯式進(jìn)行通信。
同步是指程序用于控制不同線程之間操作發(fā)生相對(duì)順序的機(jī)制。在共享內(nèi)存并發(fā)模型里,同步是顯式進(jìn)行的。程序員必須顯式指定某個(gè)方法或某段代碼需要在線程之間互斥執(zhí)行。在消息傳遞的并發(fā)模型里,由于消息的發(fā)送必須在消息的接收之前,因此同步是隱式進(jìn)行的。
Java內(nèi)存模型的抽象
Java的并發(fā)采用的是共享內(nèi)存模型,Java線程之間的通信總是隱式進(jìn)行,整個(gè)通信過程對(duì)程序員完全透明。如果編寫多線程程序的Java程序員不理解隱式進(jìn)行的線程之間通信的工作機(jī)制,很可能會(huì)遇到各種奇怪的內(nèi)存可見性問題。
在java中,所有實(shí)例域、靜態(tài)域和數(shù)組元素存儲(chǔ)在堆內(nèi)存中,堆內(nèi)存在線程之間共享(本文使用“共享變量”這個(gè)術(shù)語代指實(shí)例域,靜態(tài)域和數(shù)組元素)。局部變量(Local variables),方法定義參數(shù)(java語言規(guī)范稱之為formal method parameters)和異常處理器參數(shù)(exception handler parameters)不會(huì)在線程之間共享,它們不會(huì)有內(nèi)存可見性問題,也不受內(nèi)存模型的影響。
Java線程之間的通信由Java內(nèi)存模型(本文簡稱為JMM)控制,JMM決定一個(gè)線程對(duì)共享變量的寫入何時(shí)對(duì)另一個(gè)線程可見。從抽象的角度來看,JMM定義了線程和主內(nèi)存之間的抽象關(guān)系:線程之間的共享變量存儲(chǔ)在主內(nèi)存(main memory)中,每個(gè)線程都有一個(gè)私有的本地內(nèi)存(local memory),本地內(nèi)存中存儲(chǔ)了該線程以讀/寫共享變量的副本。本地內(nèi)存是JMM的一個(gè)抽象概念,并不真實(shí)存在。它涵蓋了緩存,寫緩沖區(qū),寄存器以及其他的硬件和編譯器優(yōu)化。Java內(nèi)存模型的抽象示意圖如下:
從上圖來看,線程A與線程B之間如要通信的話,必須要經(jīng)歷下面2個(gè)步驟:
下面通過示意圖來說明這兩個(gè)步驟:
如上圖所示,本地內(nèi)存A和B有主內(nèi)存中共享變量x的副本。假設(shè)初始時(shí),這三個(gè)內(nèi)存中的x值都為0。線程A在執(zhí)行時(shí),把更新后的x值(假設(shè)值為1)臨時(shí)存放在自己的本地內(nèi)存A中。當(dāng)線程A和線程B需要通信時(shí),線程A首先會(huì)把自己本地內(nèi)存中修改后的x值刷新到主內(nèi)存中,此時(shí)主內(nèi)存中的x值變?yōu)榱?。隨后,線程B到主內(nèi)存中去讀取線程A更新后的x值,此時(shí)線程B的本地內(nèi)存的x值也變?yōu)榱?。
從整體來看,這兩個(gè)步驟實(shí)質(zhì)上是線程A在向線程B發(fā)送消息,而且這個(gè)通信過程必須要經(jīng)過主內(nèi)存。JMM通過控制主內(nèi)存與每個(gè)線程的本地內(nèi)存之間的交互,來為java程序員提供內(nèi)存可見性保證。
在執(zhí)行程序時(shí)為了提高性能,編譯器和處理器常常會(huì)對(duì)指令做重排序。重排序分三種類型:
從java源代碼到最終實(shí)際執(zhí)行的指令序列,會(huì)分別經(jīng)歷下面三種重排序:
上述的1屬于編譯器重排序,2和3屬于處理器重排序。這些重排序都可能會(huì)導(dǎo)致多線程程序出現(xiàn)內(nèi)存可見性問題。對(duì)于編譯器,JMM的編譯器重排序規(guī)則會(huì)禁止特定類型的編譯器重排序(不是所有的編譯器重排序都要禁止)。對(duì)于處理器重排序,JMM的處理器重排序規(guī)則會(huì)要求java編譯器在生成指令序列時(shí),插入特定類型的內(nèi)存屏障(memory barriers,intel稱之為memory fence)指令,通過內(nèi)存屏障指令來禁止特定類型的處理器重排序(不是所有的處理器重排序都要禁止)。
JMM屬于語言級(jí)的內(nèi)存模型,它確保在不同的編譯器和不同的處理器平臺(tái)之上,通過禁止特定類型的編譯器重排序和處理器重排序,為程序員提供一致的內(nèi)存可見性保證。
現(xiàn)代的處理器使用寫緩沖區(qū)來臨時(shí)保存向內(nèi)存寫入的數(shù)據(jù)。寫緩沖區(qū)可以保證指令流水線持續(xù)運(yùn)行,它可以避免由于處理器停頓下來等待向內(nèi)存寫入數(shù)據(jù)而產(chǎn)生的延遲。同時(shí),通過以批處理的方式刷新寫緩沖區(qū),以及合并寫緩沖區(qū)中對(duì)同一內(nèi)存地址的多次寫,可以減少對(duì)內(nèi)存總線的占用。雖然寫緩沖區(qū)有這么多好處,但每個(gè)處理器上的寫緩沖區(qū),僅僅對(duì)它所在的處理器可見。這個(gè)特性會(huì)對(duì)內(nèi)存操作的執(zhí)行順序產(chǎn)生重要的影響:處理器對(duì)內(nèi)存的讀/寫操作的執(zhí)行順序,不一定與內(nèi)存實(shí)際發(fā)生的讀/寫操作順序一致!為了具體說明,請(qǐng)看下面示例:
Processor A | Processor B |
---|---|
a = 1; //A1x = b; //A2 | b = 2; //B1y = a; //B2 |
初始狀態(tài):a = b = 0處理器允許執(zhí)行后得到結(jié)果:x = y = 0 |
假設(shè)處理器A和處理器B按程序的順序并行執(zhí)行內(nèi)存訪問,最終卻可能得到x = y = 0的結(jié)果。具體的原因如下圖所示:
這里處理器A和處理器B可以同時(shí)把共享變量寫入自己的寫緩沖區(qū)(A1,B1),然后從內(nèi)存中讀取另一個(gè)共享變量(A2,B2),最后才把自己寫緩存區(qū)中保存的臟數(shù)據(jù)刷新到內(nèi)存中(A3,B3)。當(dāng)以這種時(shí)序執(zhí)行時(shí),程序就可以得到x = y = 0的結(jié)果。
從內(nèi)存操作實(shí)際發(fā)生的順序來看,直到處理器A執(zhí)行A3來刷新自己的寫緩存區(qū),寫操作A1才算真正執(zhí)行了。雖然處理器A執(zhí)行內(nèi)存操作的順序?yàn)椋篈1->A2,但內(nèi)存操作實(shí)際發(fā)生的順序卻是:A2->A1。此時(shí),處理器A的內(nèi)存操作順序被重排序了(處理器B的情況和處理器A一樣,這里就不贅述了)。
這里的關(guān)鍵是,由于寫緩沖區(qū)僅對(duì)自己的處理器可見,它會(huì)導(dǎo)致處理器執(zhí)行內(nèi)存操作的順序可能會(huì)與內(nèi)存實(shí)際的操作執(zhí)行順序不一致。由于現(xiàn)代的處理器都會(huì)使用寫緩沖區(qū),因此現(xiàn)代的處理器都會(huì)允許對(duì)寫-讀操做重排序。
下面是常見處理器允許的重排序類型的列表:
? | Load-Load | Load-Store | Store-Store | Store-Load | 數(shù)據(jù)依賴 |
---|---|---|---|---|---|
sparc-TSO | N | N | N | Y | N |
x86 | N | N | N | Y | N |
ia64 | Y | Y | Y | Y | N |
PowerPC | Y | Y | Y | Y | N |
上表單元格中的“N”表示處理器不允許兩個(gè)操作重排序,“Y”表示允許重排序。
從上表我們可以看出:常見的處理器都允許Store-Load重排序;常見的處理器都不允許對(duì)存在數(shù)據(jù)依賴的操作做重排序。sparc-TSO和x86擁有相對(duì)較強(qiáng)的處理器內(nèi)存模型,它們僅允許對(duì)寫-讀操作做重排序(因?yàn)樗鼈兌际褂昧藢懢彌_區(qū))。
※注1:sparc-TSO是指以TSO(Total Store Order)內(nèi)存模型運(yùn)行時(shí),sparc處理器的特性。
※注2:上表中的x86包括x64及AMD64。
※注3:由于ARM處理器的內(nèi)存模型與PowerPC處理器的內(nèi)存模型非常類似,本文將忽略它。
※注4:數(shù)據(jù)依賴性后文會(huì)專門說明。
為了保證內(nèi)存可見性,java編譯器在生成指令序列的適當(dāng)位置會(huì)插入內(nèi)存屏障指令來禁止特定類型的處理器重排序。JMM把內(nèi)存屏障指令分為下列四類:
屏障類型 | 指令示例 | 說明 |
---|---|---|
LoadLoad Barriers | Load1; LoadLoad; Load2 | 確保Load1數(shù)據(jù)的裝載,之前于Load2及所有后續(xù)裝載指令的裝載。 |
StoreStore Barriers | Store1; StoreStore; Store2 | 確保Store1數(shù)據(jù)對(duì)其他處理器可見(刷新到內(nèi)存),之前于Store2及所有后續(xù)存儲(chǔ)指令的存儲(chǔ)。 |
LoadStore Barriers | Load1; LoadStore; Store2 | 確保Load1數(shù)據(jù)裝載,之前于Store2及所有后續(xù)的存儲(chǔ)指令刷新到內(nèi)存。 |
StoreLoad Barriers | Store1; StoreLoad; Load2 | 確保Store1數(shù)據(jù)對(duì)其他處理器變得可見(指刷新到內(nèi)存),之前于Load2及所有后續(xù)裝載指令的裝載。StoreLoad Barriers會(huì)使該屏障之前的所有內(nèi)存訪問指令(存儲(chǔ)和裝載指令)完成之后,才執(zhí)行該屏障之后的內(nèi)存訪問指令。 |
StoreLoad Barriers是一個(gè)“全能型”的屏障,它同時(shí)具有其他三個(gè)屏障的效果?,F(xiàn)代的多處理器大都支持該屏障(其他類型的屏障不一定被所有處理器支持)。執(zhí)行該屏障開銷會(huì)很昂貴,因?yàn)楫?dāng)前處理器通常要把寫緩沖區(qū)中的數(shù)據(jù)全部刷新到內(nèi)存中(buffer fully flush)。
從JDK5開始,java使用新的JSR -133內(nèi)存模型(本文除非特別說明,針對(duì)的都是JSR- 133內(nèi)存模型)。JSR-133提出了happens-before的概念,通過這個(gè)概念來闡述操作之間的內(nèi)存可見性。如果一個(gè)操作執(zhí)行的結(jié)果需要對(duì)另一個(gè)操作可見,那么這兩個(gè)操作之間必須存在happens-before關(guān)系。這里提到的兩個(gè)操作既可以是在一個(gè)線程之內(nèi),也可以是在不同線程之間。 與程序員密切相關(guān)的happens-before規(guī)則如下:
注意,兩個(gè)操作之間具有happens-before關(guān)系,并不意味著前一個(gè)操作必須要在后一個(gè)操作之前執(zhí)行!happens-before僅僅要求前一個(gè)操作(執(zhí)行的結(jié)果)對(duì)后一個(gè)操作可見,且前一個(gè)操作按順序排在第二個(gè)操作之前(the first is visible to and ordered before the second)。happens- before的定義很微妙,后文會(huì)具體說明happens-before為什么要這么定義。
happens-before與JMM的關(guān)系如下圖所示:
如上圖所示,一個(gè)happens-before規(guī)則通常對(duì)應(yīng)于多個(gè)編譯器重排序規(guī)則和處理器重排序規(guī)則。對(duì)于java程序員來說,happens-before規(guī)則簡單易懂,它避免程序員為了理解JMM提供的內(nèi)存可見性保證而去學(xué)習(xí)復(fù)雜的重排序規(guī)則以及這些規(guī)則的具體實(shí)現(xiàn)。
如果兩個(gè)操作訪問同一個(gè)變量,且這兩個(gè)操作中有一個(gè)為寫操作,此時(shí)這兩個(gè)操作之間就存在數(shù)據(jù)依賴性。數(shù)據(jù)依賴分下列三種類型:
名稱 | 代碼示例 | 說明 |
---|---|---|
寫后讀 | a = 1;b = a; | 寫一個(gè)變量之后,再讀這個(gè)位置。 |
寫后寫 | a = 1;a = 2; | 寫一個(gè)變量之后,再寫這個(gè)變量。 |
讀后寫 | a = b;b = 1; | 讀一個(gè)變量之后,再寫這個(gè)變量。 |
上面三種情況,只要重排序兩個(gè)操作的執(zhí)行順序,程序的執(zhí)行結(jié)果將會(huì)被改變。
注意,這里所說的數(shù)據(jù)依賴性僅針對(duì)單個(gè)處理器中執(zhí)行的指令序列和單個(gè)線程中執(zhí)行的操作,不同處理器之間和不同線程之間的數(shù)據(jù)依賴性不被編譯器和處理器考慮。前面提到過,編譯器和處理器可能會(huì)對(duì)操作做重排序。編譯器和處理器在重排序時(shí),會(huì)遵守?cái)?shù)據(jù)依賴性,編譯器和處理器不會(huì)改變存在數(shù)據(jù)依賴關(guān)系的兩個(gè)操作的執(zhí)行順序。
as-if-serial語義的意思指:不管怎么重排序(編譯器和處理器為了提高并行度),(單線程)程序的執(zhí)行結(jié)果不能被改變。編譯器,runtime 和處理器都必須遵守as-if-serial語義。
為了遵守as-if-serial語義,編譯器和處理器不會(huì)對(duì)存在數(shù)據(jù)依賴關(guān)系的操作做重排序,因?yàn)檫@種重排序會(huì)改變執(zhí)行結(jié)果。但是,如果操作之間不存在數(shù)據(jù)依賴關(guān)系,這些操作可能被編譯器和處理器重排序。為了具體說明,請(qǐng)看下面計(jì)算圓面積的代碼示例:
double pi = 3.14; //A
double r = 1.0; //B
double area = pi * r * r; //C
上面三個(gè)操作的數(shù)據(jù)依賴關(guān)系如下圖所示:
如上圖所示,A和C之間存在數(shù)據(jù)依賴關(guān)系,同時(shí)B和C之間也存在數(shù)據(jù)依賴關(guān)系。因此在最終執(zhí)行的指令序列中,C不能被重排序到A和B的前面(C排到A和B的前面,程序的結(jié)果將會(huì)被改變)。但A和B之間沒有數(shù)據(jù)依賴關(guān)系,編譯器和處理器可以重排序A和B之間的執(zhí)行順序。下圖是該程序的兩種執(zhí)行順序:
as-if-serial語義把單線程程序保護(hù)了起來,遵守as-if-serial語義的編譯器,runtime 和處理器共同為編寫單線程程序的程序員創(chuàng)建了一個(gè)幻覺:單線程程序是按程序的順序來執(zhí)行的。as-if-serial語義使單線程程序員無需擔(dān)心重排序會(huì)干擾他們,也無需擔(dān)心內(nèi)存可見性問題。
根據(jù)happens- before的程序順序規(guī)則,上面計(jì)算圓的面積的示例代碼存在三個(gè)happens- before關(guān)系:
這里的第3個(gè)happens- before關(guān)系,是根據(jù)happens- before的傳遞性推導(dǎo)出來的。
這里A happens- before B,但實(shí)際執(zhí)行時(shí)B卻可以排在A之前執(zhí)行(看上面的重排序后的執(zhí)行順序)。在第一章提到過,如果A happens- before B,JMM并不要求A一定要在B之前執(zhí)行。JMM僅僅要求前一個(gè)操作(執(zhí)行的結(jié)果)對(duì)后一個(gè)操作可見,且前一個(gè)操作按順序排在第二個(gè)操作之前。這里操作A的執(zhí)行結(jié)果不需要對(duì)操作B可見;而且重排序操作A和操作B后的執(zhí)行結(jié)果,與操作A和操作B按happens- before順序執(zhí)行的結(jié)果一致。在這種情況下,JMM會(huì)認(rèn)為這種重排序并不非法(not illegal),JMM允許這種重排序。
在計(jì)算機(jī)中,軟件技術(shù)和硬件技術(shù)有一個(gè)共同的目標(biāo):在不改變程序執(zhí)行結(jié)果的前提下,盡可能的開發(fā)并行度。編譯器和處理器遵從這一目標(biāo),從happens- before的定義我們可以看出,JMM同樣遵從這一目標(biāo)。
現(xiàn)在讓我們來看看,重排序是否會(huì)改變多線程程序的執(zhí)行結(jié)果。請(qǐng)看下面的示例代碼:
class ReorderExample {
int a = 0;
boolean flag = false;
public void writer() {
a = 1; //1
flag = true; //2
}
Public void reader() {
if (flag) { //3
int i = a * a; //4
……
}
}
}
flag變量是個(gè)標(biāo)記,用來標(biāo)識(shí)變量a是否已被寫入。這里假設(shè)有兩個(gè)線程A和B,A首先執(zhí)行writer()方法,隨后B線程接著執(zhí)行reader()方法。線程B在執(zhí)行操作4時(shí),能否看到線程A在操作1對(duì)共享變量a的寫入?
答案是:不一定能看到。
由于操作1和操作2沒有數(shù)據(jù)依賴關(guān)系,編譯器和處理器可以對(duì)這兩個(gè)操作重排序;同樣,操作3和操作4沒有數(shù)據(jù)依賴關(guān)系,編譯器和處理器也可以對(duì)這兩個(gè)操作重排序。讓我們先來看看,當(dāng)操作1和操作2重排序時(shí),可能會(huì)產(chǎn)生什么效果?請(qǐng)看下面的程序執(zhí)行時(shí)序圖:
如上圖所示,操作1和操作2做了重排序。程序執(zhí)行時(shí),線程A首先寫標(biāo)記變量flag,隨后線程B讀這個(gè)變量。由于條件判斷為真,線程B將讀取變量a。此時(shí),變量a還根本沒有被線程A寫入,在這里多線程程序的語義被重排序破壞了!
※注:本文統(tǒng)一用紅色的虛箭線表示錯(cuò)誤的讀操作,用綠色的虛箭線表示正確的讀操作。
下面再讓我們看看,當(dāng)操作3和操作4重排序時(shí)會(huì)產(chǎn)生什么效果(借助這個(gè)重排序,可以順便說明控制依賴性)。下面是操作3和操作4重排序后,程序的執(zhí)行時(shí)序圖:
在程序中,操作3和操作4存在控制依賴關(guān)系。當(dāng)代碼中存在控制依賴性時(shí),會(huì)影響指令序列執(zhí)行的并行度。為此,編譯器和處理器會(huì)采用猜測(Speculation)執(zhí)行來克服控制相關(guān)性對(duì)并行度的影響。以處理器的猜測執(zhí)行為例,執(zhí)行線程B的處理器可以提前讀取并計(jì)算a*a,然后把計(jì)算結(jié)果臨時(shí)保存到一個(gè)名為重排序緩沖(reorder buffer ROB)的硬件緩存中。當(dāng)接下來操作3的條件判斷為真時(shí),就把該計(jì)算結(jié)果寫入變量i中。
從圖中我們可以看出,猜測執(zhí)行實(shí)質(zhì)上對(duì)操作3和4做了重排序。重排序在這里破壞了多線程程序的語義!
在單線程程序中,對(duì)存在控制依賴的操作重排序,不會(huì)改變執(zhí)行結(jié)果(這也是as-if-serial語義允許對(duì)存在控制依賴的操作做重排序的原因);但在多線程程序中,對(duì)存在控制依賴的操作重排序,可能會(huì)改變程序的執(zhí)行結(jié)果。
當(dāng)程序未正確同步時(shí),就會(huì)存在數(shù)據(jù)競爭。java內(nèi)存模型規(guī)范對(duì)數(shù)據(jù)競爭的定義如下:
當(dāng)代碼中包含數(shù)據(jù)競爭時(shí),程序的執(zhí)行往往產(chǎn)生違反直覺的結(jié)果(前一章的示例正是如此)。如果一個(gè)多線程程序能正確同步,這個(gè)程序?qū)⑹且粋€(gè)沒有數(shù)據(jù)競爭的程序。
JMM對(duì)正確同步的多線程程序的內(nèi)存一致性做了如下保證:
順序一致性內(nèi)存模型是一個(gè)被計(jì)算機(jī)科學(xué)家理想化了的理論參考模型,它為程序員提供了極強(qiáng)的內(nèi)存可見性保證。順序一致性內(nèi)存模型有兩大特性:
順序一致性內(nèi)存模型為程序員提供的視圖如下:
在概念上,順序一致性模型有一個(gè)單一的全局內(nèi)存,這個(gè)內(nèi)存通過一個(gè)左右擺動(dòng)的開關(guān)可以連接到任意一個(gè)線程。同時(shí),每一個(gè)線程必須按程序的順序來執(zhí)行內(nèi)存讀/寫操作。從上圖我們可以看出,在任意時(shí)間點(diǎn)最多只能有一個(gè)線程可以連接到內(nèi)存。當(dāng)多個(gè)線程并發(fā)執(zhí)行時(shí),圖中的開關(guān)裝置能把所有線程的所有內(nèi)存讀/寫操作串行化。
為了更好的理解,下面我們通過兩個(gè)示意圖來對(duì)順序一致性模型的特性做進(jìn)一步的說明。
假設(shè)有兩個(gè)線程A和B并發(fā)執(zhí)行。其中A線程有三個(gè)操作,它們?cè)诔绦蛑械捻樞蚴牵篈1->A2->A3。B線程也有三個(gè)操作,它們?cè)诔绦蛑械捻樞蚴牵築1->B2->B3。
假設(shè)這兩個(gè)線程使用監(jiān)視器來正確同步:A線程的三個(gè)操作執(zhí)行后釋放監(jiān)視器,隨后B線程獲取同一個(gè)監(jiān)視器。那么程序在順序一致性模型中的執(zhí)行效果將如下圖所示:
現(xiàn)在我們?cè)偌僭O(shè)這兩個(gè)線程沒有做同步,下面是這個(gè)未同步程序在順序一致性模型中的執(zhí)行示意圖:
未同步程序在順序一致性模型中雖然整體執(zhí)行順序是無序的,但所有線程都只能看到一個(gè)一致的整體執(zhí)行順序。以上圖為例,線程A和B看到的執(zhí)行順序都是:B1->A1->A2->B2->A3->B3。之所以能得到這個(gè)保證是因?yàn)轫樞蛞恢滦詢?nèi)存模型中的每個(gè)操作必須立即對(duì)任意線程可見。
但是,在JMM中就沒有這個(gè)保證。未同步程序在JMM中不但整體的執(zhí)行順序是無序的,而且所有線程看到的操作執(zhí)行順序也可能不一致。比如,在當(dāng)前線程把寫過的數(shù)據(jù)緩存在本地內(nèi)存中,且還沒有刷新到主內(nèi)存之前,這個(gè)寫操作僅對(duì)當(dāng)前線程可見;從其他線程的角度來觀察,會(huì)認(rèn)為這個(gè)寫操作根本還沒有被當(dāng)前線程執(zhí)行。只有當(dāng)前線程把本地內(nèi)存中寫過的數(shù)據(jù)刷新到主內(nèi)存之后,這個(gè)寫操作才能對(duì)其他線程可見。在這種情況下,當(dāng)前線程和其它線程看到的操作執(zhí)行順序?qū)⒉灰恢隆?/p>
下面我們對(duì)前面的示例程序ReorderExample用監(jiān)視器來同步,看看正確同步的程序如何具有順序一致性。
請(qǐng)看下面的示例代碼:
class SynchronizedExample {
int a = 0;
boolean flag = false;
public synchronized void writer() {
a = 1;
flag = true;
}
public synchronized void reader() {
if (flag) {
int i = a;
……
}
}
}
上面示例代碼中,假設(shè)A線程執(zhí)行writer()方法后,B線程執(zhí)行reader()方法。這是一個(gè)正確同步的多線程程序。根據(jù)JMM規(guī)范,該程序的執(zhí)行結(jié)果將與該程序在順序一致性模型中的執(zhí)行結(jié)果相同。下面是該程序在兩個(gè)內(nèi)存模型中的執(zhí)行時(shí)序?qū)Ρ葓D:
在順序一致性模型中,所有操作完全按程序的順序串行執(zhí)行。而在JMM中,臨界區(qū)內(nèi)的代碼可以重排序(但JMM不允許臨界區(qū)內(nèi)的代碼“逸出”到臨界區(qū)之外,那樣會(huì)破壞監(jiān)視器的語義)。JMM會(huì)在退出監(jiān)視器和進(jìn)入監(jiān)視器這兩個(gè)關(guān)鍵時(shí)間點(diǎn)做一些特別處理,使得線程在這兩個(gè)時(shí)間點(diǎn)具有與順序一致性模型相同的內(nèi)存視圖(具體細(xì)節(jié)后文會(huì)說明)。雖然線程A在臨界區(qū)內(nèi)做了重排序,但由于監(jiān)視器的互斥執(zhí)行的特性,這里的線程B根本無法“觀察”到線程A在臨界區(qū)內(nèi)的重排序。這種重排序既提高了執(zhí)行效率,又沒有改變程序的執(zhí)行結(jié)果。
從這里我們可以看到JMM在具體實(shí)現(xiàn)上的基本方針:在不改變(正確同步的)程序執(zhí)行結(jié)果的前提下,盡可能的為編譯器和處理器的優(yōu)化打開方便之門。
對(duì)于未同步或未正確同步的多線程程序,JMM只提供最小安全性:線程執(zhí)行時(shí)讀取到的值,要么是之前某個(gè)線程寫入的值,要么是默認(rèn)值(0,null,false),JMM保證線程讀操作讀取到的值不會(huì)無中生有(out of thin air)的冒出來。為了實(shí)現(xiàn)最小安全性,JVM在堆上分配對(duì)象時(shí),首先會(huì)清零內(nèi)存空間,然后才會(huì)在上面分配對(duì)象(JVM內(nèi)部會(huì)同步這兩個(gè)操作)。因此,在以清零的內(nèi)存空間(pre-zeroed memory)分配對(duì)象時(shí),域的默認(rèn)初始化已經(jīng)完成了。
JMM不保證未同步程序的執(zhí)行結(jié)果與該程序在順序一致性模型中的執(zhí)行結(jié)果一致。因?yàn)槲赐匠绦蛟陧樞蛞恢滦阅P椭袌?zhí)行時(shí),整體上是無序的,其執(zhí)行結(jié)果無法預(yù)知。保證未同步程序在兩個(gè)模型中的執(zhí)行結(jié)果一致毫無意義。
和順序一致性模型一樣,未同步程序在JMM中的執(zhí)行時(shí),整體上也是無序的,其執(zhí)行結(jié)果也無法預(yù)知。同時(shí),未同步程序在這兩個(gè)模型中的執(zhí)行特性有下面幾個(gè)差異:
第3個(gè)差異與處理器總線的工作機(jī)制密切相關(guān)。在計(jì)算機(jī)中,數(shù)據(jù)通過總線在處理器和內(nèi)存之間傳遞。每次處理器和內(nèi)存之間的數(shù)據(jù)傳遞都是通過一系列步驟來完成的,這一系列步驟稱之為總線事務(wù)(bus transaction)。總線事務(wù)包括讀事務(wù)(read transaction)和寫事務(wù)(write transaction)。讀事務(wù)從內(nèi)存?zhèn)魉蛿?shù)據(jù)到處理器,寫事務(wù)從處理器傳送數(shù)據(jù)到內(nèi)存,每個(gè)事務(wù)會(huì)讀/寫內(nèi)存中一個(gè)或多個(gè)物理上連續(xù)的字。這里的關(guān)鍵是,總線會(huì)同步試圖并發(fā)使用總線的事務(wù)。在一個(gè)處理器執(zhí)行總線事務(wù)期間,總線會(huì)禁止其它所有的處理器和I/O設(shè)備執(zhí)行內(nèi)存的讀/寫。下面讓我們通過一個(gè)示意圖來說明總線的工作機(jī)制:
如上圖所示,假設(shè)處理器A,B和C同時(shí)向總線發(fā)起總線事務(wù),這時(shí)總線仲裁(bus arbitration)會(huì)對(duì)競爭作出裁決,這里我們假設(shè)總線在仲裁后判定處理器A在競爭中獲勝(總線仲裁會(huì)確保所有處理器都能公平的訪問內(nèi)存)。此時(shí)處理器A繼續(xù)它的總線事務(wù),而其它兩個(gè)處理器則要等待處理器A的總線事務(wù)完成后才能開始再次執(zhí)行內(nèi)存訪問。假設(shè)在處理器A執(zhí)行總線事務(wù)期間(不管這個(gè)總線事務(wù)是讀事務(wù)還是寫事務(wù)),處理器D向總線發(fā)起了總線事務(wù),此時(shí)處理器D的這個(gè)請(qǐng)求會(huì)被總線禁止。
總線的這些工作機(jī)制可以把所有處理器對(duì)內(nèi)存的訪問以串行化的方式來執(zhí)行;在任意時(shí)間點(diǎn),最多只能有一個(gè)處理器能訪問內(nèi)存。這個(gè)特性確保了單個(gè)總線事務(wù)之中的內(nèi)存讀/寫操作具有原子性。
在一些32位的處理器上,如果要求對(duì)64位數(shù)據(jù)的讀/寫操作具有原子性,會(huì)有比較大的開銷。為了照顧這種處理器,java語言規(guī)范鼓勵(lì)但不強(qiáng)求JVM對(duì)64位的long型變量和double型變量的讀/寫具有原子性。當(dāng)JVM在這種處理器上運(yùn)行時(shí),會(huì)把一個(gè)64位long/ double型變量的讀/寫操作拆分為兩個(gè)32位的讀/寫操作來執(zhí)行。這兩個(gè)32位的讀/寫操作可能會(huì)被分配到不同的總線事務(wù)中執(zhí)行,此時(shí)對(duì)這個(gè)64位變量的讀/寫將不具有原子性。
當(dāng)單個(gè)內(nèi)存操作不具有原子性,將可能會(huì)產(chǎn)生意想不到后果。請(qǐng)看下面示意圖:
如上圖所示,假設(shè)處理器A寫一個(gè)long型變量,同時(shí)處理器B要讀這個(gè)long型變量。處理器A中64位的寫操作被拆分為兩個(gè)32位的寫操作,且
這兩個(gè)32位的寫操作被分配到不同的寫事務(wù)中執(zhí)行。同時(shí)處理器B中64位的讀操作被拆分為兩個(gè)32位的讀操作,且這兩個(gè)32位的讀操作被分配到同一個(gè)的讀事務(wù)中執(zhí)行。當(dāng)處理器A和B按上圖的時(shí)序來執(zhí)行時(shí),處理器B將看到僅僅被處理器A“寫了一半“的無效值。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。