最近在研究分布式系統(tǒng)的一些理論概念,例如關(guān)于分布式系統(tǒng)一致性的討論,看了一些文章我有一些不解。大多數(shù)對(duì)分布式系統(tǒng)一致性的劃分是將其分為三類:強(qiáng)一致性,順序一致性以及弱一致性。強(qiáng)一致性(Strict Consistency)也稱為:原子一致性(Atomic Consistency)、線性一致性(Linearizable Consistency)。
為江山等地區(qū)用戶提供了全套網(wǎng)頁(yè)設(shè)計(jì)制作服務(wù),及江山網(wǎng)站建設(shè)行業(yè)解決方案。主營(yíng)業(yè)務(wù)為做網(wǎng)站、網(wǎng)站建設(shè)、江山網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠(chéng)的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會(huì)得到認(rèn)可,從而選擇與我們長(zhǎng)期合作。這樣,我們也可以走得更遠(yuǎn)!在談到Zookeeper的一致性是哪種級(jí)別的一致性問(wèn)題,以及CAP原則中的C是哪一種一致性級(jí)別時(shí)有些疑惑。
下面是大多數(shù)文章中提到的一致性級(jí)別
一致性(Consistency)是指多副本(Replications)問(wèn)題中的數(shù)據(jù)一致性??梢苑譃閺?qiáng)一致性、順序一致性與弱一致性。
也稱為:原子一致性(Atomic Consistency)**線性一致性(Linearizable Consistency)**
強(qiáng)一致性有兩個(gè)要求:
簡(jiǎn)言之,在任意時(shí)刻,所有節(jié)點(diǎn)中的數(shù)據(jù)都是一樣的。
例如,對(duì)于關(guān)系型數(shù)據(jù)庫(kù),要求更新過(guò)的數(shù)據(jù)能被后續(xù)的訪問(wèn)都能看到,這是強(qiáng)一致性。
the result of any execution is the same as if the operations of all the processors were executed in some sequential order, and the operations of each individual processor appear in this sequence in the order specified by its program. - - Lamport
兩個(gè)要求:
舉個(gè)例子:
Write(x, 4):寫(xiě)入x=4?
Read(x, 0):讀出x=0
1)圖a是滿足順序一致性,但是不滿足強(qiáng)一致性的。原因在于,從全局時(shí)鐘的觀點(diǎn)來(lái)看,P2進(jìn)程對(duì)變量X的讀操作在P1進(jìn)程對(duì)變量X的寫(xiě)操作之后,然而讀出來(lái)的卻是舊的數(shù)據(jù)。但是這個(gè)圖卻是滿足順序一致性的,因?yàn)閮蓚€(gè)進(jìn)程P1,P2的一致性并沒(méi)有沖突。從這兩個(gè)進(jìn)程的角度來(lái)看,順序應(yīng)該是這樣的:Write(y,2) , Read(x,0) , Write(x,4), Read(y,2),每個(gè)進(jìn)程內(nèi)部的讀寫(xiě)順序都是合理的,但是這個(gè)順序與全局時(shí)鐘下看到的順序并不一樣。
2)圖b滿足強(qiáng)一致性,因?yàn)槊總€(gè)讀操作都讀到了該變量的最新寫(xiě)的結(jié)果,同時(shí)兩個(gè)進(jìn)程看到的操作順序與全局時(shí)鐘的順序一樣,都是Write(y,2) ,Write(x,4), Read(x,4) ,? Read(y,2)。
3)圖c不滿足順序一致性,當(dāng)然也就不滿足強(qiáng)一致性了。因?yàn)閺倪M(jìn)程P1的角度看,它對(duì)變量Y的讀操作返回了結(jié)果0。那么就是說(shuō),P1進(jìn)程的對(duì)變量Y的讀操作在P2進(jìn)程對(duì)變量Y的寫(xiě)操作之前,這意味著它認(rèn)為的順序是這樣的:Write(x,4) , Read(y,0) , Write(y,2), Read(x,0),顯然這個(gè)順序又是不能被滿足的,因?yàn)樽詈笠粋€(gè)對(duì)變量x的讀操作讀出來(lái)也是舊的數(shù)據(jù)。因此這個(gè)順序是有沖突的,不滿足順序一致性。
數(shù)據(jù)更新后,如果能容忍后續(xù)的訪問(wèn)只能訪問(wèn)到部分或者全部訪問(wèn)不到,則是弱一致性。
最終一致性就屬于弱一致性。
不保證在任意時(shí)刻任意節(jié)點(diǎn)上的同一份數(shù)據(jù)都是相同的,但是隨著時(shí)間的遷移,不同節(jié)點(diǎn)上的同一份數(shù)據(jù)總是在向趨同的方向變化。
簡(jiǎn)單說(shuō),就是在一段時(shí)間后,節(jié)點(diǎn)間的數(shù)據(jù)會(huì)最終達(dá)到一致?tīng)顟B(tài)。
最終一致性根據(jù)更新數(shù)據(jù)后各進(jìn)程訪問(wèn)到數(shù)據(jù)的時(shí)間和方式的不同,又可以區(qū)分為:
因果一致性(Casual Consistency)。如果進(jìn)程A通知進(jìn)程B它已更新了一個(gè)數(shù)據(jù)項(xiàng),那么進(jìn)程B的后續(xù)訪問(wèn)將返回更新后的值,且一次寫(xiě)入將保證取代前一次寫(xiě)入。與進(jìn)程A無(wú)因果關(guān)系的進(jìn)程C的訪問(wèn),遵守一般的最終一致性規(guī)則。
“讀己之所寫(xiě)(read-your-writes)”一致性。當(dāng)進(jìn)程A自己更新一個(gè)數(shù)據(jù)項(xiàng)之后,它總是訪問(wèn)到更新過(guò)的值,絕不會(huì)看到舊值。這是因果一致性模型的一個(gè)特例。
會(huì)話(Session)一致性。這是上一個(gè)模型的實(shí)用版本,它把訪問(wèn)存儲(chǔ)系統(tǒng)的進(jìn)程放到會(huì)話的上下文中。只要會(huì)話還存在,系統(tǒng)就保證“讀己之所寫(xiě)”一致性。如果由于某些失敗情形令會(huì)話終止,就要建立新的會(huì)話,而且系統(tǒng)的保證不會(huì)延續(xù)到新的會(huì)話。
單調(diào)(Monotonic)讀一致性。如果進(jìn)程已經(jīng)看到過(guò)數(shù)據(jù)對(duì)象的某個(gè)值,那么任何后續(xù)訪問(wèn)都不會(huì)返回在那個(gè)值之前的值。
單調(diào)寫(xiě)一致性。系統(tǒng)保證來(lái)自同一個(gè)進(jìn)程的寫(xiě)操作順序執(zhí)行。要是系統(tǒng)不能保證這種程度的一致性,就非常難以編程了。
另外一種劃分一致性級(jí)別的:
一致性是指從系統(tǒng)外部讀取系統(tǒng)內(nèi)部的數(shù)據(jù)時(shí),在一定約束條件下相同,即數(shù)據(jù)變動(dòng)在系統(tǒng)內(nèi)部各節(jié)點(diǎn)應(yīng)該是同步的。根據(jù)一致性的強(qiáng)弱程度不同,可以將一致性級(jí)別分為如下幾種:
①強(qiáng)一致性(strong consistency)。任何時(shí)刻,任何用戶都能讀取到最近一次成功更新的數(shù)據(jù)。
②單調(diào)一致性(monotonic consistency)。任何時(shí)刻,任何用戶一旦讀到某個(gè)數(shù)據(jù)在某次更新后的值,那么就不會(huì)再讀到比這個(gè)值更舊的值。也就是說(shuō),獲取的數(shù)據(jù)順序必是單調(diào)遞增的。
③會(huì)話一致性(session consistency)。任何用戶在某次會(huì)話中,一旦讀到某個(gè)數(shù)據(jù)在某次更新后的值,那么在本次會(huì)話中就不會(huì)再讀到比這值更舊的值。會(huì)話一致性是在單調(diào)一致性的基礎(chǔ)上進(jìn)一步放松約束,只保證單個(gè)用戶單個(gè)會(huì)話內(nèi)的單調(diào)性,在不同用戶或同一用戶不同會(huì)話間則沒(méi)有保障。示例case:php的session概念。
④最終一致性(eventual consistency)。用戶只能讀到某次更新后的值,但系統(tǒng)保證數(shù)據(jù)將最終達(dá)到完全一致的狀態(tài),只是所需時(shí)間不能保障。
⑤弱一致性(weak consistency)。用戶無(wú)法在確定時(shí)間內(nèi)讀到最新更新的值。
共識(shí)問(wèn)題中所有的節(jié)點(diǎn)要最終達(dá)成共識(shí),由于最終目標(biāo)是所有節(jié)點(diǎn)都要達(dá)成一致,所以根本不存在一致性強(qiáng)弱之分。
例如,Paxos是共識(shí)(Consensus)算法而不是強(qiáng)一致性(Consistency)協(xié)議。共識(shí)算法沒(méi)有一致性級(jí)別的區(qū)分。
讀寫(xiě)操作的線性化與術(shù)語(yǔ)“原子一致性”同義,并且是Gilbert和Lynch?對(duì)CAP定理的證明中的?“C”或“一致性”?。我們說(shuō)線性化是可組合的?(或“本地”),因?yàn)槿绻到y(tǒng)中每個(gè)對(duì)象的操作是可線性化的,那么系統(tǒng)中的所有操作都是可線性化的。
可串行性是ACID中的傳統(tǒng)“I”或隔離。如果用戶的事務(wù)各自保持應(yīng)用程序的正確性(ACID中的“C”或一致性),則可序列化執(zhí)行也保持正確性。因此,可串行化是一種保證數(shù)據(jù)庫(kù)正確性的機(jī)制。
與線性化不同,可串行化本身不會(huì)對(duì)事務(wù)的排序施加任何實(shí)時(shí)約束??尚蛄谢彩遣豢山M合的??纱谢⒉灰馕吨魏晤愋偷拇_定性順序 - 它只需要存在一些等效的串行執(zhí)行。
這些定義如此混亂的原因之一是線性化來(lái)自分布式系統(tǒng)和并發(fā)編程社區(qū),可串行化來(lái)自數(shù)據(jù)庫(kù)社區(qū)。如今,幾乎每個(gè)人都使用分布式系統(tǒng)和數(shù)據(jù)庫(kù),這往往會(huì)導(dǎo)致過(guò)載的術(shù)語(yǔ)(例如,“一致性”,“原子”)。
很多文章和博客里提到,zookeeper是一種提供強(qiáng)一致性的服務(wù),在分區(qū)容錯(cuò)性和可用性上做了一定折中,這和CAP理論是吻合的。但實(shí)際上Zookeeper提供的只是單調(diào)一致性。
原因:
1. 假設(shè)有2n+1個(gè)server,在同步流程中,leader向follower同步數(shù)據(jù),當(dāng)同步完成的follower數(shù)量大于 n+1時(shí)同步流程結(jié)束,系統(tǒng)可接受client的連接請(qǐng)求。如果client連接的并非同步完成的follower,那么得到的并非最新數(shù)據(jù),但可以保證單調(diào)性,也就是說(shuō),可獲取的數(shù)據(jù)順序是單調(diào)遞增的。
2. 假設(shè)是follower接收到的寫(xiě)請(qǐng)求,則會(huì)轉(zhuǎn)發(fā)給leader處理;leader完成兩階段提交的機(jī)制。向所有server發(fā)起提案,當(dāng)提案獲得超過(guò)半數(shù)(n+1)的server的ACK后,將對(duì)整個(gè)集群進(jìn)行同步,超過(guò)半數(shù)(n+1)的server同步完成后,該寫(xiě)請(qǐng)求完成。如果client連接的并非同步完成follower,那么得到的并非最新數(shù)據(jù),但可以保證單調(diào)性,也就是說(shuō),可獲取的數(shù)據(jù)順序是單調(diào)遞增的。
用分布式系統(tǒng)的CAP原則來(lái)分析Zookeeper:
(1)C: Zookeeper保證了最終一致性,在十幾秒可以Sync到各個(gè)節(jié)點(diǎn)
(2)A: Zookeeper保證了可用性,數(shù)據(jù)總是可用的,沒(méi)有鎖.并且有一大半的節(jié)點(diǎn)所擁有的數(shù)據(jù)是最新的,實(shí)時(shí)的. 如果想保證取得是數(shù)據(jù)一定是最新的,需要手工調(diào)用Sync()
(3)P: 有2點(diǎn)需要分析的
可以的出的結(jié)論是Zookeeper的一致性保證的是單調(diào)一致性,CAP原則中的C是強(qiáng)一致性。
創(chuàng)新互聯(lián)www.cdcxhl.cn,專業(yè)提供香港、美國(guó)云服務(wù)器,動(dòng)態(tài)BGP最優(yōu)骨干路由自動(dòng)選擇,持續(xù)穩(wěn)定高效的網(wǎng)絡(luò)助力業(yè)務(wù)部署。公司持有工信部辦法的idc、isp許可證, 機(jī)房獨(dú)有T級(jí)流量清洗系統(tǒng)配攻擊溯源,準(zhǔn)確進(jìn)行流量調(diào)度,確保服務(wù)器高可用性。佳節(jié)活動(dòng)現(xiàn)已開(kāi)啟,新人活動(dòng)云服務(wù)器買(mǎi)多久送多久。