又或者在網(wǎng)上購(gòu)物明明已經(jīng)扣款,但是卻告訴我沒(méi)有發(fā)生交易。這一系列情況都是因?yàn)闆](méi)有事務(wù)導(dǎo)致的。這說(shuō)明了事務(wù)在生活中的一些重要性。
成都地區(qū)優(yōu)秀IDC服務(wù)器托管提供商(創(chuàng)新互聯(lián)).為客戶提供專業(yè)的內(nèi)蒙古服務(wù)器托管,四川各地服務(wù)器托管,內(nèi)蒙古服務(wù)器托管、多線服務(wù)器托管.托管咨詢專線:028-86922220有了事務(wù),你去小賣鋪買東西,那就是一手交錢一手交貨。有了事務(wù),你去網(wǎng)上購(gòu)物,扣款即產(chǎn)生訂單交易。
事務(wù)的具體定義
事務(wù)提供一種機(jī)制將一個(gè)活動(dòng)涉及的所有操作納入到一個(gè)不可分割的執(zhí)行單元,組成事務(wù)的所有操作只有在所有操作均能正常執(zhí)行的情況下方能提交,只要其中任一操作執(zhí)行失敗,都將導(dǎo)致整個(gè)事務(wù)的回滾。
簡(jiǎn)單地說(shuō),事務(wù)提供一種“要么什么都不做,要么做全套(All or Nothing)”機(jī)制。
數(shù)據(jù)庫(kù)本地事務(wù)
ACID
說(shuō)到數(shù)據(jù)庫(kù)事務(wù)就不得不說(shuō),數(shù)據(jù)庫(kù)事務(wù)中的四大特性 ACID:
A:原子性(Atomicity),一個(gè)事務(wù)(transaction)中的所有操作,要么全部完成,要么全部不完成,不會(huì)結(jié)束在中間某個(gè)環(huán)節(jié)。
事務(wù)在執(zhí)行過(guò)程中發(fā)生錯(cuò)誤,會(huì)被回滾(Rollback)到事務(wù)開(kāi)始前的狀態(tài),就像這個(gè)事務(wù)從來(lái)沒(méi)有執(zhí)行過(guò)一樣。
就像你買東西要么交錢收貨一起都執(zhí)行,要么發(fā)不出貨,就退錢。
C:一致性(Consistency),事務(wù)的一致性指的是在一個(gè)事務(wù)執(zhí)行之前和執(zhí)行之后數(shù)據(jù)庫(kù)都必須處于一致性狀態(tài)。
如果事務(wù)成功地完成,那么系統(tǒng)中所有變化將正確地應(yīng)用,系統(tǒng)處于有效狀態(tài)。
如果在事務(wù)中出現(xiàn)錯(cuò)誤,那么系統(tǒng)中的所有變化將自動(dòng)地回滾,系統(tǒng)返回到原始狀態(tài)。
I:隔離性(Isolation),指的是在并發(fā)環(huán)境中,當(dāng)不同的事務(wù)同時(shí)操縱相同的數(shù)據(jù)時(shí),每個(gè)事務(wù)都有各自的完整數(shù)據(jù)空間。
由并發(fā)事務(wù)所做的修改必須與任何其他并發(fā)事務(wù)所做的修改隔離。事務(wù)查看數(shù)據(jù)更新時(shí),數(shù)據(jù)所處的狀態(tài)要么是另一事務(wù)修改它之前的狀態(tài),要么是另一事務(wù)修改它之后的狀態(tài),事務(wù)不會(huì)查看到中間狀態(tài)的數(shù)據(jù)。
打個(gè)比方,你買東西這個(gè)事情,是不影響其他人的。
D:持久性(Durability),指的是只要事務(wù)成功結(jié)束,它對(duì)數(shù)據(jù)庫(kù)所做的更新就必須永久保存下來(lái)。
即使發(fā)生系統(tǒng)崩潰,重新啟動(dòng)數(shù)據(jù)庫(kù)系統(tǒng)后,數(shù)據(jù)庫(kù)還能恢復(fù)到事務(wù)成功結(jié)束時(shí)的狀態(tài)。
打個(gè)比方,你買東西的時(shí)候需要記錄在賬本上,即使老板忘記了那也有據(jù)可查。
InnoDB 實(shí)現(xiàn)原理
InnoDB 是 MySQL 的一個(gè)存儲(chǔ)引擎,大部分人對(duì) MySQL 都比較熟悉,這里簡(jiǎn)單介紹一下數(shù)據(jù)庫(kù)事務(wù)實(shí)現(xiàn)的一些基本原理。
在本地事務(wù)中,服務(wù)和資源在事務(wù)的包裹下可以看做是一體的,如下圖:
我們的本地事務(wù)由資源管理器進(jìn)行管理:
而事務(wù)的 ACID 是通過(guò) InnoDB 日志和鎖來(lái)保證。事務(wù)的隔離性是通過(guò)數(shù)據(jù)庫(kù)鎖的機(jī)制實(shí)現(xiàn)的,持久性通過(guò) Redo Log(重做日志)來(lái)實(shí)現(xiàn),原子性和一致性通過(guò) Undo Log 來(lái)實(shí)現(xiàn)。
Undo Log 的原理很簡(jiǎn)單,為了滿足事務(wù)的原子性,在操作任何數(shù)據(jù)之前,首先將數(shù)據(jù)備份到一個(gè)地方(這個(gè)存儲(chǔ)數(shù)據(jù)備份的地方稱為 Undo Log)。然后進(jìn)行數(shù)據(jù)的修改。
如果出現(xiàn)了錯(cuò)誤或者用戶執(zhí)行了 Rollback 語(yǔ)句,系統(tǒng)可以利用 Undo Log 中的備份將數(shù)據(jù)恢復(fù)到事務(wù)開(kāi)始之前的狀態(tài)。
和 Undo Log 相反,Redo Log 記錄的是新數(shù)據(jù)的備份。在事務(wù)提交前,只要將 Redo Log 持久化即可,不需要將數(shù)據(jù)持久化。
當(dāng)系統(tǒng)崩潰時(shí),雖然數(shù)據(jù)沒(méi)有持久化,但是 Redo Log 已經(jīng)持久化。系統(tǒng)可以根據(jù) Redo Log 的內(nèi)容,將所有數(shù)據(jù)恢復(fù)到最新的狀態(tài)。對(duì)具體實(shí)現(xiàn)過(guò)程有興趣的同學(xué)可以去自行搜索擴(kuò)展。
分布式事務(wù)
什么是分布式事務(wù)
分布式事務(wù)指事務(wù)的參與者、支持事務(wù)的服務(wù)器、資源服務(wù)器以及事務(wù)管理器分別位于不同的分布式系統(tǒng)的不同節(jié)點(diǎn)之上。
簡(jiǎn)單的說(shuō),就是一次大的操作由不同的小操作組成,這些小的操作分布在不同的服務(wù)器上,且屬于不同的應(yīng)用,分布式事務(wù)需要保證這些小操作要么全部成功,要么全部失敗。
本質(zhì)上來(lái)說(shuō),分布式事務(wù)就是為了保證不同數(shù)據(jù)庫(kù)的數(shù)據(jù)一致性。
分布式事務(wù)產(chǎn)生的原因
從上面本地事務(wù)來(lái)看,我們可以分為兩塊:
Service 產(chǎn)生多個(gè)節(jié)點(diǎn)
Resource 產(chǎn)生多個(gè)節(jié)點(diǎn)
Service 多個(gè)節(jié)點(diǎn)
隨著互聯(lián)網(wǎng)快速發(fā)展,微服務(wù),SOA 等服務(wù)架構(gòu)模式正在被大規(guī)模的使用。
舉個(gè)簡(jiǎn)單的例子,一個(gè)公司之內(nèi),用戶的資產(chǎn)可能分為好多個(gè)部分,比如余額,積分,優(yōu)惠券等等。
在公司內(nèi)部有可能積分功能由一個(gè)微服務(wù)團(tuán)隊(duì)維護(hù),優(yōu)惠券又是另外的團(tuán)隊(duì)維護(hù)。
這樣的話就無(wú)法保證積分扣減了之后,優(yōu)惠券能否扣減成功。
Resource多個(gè)節(jié)點(diǎn)
同樣的,互聯(lián)網(wǎng)發(fā)展得太快了,我們的 MySQL 一般來(lái)說(shuō)裝千萬(wàn)級(jí)的數(shù)據(jù)就得進(jìn)行分庫(kù)分表。
對(duì)于一個(gè)支付寶的轉(zhuǎn)賬業(yè)務(wù)來(lái)說(shuō),你給朋友轉(zhuǎn)錢,有可能你的數(shù)據(jù)庫(kù)是在北京,而你的朋友的錢是存在上海,所以我們依然無(wú)法保證他們能同時(shí)成功。
分布式事務(wù)的基礎(chǔ)
從上面來(lái)看分布式事務(wù)是隨著互聯(lián)網(wǎng)高速發(fā)展應(yīng)運(yùn)而生的,這是一個(gè)必然。
我們之前說(shuō)過(guò)數(shù)據(jù)庫(kù)的 ACID 四大特性,已經(jīng)無(wú)法滿足我們分布式事務(wù),這個(gè)時(shí)候又有一些新的大佬提出一些新的理論。
CAP
CAP 定理,又被叫作布魯爾定理。對(duì)于設(shè)計(jì)分布式系統(tǒng)(不僅僅是分布式事務(wù))的架構(gòu)師來(lái)說(shuō),CAP 就是你的入門理論。
C (一致性):對(duì)某個(gè)指定的客戶端來(lái)說(shuō),讀操作能返回最新的寫操作。
對(duì)于數(shù)據(jù)分布在不同節(jié)點(diǎn)上的數(shù)據(jù)來(lái)說(shuō),如果在某個(gè)節(jié)點(diǎn)更新了數(shù)據(jù),那么在其他節(jié)點(diǎn)如果都能讀取到這個(gè)最新的數(shù)據(jù),那么就稱為強(qiáng)一致,如果有某個(gè)節(jié)點(diǎn)沒(méi)有讀取到,那就是分布式不一致。
A (可用性):非故障的節(jié)點(diǎn)在合理的時(shí)間內(nèi)返回合理的響應(yīng)(不是錯(cuò)誤和超時(shí)的響應(yīng))??捎眯缘膬蓚€(gè)關(guān)鍵一個(gè)是合理的時(shí)間,一個(gè)是合理的響應(yīng)。
合理的時(shí)間指的是請(qǐng)求不能無(wú)限被阻塞,應(yīng)該在合理的時(shí)間給出返回。合理的響應(yīng)指的是系統(tǒng)應(yīng)該明確返回結(jié)果并且結(jié)果是正確的,這里的正確指的是比如應(yīng)該返回 50,而不是返回 40。
P (分區(qū)容錯(cuò)性):當(dāng)出現(xiàn)網(wǎng)絡(luò)分區(qū)后,系統(tǒng)能夠繼續(xù)工作。打個(gè)比方,這里集群有多臺(tái)機(jī)器,有臺(tái)機(jī)器網(wǎng)絡(luò)出現(xiàn)了問(wèn)題,但是這個(gè)集群仍然可以正常工作。
熟悉 CAP 的人都知道,三者不能共有,如果感興趣可以搜索 CAP 的證明,在分布式系統(tǒng)中,網(wǎng)絡(luò)無(wú)法 100% 可靠,分區(qū)其實(shí)是一個(gè)必然現(xiàn)象。
如果我們選擇了 CA 而放棄了 P,那么當(dāng)發(fā)生分區(qū)現(xiàn)象時(shí),為了保證一致性,這個(gè)時(shí)候必須拒絕請(qǐng)求,但是 A 又不允許,所以分布式系統(tǒng)理論上不可能選擇 CA 架構(gòu),只能選擇 CP 或者 AP 架構(gòu)。
對(duì)于 CP 來(lái)說(shuō),放棄可用性,追求一致性和分區(qū)容錯(cuò)性,我們的 ZooKeeper 其實(shí)就是追求的強(qiáng)一致。
對(duì)于 AP 來(lái)說(shuō),放棄一致性(這里說(shuō)的一致性是強(qiáng)一致性),追求分區(qū)容錯(cuò)性和可用性,這是很多分布式系統(tǒng)設(shè)計(jì)時(shí)的選擇,后面的 BASE 也是根據(jù) AP 來(lái)擴(kuò)展。
順便一提,CAP 理論中是忽略網(wǎng)絡(luò)延遲,也就是當(dāng)事務(wù)提交時(shí),從節(jié)點(diǎn) A 復(fù)制到節(jié)點(diǎn) B 沒(méi)有延遲,但是在現(xiàn)實(shí)中這個(gè)是明顯不可能的,所以總會(huì)有一定的時(shí)間是不一致。
同時(shí) CAP 中選擇兩個(gè),比如你選擇了 CP,并不是叫你放棄 A。因?yàn)?P 出現(xiàn)的概率實(shí)在是太小了,大部分的時(shí)間你仍然需要保證 CA。
就算分區(qū)出現(xiàn)了你也要為后來(lái)的 A 做準(zhǔn)備,比如通過(guò)一些日志的手段,是其他機(jī)器回復(fù)至可用。
BASE
BASE 是 Basically Available(基本可用)、Soft state(軟狀態(tài))和 Eventually consistent (最終一致性)三個(gè)短語(yǔ)的縮寫,是對(duì) CAP 中 AP 的一個(gè)擴(kuò)展。
基本可用:分布式系統(tǒng)在出現(xiàn)故障時(shí),允許損失部分可用功能,保證核心功能可用。
軟狀態(tài):允許系統(tǒng)中存在中間狀態(tài),這個(gè)狀態(tài)不影響系統(tǒng)可用性,這里指的是 CAP 中的不一致。
最終一致:最終一致是指經(jīng)過(guò)一段時(shí)間后,所有節(jié)點(diǎn)數(shù)據(jù)都將會(huì)達(dá)到一致。
BASE 解決了 CAP 中理論沒(méi)有網(wǎng)絡(luò)延遲,在 BASE 中用軟狀態(tài)和最終一致,保證了延遲后的一致性。
BASE 和 ACID 是相反的,它完全不同于 ACID 的強(qiáng)一致性模型,而是通過(guò)犧牲強(qiáng)一致性來(lái)獲得可用性,并允許數(shù)據(jù)在一段時(shí)間內(nèi)是不一致的,但最終達(dá)到一致?tīng)顟B(tài)。
分布式事務(wù)解決方案
有了上面的理論基礎(chǔ)后,這里開(kāi)始介紹幾種常見(jiàn)的分布式事務(wù)的解決方案。
是否真的要分布式事務(wù)
在說(shuō)方案之前,首先你一定要明確你是否真的需要分布式事務(wù)?
上面說(shuō)過(guò)出現(xiàn)分布式事務(wù)的兩個(gè)原因,其中有個(gè)原因是因?yàn)槲⒎?wù)過(guò)多。我見(jiàn)過(guò)太多團(tuán)隊(duì)一個(gè)人維護(hù)幾個(gè)微服務(wù),太多團(tuán)隊(duì)過(guò)度設(shè)計(jì),搞得所有人疲勞不堪。
而微服務(wù)過(guò)多就會(huì)引出分布式事務(wù),這個(gè)時(shí)候我不會(huì)建議你去采用下面任何一種方案,而是請(qǐng)把需要事務(wù)的微服務(wù)聚合成一個(gè)單機(jī)服務(wù),使用數(shù)據(jù)庫(kù)的本地事務(wù)。
因?yàn)椴徽撊魏我环N方案都會(huì)增加你系統(tǒng)的復(fù)雜度,這樣的成本實(shí)在是太高了,千萬(wàn)不要因?yàn)樽非竽承┰O(shè)計(jì),而引入不必要的成本和復(fù)雜度。
如果你確定需要引入分布式事務(wù)可以看看下面幾種常見(jiàn)的方案。
2PC
說(shuō)到 2PC 就不得不聊數(shù)據(jù)庫(kù)分布式事務(wù)中的 XA Transactions。
在 XA 協(xié)議中分為兩階段:
事務(wù)管理器要求每個(gè)涉及到事務(wù)的數(shù)據(jù)庫(kù)預(yù)提交(precommit)此操作,并反映是否可以提交。
事務(wù)協(xié)調(diào)器要求每個(gè)數(shù)據(jù)庫(kù)提交數(shù)據(jù),或者回滾數(shù)據(jù)。
優(yōu)點(diǎn):
盡量保證了數(shù)據(jù)的強(qiáng)一致,實(shí)現(xiàn)成本較低,在各大主流數(shù)據(jù)庫(kù)都有自己實(shí)現(xiàn),對(duì)于 MySQL 是從 5.5 開(kāi)始支持。
缺點(diǎn):
單點(diǎn)問(wèn)題:事務(wù)管理器在整個(gè)流程中扮演的角色很關(guān)鍵,如果其宕機(jī),比如在第一階段已經(jīng)完成,在第二階段正準(zhǔn)備提交的時(shí)候事務(wù)管理器宕機(jī),資源管理器就會(huì)一直阻塞,導(dǎo)致數(shù)據(jù)庫(kù)無(wú)法使用。
同步阻塞:在準(zhǔn)備就緒之后,資源管理器中的資源一直處于阻塞,直到提交完成,釋放資源。
數(shù)據(jù)不一致:兩階段提交協(xié)議雖然為分布式數(shù)據(jù)強(qiáng)一致性所設(shè)計(jì),但仍然存在數(shù)據(jù)不一致性的可能。
比如在第二階段中,假設(shè)協(xié)調(diào)者發(fā)出了事務(wù) Commit 的通知,但是因?yàn)榫W(wǎng)絡(luò)問(wèn)題該通知僅被一部分參與者所收到并執(zhí)行了 Commit 操作,其余的參與者則因?yàn)闆](méi)有收到通知一直處于阻塞狀態(tài),這時(shí)候就產(chǎn)生了數(shù)據(jù)的不一致性。
總的來(lái)說(shuō),XA 協(xié)議比較簡(jiǎn)單,成本較低,但是其單點(diǎn)問(wèn)題,以及不能支持高并發(fā)(由于同步阻塞)依然是其大的弱點(diǎn)。
TCC
關(guān)于 TCC(Try-Confirm-Cancel)的概念,最早是由 Pat Helland 于 2007 年發(fā)表的一篇名為《Life beyond Distributed Transactions:an Apostate’s Opinion》的論文提出。
TCC 事務(wù)機(jī)制相比于上面介紹的 XA,解決了如下幾個(gè)缺點(diǎn):
解決了協(xié)調(diào)者單點(diǎn),由主業(yè)務(wù)方發(fā)起并完成這個(gè)業(yè)務(wù)活動(dòng)。業(yè)務(wù)活動(dòng)管理器也變成多點(diǎn),引入集群。
同步阻塞:引入超時(shí),超時(shí)后進(jìn)行補(bǔ)償,并且不會(huì)鎖定整個(gè)資源,將資源轉(zhuǎn)換為業(yè)務(wù)邏輯形式,粒度變小。
數(shù)據(jù)一致性,有了補(bǔ)償機(jī)制之后,由業(yè)務(wù)活動(dòng)管理器控制一致性。
對(duì)于 TCC 的解釋:
Try 階段:嘗試執(zhí)行,完成所有業(yè)務(wù)檢查(一致性),預(yù)留必需業(yè)務(wù)資源(準(zhǔn)隔離性)。
Confirm 階段:確認(rèn)真正執(zhí)行業(yè)務(wù),不作任何業(yè)務(wù)檢查,只使用 Try 階段預(yù)留的業(yè)務(wù)資源,Confirm 操作滿足冪等性。要求具備冪等設(shè)計(jì),Confirm 失敗后需要進(jìn)行重試。
Cancel 階段:取消執(zhí)行,釋放 Try 階段預(yù)留的業(yè)務(wù)資源,Cancel 操作滿足冪等性。Cancel 階段的異常和 Confirm 階段異常處理方案基本上一致。
舉個(gè)簡(jiǎn)單的例子:如果你用 100 元買了一瓶水, Try 階段:你需要向你的錢包檢查是否夠 100 元并鎖住這 100 元,水也是一樣的。
如果有一個(gè)失敗,則進(jìn)行 Cancel(釋放這 100 元和這一瓶水),如果 Cancel 失敗不論什么失敗都進(jìn)行重試 Cancel,所以需要保持冪等。
如果都成功,則進(jìn)行 Confirm,確認(rèn)這 100 元被扣,和這一瓶水被賣,如果 Confirm 失敗無(wú)論什么失敗則重試(會(huì)依靠活動(dòng)日志進(jìn)行重試)。
對(duì)于 TCC 來(lái)說(shuō)適合一些:
強(qiáng)隔離性,嚴(yán)格一致性要求的活動(dòng)業(yè)務(wù)。
執(zhí)行時(shí)間較短的業(yè)務(wù)。
實(shí)現(xiàn)參考:https://github.com/liuyangming/ByteTCC/。
本地消息表
本地消息表這個(gè)方案最初是 eBay 提出的,eBay 的完整方案 https://queue.acm.org/detail.cfm?id=1394128。
此方案的核心是將需要分布式處理的任務(wù)通過(guò)消息日志的方式來(lái)異步執(zhí)行。消息日志可以存儲(chǔ)到本地文本、數(shù)據(jù)庫(kù)或消息隊(duì)列,再通過(guò)業(yè)務(wù)規(guī)則自動(dòng)或人工發(fā)起重試。
人工重試更多的是應(yīng)用于支付場(chǎng)景,通過(guò)對(duì)賬系統(tǒng)對(duì)事后問(wèn)題的處理。
對(duì)于本地消息隊(duì)列來(lái)說(shuō)核心是把大事務(wù)轉(zhuǎn)變?yōu)樾∈聞?wù)。還是舉上面用 100 元去買一瓶水的例子。
1. 當(dāng)你扣錢的時(shí)候,你需要在你扣錢的服務(wù)器上新增加一個(gè)本地消息表,你需要把你扣錢和減去水的庫(kù)存寫入到本地消息表,放入同一個(gè)事務(wù)(依靠數(shù)據(jù)庫(kù)本地事務(wù)保證一致性)。
2. 這個(gè)時(shí)候有個(gè)定時(shí)任務(wù)去輪詢這個(gè)本地事務(wù)表,把沒(méi)有發(fā)送的消息,扔給商品庫(kù)存服務(wù)器,叫它減去水的庫(kù)存,到達(dá)商品服務(wù)器之后,這時(shí)得先寫入這個(gè)服務(wù)器的事務(wù)表,然后進(jìn)行扣減,扣減成功后,更新事務(wù)表中的狀態(tài)。
3. 商品服務(wù)器通過(guò)定時(shí)任務(wù)掃描消息表或者直接通知扣錢服務(wù)器,扣錢服務(wù)器在本地消息表進(jìn)行狀態(tài)更新。
4. 針對(duì)一些異常情況,定時(shí)掃描未成功處理的消息,進(jìn)行重新發(fā)送,在商品服務(wù)器接到消息之后,首先判斷是否是重復(fù)的。
如果已經(jīng)接收,再判斷是否執(zhí)行,如果執(zhí)行在馬上又進(jìn)行通知事務(wù);如果未執(zhí)行,需要重新執(zhí)行由業(yè)務(wù)保證冪等,也就是不會(huì)多扣一瓶水。
本地消息隊(duì)列是 BASE 理論,是最終一致模型,適用于對(duì)一致性要求不高的情況。實(shí)現(xiàn)這個(gè)模型時(shí)需要注意重試的冪等。
MQ 事務(wù)
在 RocketMQ 中實(shí)現(xiàn)了分布式事務(wù),實(shí)際上是對(duì)本地消息表的一個(gè)封裝,將本地消息表移動(dòng)到了 MQ 內(nèi)部。
下面簡(jiǎn)單介紹一下MQ事務(wù),如果想對(duì)其詳細(xì)了解可以參考:https://www.jianshu.com/p/453c6e7ff81c。
基本流程如下:
第一階段 Prepared 消息,會(huì)拿到消息的地址。
第二階段執(zhí)行本地事務(wù)。
第三階段通過(guò)第一階段拿到的地址去訪問(wèn)消息,并修改狀態(tài)。消息接受者就能使用這個(gè)消息。
如果確認(rèn)消息失敗,在 RocketMQ Broker 中提供了定時(shí)掃描沒(méi)有更新?tīng)顟B(tài)的消息。
如果有消息沒(méi)有得到確認(rèn),會(huì)向消息發(fā)送者發(fā)送消息,來(lái)判斷是否提交,在 RocketMQ 中是以 Listener 的形式給發(fā)送者,用來(lái)處理。
如果消費(fèi)超時(shí),則需要一直重試,消息接收端需要保證冪等。如果消息消費(fèi)失敗,這時(shí)就需要人工進(jìn)行處理,因?yàn)檫@個(gè)概率較低,如果為了這種小概率時(shí)間而設(shè)計(jì)這個(gè)復(fù)雜的流程反而得不償失。
Saga 事務(wù)
Saga 是 30 年前一篇數(shù)據(jù)庫(kù)倫理提到的一個(gè)概念。其核心思想是將長(zhǎng)事務(wù)拆分為多個(gè)本地短事務(wù),由 Saga 事務(wù)協(xié)調(diào)器協(xié)調(diào),如果正常結(jié)束那就正常完成,如果某個(gè)步驟失敗,則根據(jù)相反順序一次調(diào)用補(bǔ)償操作。
Saga 的組成:每個(gè) Saga 由一系列 sub-transaction Ti 組成,每個(gè) Ti 都有對(duì)應(yīng)的補(bǔ)償動(dòng)作 Ci,補(bǔ)償動(dòng)作用于撤銷 Ti 造成的結(jié)果。這里的每個(gè) T,都是一個(gè)本地事務(wù)。
可以看到,和 TCC 相比,Saga 沒(méi)有“預(yù)留 try”動(dòng)作,它的 Ti 就是直接提交到庫(kù)。
Saga 的執(zhí)行順序有兩種:
T1,T2,T3,...,Tn。
T1,T2,...,Tj,Cj,...,C2,C1,其中 0 < j < n 。
Saga 定義了兩種恢復(fù)策略:
向后恢復(fù),即上面提到的第二種執(zhí)行順序,其中 j 是發(fā)生錯(cuò)誤的 sub-transaction,這種做法的效果是撤銷掉之前所有成功的 sub-transation,使得整個(gè) Saga 的執(zhí)行結(jié)果撤銷。
向前恢復(fù),適用于必須要成功的場(chǎng)景,執(zhí)行順序是類似于這樣的:T1,T2,...,Tj(失敗),Tj(重試),...,Tn,其中 j 是發(fā)生錯(cuò)誤的 sub-transaction。該情況下不需要 Ci。
這里要注意的是,在 Saga 模式中不能保證隔離性,因?yàn)闆](méi)有鎖住資源,其他事務(wù)依然可以覆蓋或者影響當(dāng)前事務(wù)。
還是拿 100 元買一瓶水的例子來(lái)說(shuō),這里定義:
T1 = 扣 100 元,T2 = 給用戶加一瓶水,T3 = 減庫(kù)存一瓶水。
C1 = 加100元,C2 = 給用戶減一瓶水,C3 = 給庫(kù)存加一瓶水。
我們一次進(jìn)行 T1,T2,T3 如果發(fā)生問(wèn)題,就執(zhí)行發(fā)生問(wèn)題的 C 操作的反向。
上面說(shuō)到的隔離性的問(wèn)題會(huì)出現(xiàn)在,如果執(zhí)行到 T3 這個(gè)時(shí)候需要執(zhí)行回滾,但是這個(gè)用戶已經(jīng)把水喝了(另外一個(gè)事務(wù)),回滾的時(shí)候就會(huì)發(fā)現(xiàn),無(wú)法給用戶減一瓶水了。
這就是事務(wù)之間沒(méi)有隔離性的問(wèn)題。可以看見(jiàn) Saga 模式?jīng)]有隔離性的影響還是較大,可以參照華為的解決方案:從業(yè)務(wù)層面入手加入一 Session 以及鎖的機(jī)制來(lái)保證能夠串行化操作資源。
也可以在業(yè)務(wù)層面通過(guò)預(yù)先凍結(jié)資金的方式隔離這部分資源, 最后在業(yè)務(wù)操作的過(guò)程中可以通過(guò)及時(shí)讀取當(dāng)前狀態(tài)的方式獲取到最新的更新。(具體實(shí)例:可以參考華為的 Service Comb)
最后
還是那句話,能不用分布式事務(wù)就不用,如果非得使用的話,結(jié)合自己的業(yè)務(wù)分析,看看自己的業(yè)務(wù)比較適合哪一種,是在乎強(qiáng)一致,還是最終一致即可。
最后在總結(jié)一些問(wèn)題,大家可以下來(lái)自己從文章找尋答案:
ACID 和 CAP 的 CA 是一樣的嗎?
分布式事務(wù)常用的解決方案的優(yōu)缺點(diǎn)是什么?適用于什么場(chǎng)景?
分布式事務(wù)出現(xiàn)的原因?用來(lái)解決什么痛點(diǎn)?