認識事務
在太湖等地區(qū),都構建了全面的區(qū)域性戰(zhàn)略布局,加強發(fā)展的系統(tǒng)性、市場前瞻性、產品創(chuàng)新能力,以專注、極致的服務理念,為客戶提供成都網站設計、網站制作 網站設計制作定制網站,公司網站建設,企業(yè)網站建設,成都品牌網站建設,網絡營銷推廣,外貿營銷網站建設,太湖網站建設費用合理。
1.1 為什么需要數據庫事務
轉賬是生活中常見的操作,比如從A賬戶轉賬100元到B賬號。站在用戶角度而言,這是一個邏輯上的單一操作,然而在數據庫系統(tǒng)中,至少會分成兩個步驟來完成:
將A賬戶的金額減少100元
將B賬戶的金額增加100元。
在這個過程中可能會出現以下問題:
轉賬操作的第一步執(zhí)行成功,A賬戶上的錢減少了100元,但是第二步執(zhí)行失敗或者未執(zhí)行便發(fā)生系統(tǒng)崩潰,導致B賬戶并沒有相應增加100元。
轉賬操作剛完成就發(fā)生系統(tǒng)崩潰,系統(tǒng)重啟恢復時丟失了崩潰前的轉賬記錄。
同時又另一個用戶轉賬給B賬戶,由于同時對B賬戶進行操作,導致B賬戶金額出現異常。
為了便于解決這些問題,需要引入數據庫事務的概念。
1.2 什么是數據庫事務
定義:數據庫事務是構成單一邏輯工作單元的操作集合,一個典型的數據庫事務如下所示:
關于事務的定義有幾點需要解釋下:
數據庫事務可以包含一個或多個數據庫操作,但這些操作構成一個邏輯上的整體。
構成邏輯整體的這些數據庫操作,要么全部執(zhí)行成功,要么全部不執(zhí)行。
構成事務的所有操作,要么全都對數據庫產生影響,要么全都不產生影響,即不管事務是否執(zhí)行成功,數據庫總能保持一致性狀態(tài)。
以上即使在數據庫出現故障以及并發(fā)事務存在的情況下依然成立。
1.3 事務如何解決問題
對于上面的轉賬例子,可以將轉賬相關的所有操作包含在一個事務中
當數據庫操作失敗或者系統(tǒng)出現崩潰,系統(tǒng)能夠以事務為邊界進行恢復,不會出現A賬戶金額減少而B賬戶未增加的情況。
當有多個用戶同時操作數據庫時,數據庫能夠以事務為單位進行并發(fā)控制,使多個用戶對B賬戶的轉賬操作相互隔離。
事務使系統(tǒng)能夠更方便的進行故障恢復以及并發(fā)控制,從而保證數據庫狀態(tài)的一致性。
1.4 事務的ACID特性以及實現原理
原子性(Atomicity):事務中的所有操作作為一個整體像原子一樣不可分割,要么全部成功,要么全部失敗。
一致性(Consistency):事務的執(zhí)行結果必須使數據庫從一個一致性狀態(tài)到另一個一致性狀態(tài)。
一致性狀態(tài)是指:
系統(tǒng)的狀態(tài)滿足數據的完整性約束(主碼,參照完整性,check約束等)
系統(tǒng)的狀態(tài)反應數據庫本應描述的現實世界的真實狀態(tài),比如轉賬前后兩個賬戶的金額總和應該保持不變。
隔離性(Isolation):并發(fā)執(zhí)行的事務不會相互影響,其對數據庫的影響和它們串行執(zhí)行時一樣。
比如多個用戶同時往一個賬戶轉賬,最后賬戶的結果應該和他們按先后次序轉賬的結果一樣。
持久性(Durability):事務一旦提交,其對數據庫的更新就是持久的。任何事務或系統(tǒng)故障都不會導致數據丟失。
在事務的ACID特性中,C即一致性是事務的根本追求,而對數據一致性的破壞主要來自兩個方面:
事務的并發(fā)執(zhí)行
事務故障或系統(tǒng)故障
數據庫系統(tǒng)是通過并發(fā)控制技術和日志恢復技術來避免這種情況發(fā)生的。
并發(fā)控制技術保證了事務的隔離性,使數據庫的一致性狀態(tài)不會因為并發(fā)執(zhí)行的操作被破壞。
日志恢復技術保證了事務的原子性,使一致性狀態(tài)不會因事務或系統(tǒng)故障被破壞。
同時使已提交的對數據庫的修改不會因系統(tǒng)崩潰而丟失,保證了事務的持久性。
并發(fā)異常與并發(fā)控制
2.1 常見的并發(fā)異常
在講解并發(fā)控制技術前,先簡單介紹下數據庫常見的并發(fā)異常。
臟寫,臟寫是指事務回滾了其他事務對數據項的已提交修改,比如下面這種情況
在事務1對數據A的回滾,導致事務2對A的已提交修改也被回滾了。
丟失更新。丟失更新是指事務覆蓋了其他事務對數據的已提交修改,導致這些修改好像丟失了一樣。
事務1和事務2讀取A的值都為10,事務2先將A加上10并提交修改,之后事務2將A減少10并提交修改,A的值最后為,導致事務2對A的修改好像丟失了一樣
臟讀。臟讀是指一個事務讀取了另一個事務未提交的數據
在事務1對A的處理過程中,事務2讀取了A的值,但之后事務1回滾,導致事務2讀取的A是未提交的臟數據。
不可重復讀,指一個事務對同一數據的讀取結果前后不一致。
臟讀和不可重復讀的區(qū)別在于:前者讀取的是事務未提交的臟數據,后者讀取的是事務已經提交的數據,只不過因為數據被其他事務修改過導致前后兩次讀取的結果不一樣
比如下面這種情況
由于事務2對A的已提交修改,事務1前后兩次讀取的結果不一致。
幻讀?;米x是指事務讀取某個范圍的數據時,因為其他事務的操作導致前后兩次讀取的結果不一致。
幻讀和不可重復讀的區(qū)別在于,不可重復讀是針對確定的某一行數據而言,而幻讀是針對不確定的多行數據。
因而幻讀通常出現在帶有查詢條件的范圍查詢中,比如下面這種情況:
事務1查詢A<5的數據,由于事務2插入了一條A=4的數據,導致事務1兩次查詢得到的結果不一樣
2.2 事務的隔離級別
事務具有隔離性,理論上來說事務之間的執(zhí)行不應該相互產生影響,其對數據庫的影響應該和它們串行執(zhí)行時一樣。
然而完全的隔離性會導致系統(tǒng)并發(fā)性能很低,降低對資源的利用率,因而實際上對隔離性的要求會有所放寬,這也會一定程度造成對數據庫一致性要求降低
SQL標準為事務定義了不同的隔離級別,從低到高依次是
讀未提交(READ UNCOMMITTED)
讀已提交(READ COMMITTED)
可重復讀(REPEATABLE READ)
串行化(SERIALIZABLE)
事務的隔離級別越低,可能出現的并發(fā)異常越多,但是通常而言系統(tǒng)能提供的并發(fā)能力越強。
不同的隔離級別與可能的并發(fā)異常的對應情況如下表所示
有一點需要強調,這種對應關系只是理論上的,對于特定的數據庫實現不一定準確
比如MySQL的Innodb存儲引擎通過Next-Key Locking技術在可重復讀級別就消除了幻讀的可能。
所有事務隔離級別都不允許出現臟寫,而串行化可以避免所有可能出現的并發(fā)異常,但是會極大的降低系統(tǒng)的并發(fā)處理能力。
2.3 事務隔離性的實現—常見的并發(fā)控制技術
并發(fā)控制技術是實現事務隔離性以及不同隔離級別的關鍵,實現方式有很多。按照其對可能沖突的操作采取的不同策略可以分為樂觀并發(fā)控制和悲觀并發(fā)控制兩大類。
樂觀并發(fā)控制:對于并發(fā)執(zhí)行可能沖突的操作,假定其不會真的沖突,允許并發(fā)執(zhí)行,直到真正發(fā)生沖突時才去解決沖突,比如讓事務回滾。
悲觀并發(fā)控制:對于并發(fā)執(zhí)行可能沖突的操作,假定其必定發(fā)生沖突,通過讓事務等待(鎖)或者中止(時間戳排序)的方式使并行的操作串行執(zhí)行。
2.3.1 基于封鎖的并發(fā)控制
核心思想:對于并發(fā)可能沖突的操作,比如讀-寫,寫-讀,寫-寫,通過鎖使它們互斥執(zhí)行。
鎖通常分為共享鎖和排他鎖兩種類型
共享鎖(S):事務T對數據A加共享鎖,其他事務只能對A加共享鎖但不能加排他鎖。
排他鎖(X):事務T對數據A加排他鎖,其他事務對A既不能加共享鎖也不能加排他鎖
基于鎖的并發(fā)控制流程:
事務根據自己對數據項進行的操作類型申請相應的鎖(讀申請共享鎖,寫申請排他鎖)
申請鎖的請求被發(fā)送給鎖管理器。鎖管理器根據當前數據項是否已經有鎖以及申請的和持有的鎖是否沖突決定是否為該請求授予鎖。
若鎖被授予,則申請鎖的事務可以繼續(xù)執(zhí)行;若被拒絕,則申請鎖的事務將進行等待,直到鎖被其他事務釋放。
可能出現的問題:
死鎖:多個事務持有鎖并互相循環(huán)等待其他事務的鎖導致所有事務都無法繼續(xù)執(zhí)行。
饑餓:數據項A一直被加共享鎖,導致事務一直無法獲取A的排他鎖。
對于可能發(fā)生沖突的并發(fā)操作,鎖使它們由并行變?yōu)榇袌?zhí)行,是一種悲觀的并發(fā)控制。
2.3.2 基于時間戳的并發(fā)控制
核心思想:對于并發(fā)可能沖突的操作,基于時間戳排序規(guī)則選定某事務繼續(xù)執(zhí)行,其他事務回滾。
系統(tǒng)會在每個事務開始時賦予其一個時間戳,這個時間戳可以是系統(tǒng)時鐘也可以是一個不斷累加的計數器值,當事務回滾時會為其賦予一個新的時間戳,先開始的事務時間戳小于后開始事務的時間戳。
每一個數據項Q有兩個時間戳相關的字段:
W-timestamp(Q):成功執(zhí)行write(Q)的所有事務的最大時間戳
R-timestamp(Q):成功執(zhí)行read(Q)的所有事務的最大時間戳
時間戳排序規(guī)則如下:
假設事務T發(fā)出read(Q),T的時間戳為TS
若TS(T)
read操作將被拒絕,T回滾。
若TS(T)>=W-timestamp(Q),則執(zhí)行read操作,同時把R-timestamp(Q)設置為TS(T)與R-timestamp(Q)中的最大值
假設事務T發(fā)出write(Q)
若TS(T)
若TS(T)
其他情況:系統(tǒng)執(zhí)行write操作,將W-timestamp(Q)設置為TS(T)
基于時間戳排序和基于鎖實現的本質一樣:對于可能沖突的并發(fā)操作,以串行的方式取代并發(fā)執(zhí)行,因而它也是一種悲觀并發(fā)控制。
它們的區(qū)別主要有兩點:
基于鎖是讓沖突的事務進行等待,而基于時間戳排序是讓沖突的事務回滾。
基于鎖沖突事務的執(zhí)行次序是根據它們申請鎖的順序,先申請的先執(zhí)行;而基于時間戳排序是根據特定的時間戳排序規(guī)則。
2.3.3 基于有效性檢查的并發(fā)控制
核心思想:事務對數據的更新首先在自己的工作空間進行,等到要寫回數據庫時才進行有效性檢查,對不符合要求的事務進行回滾。
基于有效性檢查的事務執(zhí)行過程會被分為三個階段:
讀階段:數據項被讀入并保存在事務的局部變量中。所有write操作都是對局部變量進行,并不對數據庫進行真正的更新。
有效性檢查階段:對事務進行有效性檢查,判斷是否可以執(zhí)行write操作而不違反可串行性。如果失敗,則回滾該事務。
寫階段:事務已通過有效性檢查,則將臨時變量中的結果更新到數據庫中。
有效性檢查通常也是通過對事務的時間戳進行比較完成的,不過和基于時間戳排序的規(guī)則不一樣。
該方法允許可能沖突的操作并發(fā)執(zhí)行,因為每個事務操作的都是自己工作空間的局部變量,直到有效性檢查階段發(fā)現了沖突才回滾。因而這是一種樂觀的并發(fā)策略。
2.3.4 基于快照隔離的并發(fā)控制
快照隔離是多版本并發(fā)控制(mvcc)的一種實現方式。
其核心思想是:數據庫為每個數據項維護多個版本(快照),每個事務只對屬于自己的私有快照進行更新,在事務真正提交前進行有效性檢查,使得事務正常提交更新或者失敗回滾。
由于快照隔離導致事務看不到其他事務對數據項的更新,為了避免出現丟失更新問題,可以采用以下兩種方案避免:
先提交者獲勝:對于執(zhí)行該檢查的事務T,判斷是否有其他事務已經將更新寫入數據庫,是則T回滾否則T正常提交。
先更新者獲勝:通過鎖機制保證第一個獲得鎖的事務提交其更新,之后試圖更新的事務中止。
事務間可能沖突的操作通過數據項的不同版本的快照相互隔離,到真正要寫入數據庫時才進行沖突檢測。因而這也是一種樂觀并發(fā)控制。
故障與故障恢復
3.1 為什么需要故障恢復技術
數據庫運行過程中可能會出現故障,這些故障包括事務故障和系統(tǒng)故障兩大類
事務故障:比如非法輸入,系統(tǒng)出現死鎖,導致事務無法繼續(xù)執(zhí)行。
系統(tǒng)故障:比如由于軟件漏洞或硬件錯誤導致系統(tǒng)崩潰或中止。
這些故障可能會對事務和數據庫狀態(tài)造成破壞,因而必須提供一種技術來對各種故障進行恢復,保證數據庫一致性,事務的原子性以及持久性。
數據庫通常以日志的方式記錄數據庫的操作從而在故障時進行恢復,因而可以稱之為日志恢復技術。
3.2 事務的執(zhí)行過程以及可能產生的問題
事務的執(zhí)行過程可以簡化如下:
系統(tǒng)會為每個事務開辟一個私有工作區(qū)
事務讀操作將從磁盤中拷貝數據項到工作區(qū)中,在執(zhí)行寫操作前所有的更新都作用于工作區(qū)中的拷貝.
事務的寫操作將把數據輸出到內存的緩沖區(qū)中,等到合適的時間再由緩沖區(qū)管理器將數據寫入到磁盤。
由于數據庫存在立即修改和延遲修改,所以在事務執(zhí)行過程中可能存在以下情況:
在事務提交前出現故障,但是事務對數據庫的部分修改已經寫入磁盤數據庫中。這導致了事務的原子性被破壞。
在系統(tǒng)崩潰前事務已經提交,但數據還在內存緩沖區(qū)中,沒有寫入磁盤。系統(tǒng)恢復時將丟失此次已提交的修改。這是對事務持久性的破壞。
3.3 日志的種類和格式
關于日志,有以下兩條規(guī)則
系統(tǒng)在對數據庫進行修改前會在日志文件末尾追加相應的日志記錄。
當一個事務的commit日志記錄寫入到磁盤成功后,稱這個事務已提交,但事務所做的修改可能并未寫入磁盤
3.4 日志恢復的核心思想
撤銷事務undo:將事務更新的所有數據項恢復為日志中的舊值,事務撤銷完畢時將插入一條
重做事務redo:將事務更新的所有數據項恢復為日志中的新值。
事務正?;貪L/因事務故障中止將進行redo,系統(tǒng)從崩潰中恢復時將先進行redo再進行undo。
以下事務將進行undo:日志中只包括
以下事務將進行redo:日志中包括
假設系統(tǒng)從崩潰中恢復時日志記錄如下
由于T0既有start記錄又有commit記錄,將會對事務T0進行重做,執(zhí)行相應的redo操作。
由于T1只有start記錄,將會對T1進行撤銷,執(zhí)行相應的undo操作,撤銷完畢將寫入一條abort記錄。
3.5 事務故障中止/正?;貪L的恢復流程
從后往前掃描日志,對于事務T的每個形如
往日志中寫一個特殊的只讀記錄
一旦發(fā)現
3.6 系統(tǒng)崩潰時的恢復過程(帶檢查點)
檢查點是形如
系統(tǒng)保證在檢查點之前已經提交的事務對數據庫的修改已經寫入磁盤,不需要進行redo。檢查點可以加快恢復的過程。
系統(tǒng)奔潰時的恢復過程分為兩個階段:重做階段和撤銷階段。
重做階段:
系統(tǒng)從最后一個檢查點開始正向的掃描日志,將要重做的事務的列表undo-list設置為檢查點日志記錄中的L列表。
發(fā)現
發(fā)現
發(fā)現
撤銷階段:
系統(tǒng)從尾部開始反向掃描日志
發(fā)現屬于undo-list中的事務的日志記錄,就執(zhí)行undo操作
發(fā)現undo-list中事務的T的
并把T從undo-list中去除。
undo-list為空,則撤銷階段結束
總結:先將日志記錄中所有事務的更新按順序重做一遍,在針對需要撤銷的事務按相反的順序執(zhí)行其更新操作的撤銷操作。
3.6.1 一個系統(tǒng)崩潰恢復的例子
恢復前的日志如下,寫入最后一條日志記錄后系統(tǒng)崩潰
總結
事務是數據庫系統(tǒng)進行并發(fā)控制的基本單位,是數據庫系統(tǒng)進行故障恢復的基本單位,從而也是保持數據庫狀態(tài)一致性的基本單位。
ACID是事務的基本特性,數據庫系統(tǒng)是通過并發(fā)控制技術和日志恢復技術來對事務的ACID進行保證的,從而可以得到如下的關于數據庫事務的概念體系結構。
?