PG中事務(wù)號(hào)有兩個(gè)概念,一個(gè)就是通常意義上的事務(wù)號(hào)transaction id。如tuple中的xmin,xmax等。另外一個(gè)意義是虛擬事務(wù)ID,即virtual transaction ID。那么這兩個(gè)有
站在用戶的角度思考問題,與客戶深入溝通,找到臨泉網(wǎng)站設(shè)計(jì)與臨泉網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類型包括:網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、域名申請、網(wǎng)站空間、企業(yè)郵箱。業(yè)務(wù)覆蓋臨泉地區(qū)。什么區(qū)別呢?
1.Transaction Id
它是用來標(biāo)識(shí)事務(wù)的順序的,類似于Oracle的LSN(Logical Sequence Number)。但是PG中的這個(gè)事務(wù)號(hào)是可以wrap的,也就是重復(fù)使用的。
PG定義此事務(wù)ID為32位長度。相當(dāng)于4 billion。因?yàn)槭侵貜?fù)使用的,所以首尾相接,構(gòu)成一個(gè)環(huán)。那也就是說,對于任何一個(gè)事務(wù)ID,有2 billion的事務(wù)ID比自己old,
有2 billion的事務(wù)比自己new。另外有三個(gè)事務(wù)ID有特殊意義:”0”代表invalid 事務(wù)號(hào),”1”代表bootstrap事務(wù)號(hào),“2”代表frozen 事務(wù),“3”代表最小的用戶事務(wù)ID。
另外,1“和”2“也都是valid。frozen transaction id比任何事務(wù)都要old。PG用來解決事務(wù)號(hào)wrap問題,在事務(wù)號(hào)循環(huán)使用情況下,可能會(huì)出現(xiàn)新的事務(wù)號(hào)比老的事務(wù)號(hào)要小。
因此將老的事務(wù)號(hào)設(shè)置為”2”,表示是frozen transaction。frozen transaction id的動(dòng)作由vacuum發(fā)起。具體介紹請我的另外一篇文章”PostgreSQL vacuum原理—vacuum揭秘“。
transaction id的產(chǎn)生受lwlock ”XidGenLock“保護(hù),存放在ShmemVariableCache共享內(nèi)存段中。
transaction id 源碼定義如下:
事務(wù)號(hào)類型定義:
2.Virtual Transaction Id
也就是通常所講的虛擬事務(wù)ID。virtual transaction id 由兩部分組成,backend process ID 號(hào)和local transaction id組成。
backend process ID 號(hào)不是操作系統(tǒng)的進(jìn)程ID,而是PG中用來標(biāo)識(shí)進(jìn)程序列號(hào)的ID。而local transansaction id也是用32位長度來表示。跟上面講的transaction id的區(qū)別看名字就知道:是local和非local的差別。
也就是說這個(gè)local transaction id是每個(gè)backend 進(jìn)程獨(dú)有的。而上面第一部分講的transaction id是全局的,即整個(gè)PG cluster 級別的。
圖中第一個(gè)紅色圈中部分就是全局的transaction id。而第二圈中的內(nèi)容就是virtual transaction id。 backend id號(hào)和local transaction id用”/“符號(hào)分隔。
前面部分為backend id號(hào),后面部分為local transaction id。第三個(gè)紅色圈中部分為系統(tǒng)進(jìn)程號(hào)。這里明顯看到,virtual transaction id中的backend id號(hào)跟第三個(gè)紅色圈中的pid是不同的。
pid是操作系統(tǒng)的進(jìn)程號(hào)。virtual transaction id只有valid 和invalid之分?!?“表示為invalid,其它都是valid。另外,virtual transaction id 在數(shù)據(jù)庫重起后,就會(huì)重新使用;但是在同一個(gè)backend id下會(huì)按順序增長。
virtual transaction id的持有,都是ExclusiveLock,因?yàn)樵谝粋€(gè)進(jìn)程私有空間內(nèi),不存在爭用情況。這點(diǎn)上,跟transaction id是一樣的,transaction id是全局獨(dú)享的,因此也是ExclusiveLock。
從上面圖中的mode列,我們可以清晰的看到。
定義如下:
3.總結(jié)
為什么PG會(huì)搞這么兩個(gè)transaction id呢,用途和意義是什么呢?
我們知道,像類似于SELECT語句,并不會(huì)改變數(shù)據(jù)庫;而DML語句會(huì)對數(shù)據(jù)庫狀態(tài)產(chǎn)生影響。因此這也就是為什么區(qū)別對待的原因。
transaction id屬于permanent id,即永久ID。它的意義是指對數(shù)據(jù)庫的更改序列,使得數(shù)據(jù)庫從一種狀態(tài)變成另外一種狀態(tài),而且狀態(tài)的改變是持久的,可恢復(fù),是一致性的。
這也符合的數(shù)據(jù)庫理論ACID的要求。
而查詢,實(shí)際上并不需要這種永久事務(wù)ID,只需要處理好MVCC,鎖的獲取和釋放即可,因此virtual transaction id也就足夠了。不需要去獲取XidGenLock而產(chǎn)生transaction id,
從而提高數(shù)據(jù)庫性能。另外,數(shù)據(jù)庫也不會(huì)因?yàn)椴樵兌鴮?dǎo)致transaction id快速wrap around。MVCC的處理是不需要transaction id值的。當(dāng)查詢時(shí),獲取當(dāng)前每個(gè)活動(dòng)進(jìn)程的xmin和xmax值,
以此區(qū)間去對比每個(gè)tuple header中的xmin和xmax即可得到可見性snapshot。MVCC詳細(xì)實(shí)現(xiàn)見”PostgreSQL MVCC 源碼實(shí)現(xiàn)“。
另外獲取的時(shí)機(jī)也有很大差別。PG的事務(wù)實(shí)現(xiàn)有三層,分別為top layer, middle layer 和bottom layer。virtual transaction id在top layer中獲取。不管是查詢,還是DML操作,每個(gè)
命令都有virtual transaction id。而transaction id是在bottom layer中獲取的,只有真正涉及到數(shù)據(jù)修改時(shí),才去獲取。修改tuple后,會(huì)將transaction id的值存放到tuple header 中,
這也是我們通常講的xmin或者xmax。