PostgreSQL掃描方法是什么-創(chuàng)新互聯(lián)

這篇文章主要講解了“PostgreSQL掃描方法是什么”，文中的講解內(nèi)容簡單清晰，易于學(xué)習(xí)與理解，下面請大家跟著小編的思路慢慢深入，一起來研究和學(xué)習(xí)“PostgreSQL掃描方法是什么”吧！

專注于為中小企業(yè)提供網(wǎng)站設(shè)計、成都網(wǎng)站制作服務(wù),電腦端+手機(jī)端+微信端的三站合一,更高效的管理,為中小企業(yè)精河免費(fèi)做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都，凝聚了一批互聯(lián)網(wǎng)行業(yè)人才，有力地推動了1000+企業(yè)的穩(wěn)健成長，幫助中小企業(yè)通過網(wǎng)站建設(shè)實現(xiàn)規(guī)模擴(kuò)充和轉(zhuǎn)變。

關(guān)系型數(shù)據(jù)庫都需要產(chǎn)生一個最佳的執(zhí)行計劃從而在查詢時耗費(fèi)的時間和資源最少。通常情況下，所有的數(shù)據(jù)庫都會產(chǎn)生一個以樹形式的執(zhí)行計劃：計劃樹的葉子節(jié)點(diǎn)被稱為表掃描節(jié)點(diǎn)。查詢節(jié)點(diǎn)對應(yīng)于從基表獲取數(shù)據(jù)。

例如，這一個查詢：SELECT *FROM TAB1,TAB2 where TAB2.ID>1000。假設(shè)計劃樹如下：

PostgreSQL掃描方法是什么

上面的計劃樹：“TBL1上的順序掃描”和“TBL2上的索引掃描”分別對應(yīng)于表TBL1和TBL2上的表掃描方法。TBL1上的順序掃描：從對應(yīng)頁中順序獲取數(shù)據(jù)；索引掃描：使用索引掃描訪問表2。選擇一個正確的掃描方法作為計劃的一部分對于查詢性能非常重要。

深入理解PG的掃描方法之前，先介紹幾個重要的概念。

PostgreSQL掃描方法是什么

HEAP：存儲表整個行的存儲域。如上所示，整個域被分割為多個頁，每個頁大小默認(rèn)是8K。每個頁中，item指針（例如上述頁中的1,2）指向頁內(nèi)的數(shù)據(jù)。

Index Storage：只存儲KEY值，即索引中包含的列值。也是分割成多個頁，每個索引頁默認(rèn)8K。

Tuple Identifier(TID)：TID為6個字節(jié)，包含兩部分。前4個字節(jié)為頁號，后2個字節(jié)為頁內(nèi)tuple索引。TID可以定位到特定記錄。

當(dāng)前版本，PG支持以下掃描方法：順序掃描、索引掃描、索引覆蓋掃描、bitmap掃描、TID掃描。依賴于表基數(shù)、選擇的表、磁盤IO、隨機(jī)IO、順序IO等，每種掃描方法都非常有用。我們先創(chuàng)建一個表并預(yù)制數(shù)據(jù)，并解釋這些掃描方法。

postgres=# CREATE TABLE demotable (num numeric, id int);
CREATE TABLE
postgres=# CREATE INDEX demoidx ON demotable(num);
CREATE INDEX
postgres=# INSERT INTO demotable SELECT random() * 1000,  generate_series(1, 1000000);
INSERT 0 1000000
postgres=# analyze;
ANALYZE

這個例子中，預(yù)制1億條記錄并執(zhí)行analyze更新統(tǒng)計信息。

順序掃描

顧名思義，表的順序掃描就是順序掃描對應(yīng)表所有頁的item指針。如果一個表有100頁，每頁有1000條記錄，順序掃描就會獲取100*1000條記錄并檢查是否匹配隔離級別以及where條件。因此，即使只有1條記錄滿足條件，他也會掃描100K條記錄。針對上表的數(shù)據(jù)，下面的查詢會進(jìn)行順序掃描，因為有大部分的數(shù)據(jù)需要被selected。

postgres=# explain SELECT * FROM demotable WHERE num < 21000;
                             QUERY PLAN
--------------------------------------------------------------------
 Seq Scan on demotable  (cost=0.00..17989.00 rows=1000000 width=15)
   Filter: (num < '21000'::numeric)
(2 rows)

注意，不計算和比較計劃耗費(fèi)，幾乎不可能直到選用哪個掃描方法。但是為了使用順序掃描，至少需要滿足以下關(guān)鍵點(diǎn)：謂詞部分沒有可用的索引鍵；或者SQL查詢獲取的行記錄占表的大部分。如果只有少數(shù)行數(shù)據(jù)被獲取，并且謂詞在一個或多個列上，那么久會嘗試使用或者不使用索引來評估性能。

索引掃描

和順序掃描不同，索引掃描不會順序獲取所有表記錄。相反，依賴于不同索引類型并和查詢中涉及的索引相對應(yīng)使用不同的數(shù)據(jù)結(jié)構(gòu)。然后索引掃描獲取的條目直接指向heap域中的數(shù)據(jù)，然后根據(jù)隔離級別判斷可見性。因此索引掃描分兩步：

從索引數(shù)據(jù)結(jié)構(gòu)中獲取數(shù)據(jù)，返回heap中數(shù)據(jù)對應(yīng)的TID；然后定位到對應(yīng)的heap頁直接訪問數(shù)據(jù)。由于以下原因需要執(zhí)行額外的步驟：查詢可能請求可用索引更多的列；索引數(shù)據(jù)中不維護(hù)可見信息，為了判斷可見性，需要訪問heap數(shù)據(jù)。

此時可能會迷惑，索引掃描如此高效，為什么有時不用呢？原因在于cost。這里的cost涉及IO的類型。索引掃描中，為了獲取heap中的對應(yīng)數(shù)據(jù)，涉及隨機(jī)IO；而順序掃描涉及順序IO，只有隨機(jī)IO耗時的1/4。

因此只有當(dāng)順序IO的代價大于隨機(jī)IO時，才會選擇索引掃描。

針對上表和數(shù)據(jù)，執(zhí)行下面查詢時會使用索引掃描。隨機(jī)IO代價小，從而查詢標(biāo)記快。

postgres=# explain SELECT * FROM demotable WHERE num = 21000;
                                QUERY PLAN
--------------------------------------------------------------------------
 Index Scan using demoidx on demotable  (cost=0.42..8.44 rows=1 width=15)
   Index Cond: (num = '21000'::numeric)
(2 rows)

Index Only Scan

僅索引掃描和索引掃描類似，區(qū)別在于第二步，僅僅涉及到掃描索引數(shù)據(jù)。有兩個條件：查詢獲取的數(shù)據(jù)只有key列，且該列是索引的一部分；所有獲取的數(shù)據(jù)都是可見的。如下所示：

postgres=# explain SELECT num FROM demotable WHERE num = 21000;
                                  QUERY PLAN
-----------------------------------------------------------------------------
Index Only Scan using demoidx on demotable  (cost=0.42..8.44 rows=1 Width=11)
   Index Cond: (num = '21000'::numeric)
(2 rows)

Bitmap Scan

是索引掃描和順序掃描的混合體。為了解決索引掃描的缺點(diǎn)并充分利用其優(yōu)點(diǎn)。正如上面所說，對于索引數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)，需要找到heap頁中對應(yīng)的數(shù)據(jù)。因此需要獲取一次索引頁，然后獲取heap頁，從而造成大量隨機(jī)IO。Bitmap掃描方法平衡了不使用隨機(jī)IO的索引掃描優(yōu)點(diǎn)。

Bitmap index scan：首先獲取索引數(shù)據(jù)并為所有TID創(chuàng)建bitmap。為了理解方法，可以認(rèn)為bitmap包含所有頁的哈希（基于頁號），每個頁的entry包含頁內(nèi)所有偏移的數(shù)組。

Bitmap heap scan：從頁的bitmap中讀取值，然后針對頁和偏移掃描數(shù)據(jù)。最后檢查可見性和條件并返回tuple。

下面查詢使用bitmap掃描，因為他選擇的記錄很多（比如too much for index scan）但不是大量（too little for sequential scan）。

postgres=# explain SELECT * FROM demotable WHERE num < 210;
                                  QUERY PLAN
--------------------------------------------------------------------------
 Bitmap Heap Scan on demotable  (cost=5883.50..14035.53 rows=213042 width=15)
   Recheck Cond: (num < '210'::numeric)
   ->  Bitmap Index Scan on demoidx  (cost=0.00..5830.24 rows=213042 width=0)
      Index Cond: (num < '210'::numeric)
(4 rows)

再看另一個查詢，選擇同樣多的記錄但是僅僅索引列。不需要heap頁因次沒有隨機(jī)IO，因此這個查詢選擇index only scan而不是bitmap scan。

postgres=# explain SELECT num FROM demotable WHERE num < 210;
                                   QUERY PLAN
---------------------------------------------------------------------------
 Index Only Scan using demoidx on demotable  (cost=0.42..7784.87 rows=208254 width=11)
   Index Cond: (num < '210'::numeric)
(2 rows)

TID Scan

TID掃描是PG中非常特殊的一種方式,和Oracle中的基于ROWID查詢類似：

postgres=# select ctid from demotable where id=21000;
   ctid
----------
 (115,42)
(1 row)
postgres=# explain select * from demotable where ctid='(115,42)';
                        QUERY PLAN
----------------------------------------------------------
 Tid Scan on demotable  (cost=0.00..4.01 rows=1 width=15)
   TID Cond: (ctid = '(115,42)'::tid)
(2 rows)

此外，PG社區(qū)還在討論其他的掃描方法：MySQL中的“Loose Index Scan”、Oracle中的“index skip scan”、DB2中的“jump scan”。這個掃描方法用在指定場景：選擇的B-tree索引的key列值都不同。避免遍歷所有相等的key值，而只遍歷第一個唯一值然后跳到下一個大值。這項工作PG正在開發(fā)，同樣被叫做“Index skip scan”，未來可以在release中看到這個特性。

感謝各位的閱讀，以上就是“PostgreSQL掃描方法是什么”的內(nèi)容了，經(jīng)過本文的學(xué)習(xí)后，相信大家對PostgreSQL掃描方法是什么這一問題有了更深刻的體會，具體使用情況還需要大家實踐驗證。這里是創(chuàng)新互聯(lián)，小編將為大家推送更多相關(guān)知識點(diǎn)的文章，歡迎關(guān)注！

網(wǎng)頁標(biāo)題：PostgreSQL掃描方法是什么-創(chuàng)新互聯(lián)
分享路徑：http://weahome.cn/article/dijged.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

PostgreSQL掃描方法是什么-創(chuàng)新互聯(lián)

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管