ORACLECheckpointQueue和增量檢查點(diǎn)

ORACLE CheckpointQueue和增量檢查點(diǎn)

檢查點(diǎn)的主要目的是以對數(shù)據(jù)庫的日常操作影響最小的方式刷新臟塊。臟塊不斷的產(chǎn)生，如何將臟塊刷新到磁盤中去呢？在8i之前，Oracle定期的鎖住所有的修改操作，將Buffer cache中的所有臟塊刷到磁盤，這種刷新臟塊的方式被稱為完全檢查點(diǎn)，這極大的影響了效率，從9i之后只有當(dāng)關(guān)閉數(shù)據(jù)庫時才會發(fā)生完全檢查點(diǎn)。

從8i開始，Oracle增加了增量檢查點(diǎn)的概念，增量檢查點(diǎn)的主要作用就是定期的刷新一部分臟塊。將臟塊一次刷新完是不合理的，因?yàn)榕K塊不斷產(chǎn)生，沒有窮盡。像完全檢查點(diǎn)那樣停止用戶所有的修改操作，將臟塊刷新完再繼續(xù)，這絕對會極大的影響性能。所有增量檢查點(diǎn)的一次刷新部分塊是臟塊問題的最好解決辦法。那么，每次刷新時，都刷新那些塊呢？根據(jù)統(tǒng)計(jì)研究，根據(jù)塊變臟的順序，每次刷新那些最早臟的塊，這種方式最為合理。為了實(shí)現(xiàn)這一點(diǎn)，Oracle在Buffer cache中又建立了一個鏈表，就是檢查點(diǎn)隊(duì)列。每個塊在它變臟時，會被鏈接到檢查點(diǎn)隊(duì)列的末尾。就好像排隊(duì)一樣，9:00來的人站在第一位，9:05來的人排第二位，以后每來一個人都站在隊(duì)伍的末尾，這個隊(duì)伍就是按來到的時間順序排列的一個隊(duì)列。檢查點(diǎn)隊(duì)列就是這樣，塊在變臟時會被鏈到末尾。因此檢查點(diǎn)隊(duì)列是按塊變臟的時間順序，將塊排成了一個隊(duì)列。

如上圖，檢查點(diǎn)隊(duì)列中的每一節(jié)點(diǎn)，都指向一個臟塊。檢查點(diǎn)隊(duì)列每個節(jié)點(diǎn)中的信息其實(shí)非常少，就是記錄對應(yīng)塊在Buffer cache中的地址，臟塊對應(yīng)的重做記錄在日志文件中的位置，另外還有前一個節(jié)點(diǎn)、后一個節(jié)點(diǎn)的地址。檢查點(diǎn)隊(duì)列還有LRU、臟LRU，這些都是雙向鏈表。雙向鏈表就是在節(jié)點(diǎn)中記錄前、后兩個節(jié)點(diǎn)的地址。

檢查點(diǎn)隊(duì)列頭部的塊是最早變臟的，因此，Oracle會定期喚醒DBWn從檢查點(diǎn)隊(duì)列頭開始，沿著檢查點(diǎn)隊(duì)列的順序，刷新臟塊。在刷新臟塊的同時，仍可以不斷的有新的臟塊被鏈接到檢查點(diǎn)隊(duì)列的尾部。這個定期喚醒DBWn刷新臟塊的操作，Oracle就稱為增量檢查點(diǎn)。

如上圖，1、2、3號節(jié)點(diǎn)所指向的臟塊已經(jīng)被刷新為干凈塊。同時，又有兩個塊變臟，它們被鏈接到了檢查點(diǎn)隊(duì)列的末尾，它們是9號、10號節(jié)點(diǎn)。

檢查點(diǎn)隊(duì)列的頭，又被稱為檢查點(diǎn)位置，Checkpoint postion，這些名稱我們不必從字面上去理解?？傊?，檢查點(diǎn)位置就是檢查點(diǎn)隊(duì)列頭。檢查點(diǎn)隊(duì)列頭節(jié)點(diǎn)（也就是檢查點(diǎn)位置）的信息，Oracle會頻繁的將它記錄到控制文件中，而且會很頻繁的記錄。一般是每隔三秒，有一個專門的進(jìn)程CKPT，會將檢查點(diǎn)位置記錄進(jìn)控制文件。

如上圖，當(dāng)前的檢查點(diǎn)位置是檢查點(diǎn)隊(duì)列的1號節(jié)點(diǎn)。又一個三秒到了，CKPT進(jìn)程啟動，將新的檢查點(diǎn)位置記入控制文件：

新的檢查點(diǎn)位置是4號節(jié)點(diǎn)，它對應(yīng)當(dāng)前變臟時間最早的臟塊。1、2、3號節(jié)點(diǎn)已經(jīng)從檢查點(diǎn)隊(duì)列中摘除了。因?yàn)樗鼈儗?yīng)的臟塊已經(jīng)不臟了。一般來說，控制文件中的檢查點(diǎn)位置之后的塊都是臟塊。但是有時也例外，因檢查點(diǎn)位置每三秒才會更新一次，就像上圖，1、2、3號節(jié)點(diǎn)對應(yīng)的臟塊已經(jīng)被刷新過了，但是由于三秒間隔沒到，檢查點(diǎn)位置還是指向1號節(jié)點(diǎn)。只有當(dāng)三秒到后，檢查點(diǎn)位置才會被更新到4號節(jié)點(diǎn)上。

關(guān)于檢查點(diǎn)隊(duì)列、檢查點(diǎn)位置我們先說到這里，在全面的介紹什么是增量檢查點(diǎn)之前，我們先說一下檢查點(diǎn)隊(duì)列的一個重要作用。

讓我們先來總結(jié)一下用戶修改塊時，Oracle內(nèi)部都發(fā)生了什么：

1．如果塊不在Buffer cache，將塊讀入Buffer cache

2．先生成重做記錄，并記入日志緩存，在用戶提交時寫到日志文件中

3．在Buffer cache中修改塊

4．在Buffer cache中設(shè)置塊的臟標(biāo)志位，標(biāo)志塊變成臟塊，同時在檢查點(diǎn)隊(duì)列末尾增加一個新節(jié)點(diǎn)，記錄這個新臟塊的信息，信息包括：臟塊在Buffer cache中的位置，在步驟2時生成的與此臟塊對應(yīng)的重做記錄位置。

5．用戶提交后，將相應(yīng)的重做記錄從重做緩存寫入日志文件。

我現(xiàn)在將日志補(bǔ)充到上面的圖中：

就像上圖，檢查點(diǎn)隊(duì)列的每個節(jié)點(diǎn)，都保存有臟塊的地址和臟塊對應(yīng)的重做記錄的編號。臟塊在Buffer cache中的位置是隨機(jī)的，用戶不一定修改那個塊。但重做記錄是順序生成的，就和檢查點(diǎn)隊(duì)列的排列順序一樣。因?yàn)?，它們都是?dāng)塊被修改而變臟時產(chǎn)生的。塊A先被修改，塊A的重做記錄就排在前面，塊B后被修改，塊B對應(yīng)的重做記錄會被排在塊A對應(yīng)的重做記錄的后面。和它們在檢查點(diǎn)中的順序是一樣。每當(dāng)數(shù)據(jù)庫因異外而當(dāng)機(jī)，比如異常死機(jī)、斷電等等，Buffer cache中有許多臟塊沒來的及寫到磁盤上。以圖為例，比如說現(xiàn)在斷電了，現(xiàn)在磁盤上還有7個臟塊，它們里面有用戶修改過的數(shù)據(jù)，Oracle已經(jīng)將反饋信息“你的修改完成”發(fā)送給用戶，用戶也以為他們的修改完成了，將為一直保存到數(shù)據(jù)庫中。但是，斷然的斷電，令這幾個臟塊中的數(shù)據(jù)丟失了，它們沒來得及寫到磁盤上。

Oracle如何解決這個問題呢？很簡單，當(dāng)數(shù)據(jù)庫重新啟動時，Oracle只需從控制文件中讀出檢查點(diǎn)位置，檢查點(diǎn)位置中記錄有重做記錄編號，根據(jù)此編號，Oracle可以很快的定位到日志文件中的重做記錄n，它讀出重做記錄n中的重做數(shù)據(jù)，將用戶的修改操作重現(xiàn)到數(shù)據(jù)庫。接著，Oracle讀取重做記錄n+1中的重做數(shù)據(jù)，重現(xiàn)用戶修改，這個過程將沿著日志流的順序，一直進(jìn)行下去，直擋最后一條重做記錄，在上圖的例子中，最后一條重做記錄是第n+6條。這個過程完成后，用戶所有的修改又都被重現(xiàn)了，一點(diǎn)都不會丟失。只要你的日志文件是完整，日志流是完整的，就一點(diǎn)信息都不會丟失。

有人可能會有一個問題，重做記錄在生成后，也是先被送進(jìn)重做緩存，再由重做緩存寫往日志文件。這樣的機(jī)制下，一定會有某些重做記錄在沒來的及寫到日志文件中時，數(shù)據(jù)庫突然當(dāng)機(jī)，而造成這些重做記錄丟失。這樣，這些重做記錄所對應(yīng)的臟塊，將得不到恢復(fù)。用戶還是會丟失一些數(shù)據(jù)。

這種情況的確會發(fā)生，但丟失的都是沒用的信息。為什么這么說的。Oracle會在用戶每次發(fā)出提交命令時，將事務(wù)所修改臟塊對應(yīng)的重做記錄寫進(jìn)日志文件，只有當(dāng)這個操作完成時，用戶才會收到“提交完成”，這樣的信息，對于一個完整的事務(wù)，當(dāng)用戶看到提交完成后，也就意味著所對應(yīng)的重做記錄一定被寫到了日志文件中，即使發(fā)生異常死機(jī)，它也是絕對可以恢復(fù)。而當(dāng)用戶沒有提交，或沒來得及提交，數(shù)據(jù)庫就崩潰了，那么事務(wù)就是不完整的，這個事務(wù)必須被回滾，它根本用不著恢復(fù)。對于這樣不完整的事務(wù)，它對應(yīng)的重做記錄有可能丟失，但這無所謂了，因?yàn)椴煌暾氖聞?wù)根本不需要恢復(fù)。也就是說，只有用戶的事務(wù)提交了，用戶的修改一定不會丟失。不過這還有一個前提，就是日志文件千萬不能損壞，DBA所要做的就是要保證日志文件不能損壞。DBA可以使用RAID1這樣的磁盤鏡像技術(shù)，或者多元備份日志文件，等等，這個我們在前面章節(jié)中已經(jīng)講過了的。

我們上面所講到的這種恢復(fù)，是自動進(jìn)行的，并且不需要DBA參與，它被稱之為實(shí)例恢復(fù)。

檢查點(diǎn)隊(duì)列與增量檢查點(diǎn)的作用我們已經(jīng)說的差不多了，它們的主要目的就是讓DBWn沿檢查點(diǎn)隊(duì)列的順序刷新臟塊。還有，就是實(shí)例恢復(fù)。

下面我們來討論一下增量檢查點(diǎn)的設(shè)置。

這里所說的檢查點(diǎn)設(shè)置，主要指增量檢查點(diǎn)頻繁的設(shè)置。注意增量檢查點(diǎn)只是一個名詞，不必按字面的意義去理解它。增量檢查點(diǎn)發(fā)生時，Oracle會喚醒DBWn沿著檢查點(diǎn)隊(duì)列寫臟塊，這就是增量檢查點(diǎn)。那么到底多長時間一次發(fā)生一次增量檢查點(diǎn)呢？這個增量檢查點(diǎn)的頻率是非常重要的，它基本上控制著DBWn多長時間去刷新一次臟塊。DBWn活動的太頻繁，會影響數(shù)據(jù)庫的整體性能，如果DBWn活動太不頻繁，又會使臟塊擠壓太多，這同樣也會影響性能。而且，如果出現(xiàn)異常崩潰，需要實(shí)例恢復(fù)，臟塊越多，實(shí)例恢復(fù)越慢。。在9i之前DBA主要靠間隔時間等方式來設(shè)置增量檢查點(diǎn)的頻率，比如可以讓Oracle每10分鐘發(fā)生一次增量檢查點(diǎn)。如果這個數(shù)字設(shè)置不合適，對數(shù)據(jù)庫性能的影響是很大的。而且有可能造成實(shí)例恢復(fù)時間過長。在9i之后，特別是到了10g中，檢查點(diǎn)已經(jīng)相當(dāng)?shù)闹悄芑?，很少會成為I/O問題的原兇。9i中設(shè)置fast_start_mttr_target參數(shù)為你所期望的實(shí)例恢復(fù)時間，系統(tǒng)將自動控制增量檢查點(diǎn)的頻率。比如，你希望實(shí)例恢復(fù)可以在5分鐘內(nèi)完成，你可以將此參數(shù)設(shè)置為300，也就是300稱。

如果此參數(shù)設(shè)置的值超出了硬件實(shí)際的限制，比如你將它設(shè)置為60，你期望無論在任何情況下，數(shù)據(jù)庫都可以在1分鐘內(nèi)完成實(shí)例恢復(fù)，但根據(jù)數(shù)據(jù)庫的臟塊生成速度、存儲設(shè)備的寫性能，1分鐘內(nèi)根本無法完成實(shí)例恢復(fù)。這時候Oracle會自動設(shè)置合適的fast_start_mttr_target參數(shù)值，我們可以在參數(shù)文件中看到修正后的參數(shù)值，也可以在V$instance_recovery視圖中的Target_mttr列中看到實(shí)際的值。例如：

（舉個例子）

我們不能將這個值設(shè)置的太小，因?yàn)閷?shí)例恢復(fù)必競只是偶然現(xiàn)象。如果為了讓實(shí)例恢復(fù)盡快完成，而設(shè)置fast_start_mttr_target為很小的值，那么DBWn將活動的很頻繁，這會造成性能問題的。為了避免用戶設(shè)置不合理的增量檢查點(diǎn)頻率，在10G中，如果將fast_start_mttr_target設(shè)置為0，Oracle將根據(jù)產(chǎn)生臟塊的速度、存貯硬件的性能自動調(diào)節(jié)檢查點(diǎn)的頻率，盡量使檢查點(diǎn)頻率不成為I/O問題的原兇。

檢查點(diǎn)的主要任務(wù)就是催促DBWn刷新臟塊，如果DBWn刷新臟塊時的等待事件太多，就說明臟塊太多、存儲設(shè)備的寫速度太慢，或者就是增量檢查點(diǎn)的頻率太高了，或太低了。DBWn寫臟塊的等待事件是Db file parallel write。如果你的增量檢查點(diǎn)頻率很低，你發(fā)現(xiàn)了此事件，在排除了存儲設(shè)備寫性能的問題后，你應(yīng)該將增量檢查點(diǎn)頻率設(shè)置的高一些。反之，如果你的增量檢查點(diǎn)頻率本身很高，出現(xiàn)了Db file parallel write事件，這說明檢查點(diǎn)頻率太高了。

除它之外，還有一個和DBWn、增量檢查瞇有關(guān)的等待事件，它是Write complete waits事件，當(dāng)前臺進(jìn)程要修改DBWn正要成批寫的塊中的若干個塊時，就會有此等待事件，這個事件是前臺進(jìn)程再等待DBWn寫完成。這個等待事太多，說明了存儲設(shè)備寫性能有問題，或者增量檢查點(diǎn)太頻率了。

我們可以V$instance_recovery中看到有關(guān)檢查點(diǎn)的很多信息：

Estimated_mttr列如果太大，說明檢查點(diǎn)不夠頻繁，同時也說明臟塊產(chǎn)生的太多。同時在V$sysstat資料視圖中，還有兩個資料background checkpoints started、background checkpoints completed，前面的一個是后臺進(jìn)程檢查點(diǎn)開始次數(shù)，后一個是后臺進(jìn)程檢查點(diǎn)完成次數(shù)。后臺進(jìn)程檢查點(diǎn)的意義，其實(shí)就是增量檢查點(diǎn)。只有增量檢查點(diǎn)是由后臺進(jìn)程觸發(fā)的。如果你用Alter system checkpoing命令讓系統(tǒng)完成完全檢查點(diǎn)，這叫做前臺檢查點(diǎn)與增量檢查點(diǎn)無關(guān)，是不會被記入這兩個資料了。如果這兩個值經(jīng)常相差一些，比如檢查點(diǎn)的開始次數(shù)比完成次數(shù)大的不至1，這說明有太多次檢查點(diǎn)開始，但沒有及時完成。這說明檢查點(diǎn)太頻繁或檢查點(diǎn)完成的太慢。

（舉例，大量的產(chǎn)生臟塊、日志文件比較小5MB，日志文件頻率的切換而觸發(fā)檢查點(diǎn)，同時查看一下等待事件）

檢查點(diǎn)的問題大多數(shù)情況下其實(shí)都是DBWn寫I/O的問題， DBWn寫臟塊的等待事件是Db file parallel write，還有Write complete waits等待事件，是當(dāng)前臺進(jìn)程要修改DBWn正要成批寫的塊中的若干個塊時，就會有此等待事件，這個事件是前臺進(jìn)程再等待DBWn寫完成。這個等待事太多，也說明了DBWn有問題。

注意，對于數(shù)據(jù)文件的I/O問題，除了等待事件外，我們還可以用上幾節(jié)講過了V$filestat視圖幫助確定問題。）

本文題目：ORACLECheckpointQueue和增量檢查點(diǎn)
網(wǎng)站鏈接：http://weahome.cn/article/ggpceg.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

ORACLECheckpointQueue和增量檢查點(diǎn)

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管