Oracle缺省用的是專用服務(wù)器模式,也就是說一個用戶連接進(jìn)程對應(yīng)一個服務(wù)器的進(jìn)程.
創(chuàng)新互聯(lián)是一家以網(wǎng)絡(luò)技術(shù)公司,為中小企業(yè)提供網(wǎng)站維護(hù)、成都做網(wǎng)站、成都網(wǎng)站設(shè)計、網(wǎng)站備案、服務(wù)器租用、域名申請、軟件開發(fā)、微信小程序等企業(yè)互聯(lián)網(wǎng)相關(guān)業(yè)務(wù),是一家有著豐富的互聯(lián)網(wǎng)運(yùn)營推廣經(jīng)驗的科技公司,有著多年的網(wǎng)站建站經(jīng)驗,致力于幫助中小企業(yè)在互聯(lián)網(wǎng)讓打出自已的品牌和口碑,讓企業(yè)在互聯(lián)網(wǎng)上打開一個面向全國乃至全球的業(yè)務(wù)窗口:建站咨詢熱線:13518219792
記得某大醫(yī)院剛啟用的時候,我們曾經(jīng)試過MTS.因為聽說MTS在不增加內(nèi)存和CPU的情況下連接更多的客戶端,結(jié)果并不是我們預(yù)期的那樣.
因為我們對MTS不了解,并不是它有問題,而是它不是用來在這種情況下做這件事的.
保持?jǐn)?shù)據(jù)一致性和完整性,是每一款成功商業(yè)數(shù)據(jù)庫軟件都必須要做到的基本要求。從故障中恢復(fù),保證ACID原則,保證事務(wù)完整性,一直是Oracle數(shù)據(jù)庫核心功能組成部分。本篇主要介紹Oracle實例意外終止(斷電或者強(qiáng)制關(guān)閉)之后,重新啟動時發(fā)生的恢復(fù)過程,也可以稱作“前滾和回滾”。
基礎(chǔ)知識說明
為了更明確的說明問題,筆者首先介紹一下本文涉及到的一些重要知識。
數(shù)據(jù)庫實例失敗
我們經(jīng)常說的數(shù)據(jù)庫服務(wù)器failure是有多層含義的。Oracle數(shù)據(jù)庫是一個由多進(jìn)程組件共同構(gòu)成的結(jié)構(gòu)體系。最重要的部分包括監(jiān)聽器、Oracle數(shù)據(jù)庫實例兩個部分,當(dāng)然還包括各類文件,更廣義的還有硬件和操作系統(tǒng)OS。不同部分的Failure現(xiàn)象和處理方法都有所不同。本文所闡述的過程是Oracle實例失敗后的自動恢復(fù)過程。
在實例失敗的時候,往往是突然性的終止。此時Oracle數(shù)據(jù)庫可能在進(jìn)行一系列完成或者未完成的事務(wù)。實例失敗恢復(fù),就是要將這些狀態(tài)進(jìn)行還原,恢復(fù)到數(shù)據(jù)完整性的狀態(tài)。
寫日志(RedoLog)在先機(jī)制
Oracle數(shù)據(jù)庫是采用“日志在先”機(jī)制的。當(dāng)我們對數(shù)據(jù)庫數(shù)據(jù)進(jìn)行修改時,并不是立即將修改寫入到文件中,而是寫入到共享內(nèi)存SGA空間中的BufferCache里。同時,將修改的日志不斷的寫入到SGA中另一塊Log Buffer緩存中。有一個后臺進(jìn)程LGWR不斷的將LogBuffer緩存中的日志內(nèi)容寫入到online redo log文件中。
寫入LogBuffer緩存和LGWR寫入文件的過程是異步進(jìn)行的。那么LGWR會在哪些情況下將日志緩沖區(qū)(全部內(nèi)容)轉(zhuǎn)儲到日志文件呢?如下:--參考OCA認(rèn)證考試指南(1Z0-052,P40)ü 用戶進(jìn)行直接的commit操作;
ü RedoBuffer數(shù)據(jù)超過1/3;
ü DBWn啟動,將BufferCache中的臟數(shù)據(jù)寫入到文件中;ü 距離上次LGWR寫入操作超過三秒(三秒超時,DBWn每三秒鐘會對一些緩沖區(qū)清理一次,這個時候,剛好符合觸發(fā)LGWR的第三點);而數(shù)據(jù)文件寫入進(jìn)程DBWn工作的觸發(fā)點(此處注意:DBWn會將高速緩沖區(qū)的臟緩沖區(qū),即臟數(shù)據(jù)塊寫入數(shù)據(jù)文件,而不是緩沖區(qū)里頭的全部內(nèi)容---參考OCA認(rèn)證考試指南(1Z0-052,P38))。
因為考慮到磁盤I/O會降低性能,DBWn采用的是極懶算法執(zhí)行寫入。如果對于經(jīng)常變臟的緩沖區(qū),即這邊緩沖區(qū)處于十分忙碌的狀態(tài),那么DBWn不會將緩沖區(qū)寫入磁盤的。反而一段時間來,任何會話都未曾關(guān)注的一些緩沖區(qū),DBWn會將其寫入到磁盤。因此DBWn寫臟緩沖區(qū)比較平緩和低頻率。但如果出現(xiàn)檢查點的情況例外:DBWn會將所有臟緩沖區(qū)全部寫入磁盤。---參考OCA認(rèn)證考試指南(1Z0-052,P38中,P39)。
ü 當(dāng)BufferCache中沒有任何可用緩沖區(qū);ü 臟緩沖區(qū)過多;
ü 遇到三秒超時(DBWn每三秒鐘會對一些緩沖區(qū)清理一次)ü 遇到檢查點
綜合DBWn和LGWR工作的特點,我們可以得到日志文件的幾個特點:
首先,日志文件的寫入是很頻繁的。LGWR會不斷將日志信息從LogBuffer中寫入Online Redo Log;其次,在日志文件上,可以有三個類型的事務(wù)事件。
1、事務(wù)結(jié)束,已經(jīng)被commit,之后打過checkpoint檢查點。這種事務(wù)記錄在LogFile上,但是變化信息已經(jīng)被DBWn寫入進(jìn)數(shù)據(jù)文件;2、事務(wù)結(jié)束,已經(jīng)被commit,之后沒有打入checkpint檢查點。這種情況下,LogFile已經(jīng)寫入了日志項目,數(shù)據(jù)文件可能包括臟數(shù)據(jù),也可能沒有寫入臟數(shù)據(jù);3、事務(wù)未結(jié)束,沒有commit。這種時候,數(shù)據(jù)塊DirtyBlock上面是有事務(wù)槽信息,表示未結(jié)束事務(wù),是不會將數(shù)據(jù)寫入到數(shù)據(jù)文件中。但是,日志LogBuffer可能將部分未提交的DML操作項目寫入到Log File中;檢查點Checkpoint
檢查點Checkpoint是數(shù)據(jù)庫一致性檢查的一個標(biāo)記。簡單的說,就是在這個點上,Oracle保證各個文件(數(shù)據(jù)、控制、日志等)是一致的。檢查點的作用就是在進(jìn)行實例恢復(fù)的時候,告訴SMON進(jìn)程,這個點之前的內(nèi)容不需要進(jìn)行恢復(fù)。
前滾和回滾介紹
“前滾和回滾”是Oracle數(shù)據(jù)庫實例發(fā)生意外崩潰,重新啟動的時候,由SMON進(jìn)行的自動恢復(fù)過程。下面通過模擬實例和講解介紹這個過程。
失敗前場景說明
日志中記錄過程如下:
1、事務(wù)A進(jìn)行之后,結(jié)束commit。之后系統(tǒng)進(jìn)行了一次checkpointA;2、Checkpoint之后,進(jìn)行事務(wù)B,結(jié)束commit;3、進(jìn)行事務(wù)C,C事務(wù)量較大,其中進(jìn)行了一定量的RedoLog文件寫入。之后系統(tǒng)斷電;--按照LGWR的工作機(jī)制,C事務(wù)量比較大,所以應(yīng)用程序?qū)⒃趲追种幻雰?nèi)的時間里生成足以填充1/3秒的重做內(nèi)容,因此這會觸發(fā)LGWR將日志緩沖區(qū)的內(nèi)容轉(zhuǎn)儲到日志文件,但始終得不到針對C事務(wù)的提交記錄,這是需要回滾的。
4、還有種可能,事務(wù)B和D,事務(wù)D所用的緩沖區(qū)處于高速緩沖區(qū)不活躍的位置,而且事務(wù)B已提交,但其所用的緩沖區(qū)處于高速緩沖區(qū)活躍的位置。因此DBWn會將D事務(wù)緩沖區(qū)數(shù)據(jù)寫入數(shù)據(jù)文件,而沒將B事務(wù)的數(shù)據(jù)寫入。此種情況需要回滾D事務(wù),保留B事務(wù)。---參考OCP認(rèn)證考試指南全冊(P358下半部分內(nèi)容).
1、系統(tǒng)啟動過程,進(jìn)入實例恢復(fù)階段
當(dāng)實例意外中斷的時候,各類型文件,包括控制文件、數(shù)據(jù)文件和日志文件上,會存在不一致的問題。這種不一致主要體現(xiàn)在SCN值的差異上。
實例在啟動的時候,經(jīng)過三階段(nomount、mount和open)。在open之前,會進(jìn)行這種不一致現(xiàn)象的檢查,如果出現(xiàn)不一致,要啟動SMON進(jìn)程的恢復(fù)流程。
SMON是Oracle實例的一個后臺進(jìn)程,主要負(fù)責(zé)進(jìn)行系統(tǒng)監(jiān)控恢復(fù)。進(jìn)行恢復(fù)的依據(jù)主要是RedoLog記錄。
2、前滾進(jìn)程
SMON首先找到最后SCN記錄的Redo LogFile。尋找最后一個打入的Checkpoint。
順序找到CheckPointA之后,表示A之前的所有事務(wù)都是完全寫入到數(shù)據(jù)文件中,不存在不一致性問題。恢復(fù)過程從CheckpointA開始,Oracle開始依據(jù)重做日志Redo Log的系列條目,進(jìn)行推進(jìn)。
首先遇到了事務(wù)B信息,由于事務(wù)B已經(jīng)commit,所以事務(wù)B所有相關(guān)的Redo Log條目已經(jīng)全都寫入到Redo LogFile中。所以,按照日志繼續(xù)條目推進(jìn),完全可以重演replay,并且應(yīng)用apply事務(wù)B的全部過程。
這樣,事務(wù)B全部實現(xiàn),最終將通過DBWn完全寫入到數(shù)據(jù)文件中。所以,實例失敗之前提交commit的事務(wù)B,完全恢復(fù)。
進(jìn)入事務(wù)C的范疇,由于一部分事務(wù)C的RedoLog條目已經(jīng)進(jìn)入Redo LogFile中(根據(jù)LGWR和DBWn的工作機(jī)制,事務(wù)C有可能將部分?jǐn)?shù)據(jù)塊寫入日志文件和數(shù)據(jù)文件,但這時候C事務(wù)始終沒提交,這是比較嚴(yán)重的訛誤,所以需要回滾),所以在進(jìn)行前滾的時候,一定會replay到這部分的內(nèi)容。不過,這部分內(nèi)容中不可能出現(xiàn)commit的標(biāo)記。所以,前滾的結(jié)果一定是遇到實例突然中斷的那個時點。此時replay的結(jié)果是,事務(wù)C沒有提交。這樣結(jié)束了前滾過程,進(jìn)入回滾階段。
3、回滾過程(與普通的回滾一樣(當(dāng)事務(wù)執(zhí)行失敗后自動回滾或者命令:ROLLBACK.)---參考OCP認(rèn)證考試指南全冊)對事務(wù)C(針對DML的update,當(dāng)然其他同理),要進(jìn)行回滾過程,釋放所有相關(guān)資源。在前滾中,利用日志填充了的撤銷塊和表數(shù)據(jù)塊的值,然后在回滾的時候,會將撤銷塊的值復(fù)制回表數(shù)據(jù)塊中(因為此事務(wù)沒提交記錄),以此來進(jìn)行SGA中BufferCache數(shù)據(jù)塊恢復(fù)。
4、說說恢復(fù)過程的損耗
很多時候,由于我們事務(wù)規(guī)模較大,當(dāng)出現(xiàn)實例崩潰的時候,重啟所需要的時間很多。有一種經(jīng)驗說法是,事務(wù)有多長,前滾和回滾所消耗的時間有多長×2。而且,如果不能完成SMON恢復(fù)過程,數(shù)據(jù)庫是不能算作正常的Open的。
SMON的恢復(fù)過程是Oracle強(qiáng)制進(jìn)行的一個過程,即使恢復(fù)中發(fā)生斷電或者其他中斷失敗事件。Oracle在下一次啟動的時候,還是會繼續(xù)這個過程,只有耐心等待。
通過檢查一些內(nèi)部視圖(X$視圖),可以觀察到恢復(fù)進(jìn)程和速度,但是絲毫不能影響到最終恢復(fù)的過程。
這個過程雖然可以保證數(shù)據(jù)一致性,但是也帶來了系統(tǒng)不能啟動,影響生產(chǎn)環(huán)境的問題。我們可以通過兩個方式進(jìn)行緩解:
首先,我們在設(shè)計開發(fā)系統(tǒng)時,要保證事務(wù)規(guī)模的可控性,不要讓事務(wù)規(guī)模在技術(shù)層面上過大。避免一旦發(fā)生崩潰,大規(guī)模強(qiáng)制回滾的發(fā)生;其次,一旦出現(xiàn)了這個強(qiáng)制回滾,要注意對生產(chǎn)環(huán)境的影響??梢圆捎脗鋷靤tandby進(jìn)行頂替,讓主庫安靜的慢慢恢復(fù);
朋友:
oracle中有兩樣?xùn)|西是用來記錄歷史的
一、重做日志 REDO(作用就是當(dāng)你8點做了很多事情,到10點由于數(shù)據(jù)庫8點到10點操作的某個文件壞了,那么8點到10點的的東西全都不見了,但是REDO還在。你就可以用REDO來做重做你8點到10點所做的事,REDO就是記錄了這樣的事?。?/p>
二、回滾段 UNDO (作用就是當(dāng)你后悔做了某些事之后就可以回到以前,但是在人間可是沒有后悔要賣的哦。如你無意刪除一個表,你就可以用rollback命令來回滾,它利用的就是oracle 的撤消表空間記錄的內(nèi)容。當(dāng)然這個表空間滿了的時候也就不能回滾到它沒記錄的內(nèi)容了。)
刪除表后,可以采用如下操作:
在 user_recyclebin中找到最近操作過的表名稱,然后用閃回(只能用于10G及以上版本)。
FLASH BACK TABLE TABLE_NAME TO BEFORE DROP;
如果是刪了或修改里面的數(shù)據(jù),可以先建立一個快表將刪除修改之前狀態(tài)的數(shù)據(jù)找回到這個表中:
CREATE TABLE QUICK_TABLE AS
SELECT * FROM TABLE_NAME AS OF TIMESTAMP SYSTEM-1/24 (一小時前的),減去的時間可以自己定。如樓上F_253那位老兄的寫法就不錯,能自由定制時間
execute執(zhí)行后
可以回滾
commit提交后
不可以回滾
其實Oracle提交數(shù)據(jù)是分兩步操作的,第一步execute執(zhí)行,第二步commit提交。對應(yīng)的PL\SQL也是要先點execute執(zhí)行,執(zhí)行后再點commit提交。
但是
commit提交后
可以用閃回查詢恢復(fù)原來的數(shù)據(jù)
因為oracle會將近期的數(shù)據(jù)保存到快照中
如:
SELECT
*
FROM
TABLE_1
AS
OF
TIMESTAMP
TO_TIMESTAMP('20080606
20:00:00','YYYYMMDD
HH24:MI:SS');
這里'20080606
20:00:00'就是你想恢復(fù)數(shù)據(jù)到哪個時間狀態(tài)
TABLE_1是數(shù)據(jù)庫的表名
這樣查詢到的數(shù)據(jù)就是執(zhí)行更新操作之前的數(shù)據(jù)
execute執(zhí)行后
可以回滾
commit提交后
不可以回滾
其實oracle提交數(shù)據(jù)是分兩步操作的,第一步execute執(zhí)行,第二步commit提交。對應(yīng)的pl\sql也是要先點execute執(zhí)行,執(zhí)行后再點commit提交。
但是
commit提交后
可以用閃回查詢恢復(fù)原來的數(shù)據(jù)
因為oracle會將近期的數(shù)據(jù)保存到快照中
如:
select
*
from
table_1
as
of
timestamp
to_timestamp('20080606
20:00:00','yyyymmdd
hh24:mi:ss');
這里'20080606
20:00:00'就是你想恢復(fù)數(shù)據(jù)到哪個時間狀態(tài)
table_1是數(shù)據(jù)庫的表名
這樣查詢到的數(shù)據(jù)就是執(zhí)行更新操作之前的數(shù)據(jù)