根據(jù)oracle數(shù)據(jù)庫的特點和提供的工具,主要方法有以下幾種方法:
創(chuàng)新互聯(lián)服務(wù)項目包括杏花嶺網(wǎng)站建設(shè)、杏花嶺網(wǎng)站制作、杏花嶺網(wǎng)頁制作以及杏花嶺網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,杏花嶺網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟(jì)效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到杏花嶺省份的部分城市,未來相信會繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
利用邏輯備份使用import工具丟失數(shù)據(jù)的表
利用物理備份來通過還原數(shù)據(jù)文件并進(jìn)行不完全恢復(fù)
利用dbms_logmnr包從redo log文件中恢復(fù)
利用flashback特性恢復(fù)數(shù)據(jù)
前提
為了方便使用方法的介紹,上述恢復(fù)方法都將基于以下場景進(jìn)行:系統(tǒng)管理員在前一天晚上11點用export對數(shù)據(jù)庫做了全庫邏輯備份,然后對所有數(shù)據(jù)文件進(jìn)行了熱備份。第二天上午10點,系統(tǒng)管理員在修改表TFUNDASSET的數(shù)據(jù)時,由于修改語句的條件寫錯了,導(dǎo)致一批記錄(幾千條)的ztm字段被修改成了錯誤的值,而且已經(jīng)提交。這個表是資產(chǎn)表,相對而言數(shù)據(jù)變化不頻繁。
一、利用邏輯備份使用import工具恢復(fù)丟失的數(shù)據(jù)
export/import是oracle提供的用于對數(shù)據(jù)庫進(jìn)行邏輯備份的工具。該工具適用于備份那些數(shù)據(jù)量不大、業(yè)務(wù)量不多的數(shù)據(jù)庫系統(tǒng)。因為如果在前一天晚上11點用export做了邏輯備份,那么當(dāng)今天上午10點數(shù)據(jù)庫意外崩潰時,從備份起到數(shù)據(jù)庫崩潰的這段時間里的數(shù)據(jù)修改操作(包括DDL和DML)都會丟失。如果丟失數(shù)據(jù)內(nèi)的表上的數(shù)據(jù)是相對比較穩(wěn)定,也就是說該表上基本沒有DML操作,例如標(biāo)準(zhǔn)代碼表、分區(qū)表里的歷史數(shù)據(jù),那么采用import來導(dǎo)入該表可以比較完整的恢復(fù)數(shù)據(jù)。如果該表是經(jīng)常變化的業(yè)務(wù)表,那么這些丟失的數(shù)據(jù)只能根據(jù)業(yè)務(wù)情況從紙質(zhì)記錄恢復(fù),或者其他途徑恢復(fù)。
▲示例如下:這個表是一個資產(chǎn)表。相對來說,今天系統(tǒng)運行中修改的數(shù)據(jù)較少,丟失的數(shù)據(jù)量可以承受或者可以從別的途徑恢復(fù)。那就可以用import來恢復(fù)。
方法一:
1、把這個表的數(shù)據(jù)備份到另一個表:
8bef9890242e5d20d09563896cef1471.png
2、刪除該表的記錄:
625dfa5d5986ca5c37dd5017953407cb.png
3、執(zhí)行下面的命令:
3754d50cc473bd44236d927f00196d24.png
這個命令中在關(guān)鍵字tables中指定需要導(dǎo)入的表名字,ignore=y表示忽略表已經(jīng)存在的錯誤。
4、導(dǎo)入結(jié)束后,檢查表中的記錄,并用適當(dāng)?shù)姆椒ɑ謴?fù)當(dāng)天的修改。
方法二:
1、 把需要恢復(fù)的表導(dǎo)入到另一個用戶下面:
33806d1216df5ae9c45890d3d45930ee.png
2、檢查數(shù)據(jù)以后,把原表記錄刪除:
fe23a8a4602702e951e5ab48a7460e3b.png
3、然后從另一用戶表中插入回去:
729976810ef459046df40b791a6ca773.png
4、 數(shù)據(jù)量比較大時可以采用如下方法:
e377d10ff07132f160185cb1ba119cfc.png
二、利用物理備份來通過還原數(shù)據(jù)文件并進(jìn)行不完全恢復(fù)
如果數(shù)據(jù)庫運行在歸檔模式下,那么可以通過使用以前的數(shù)據(jù)文件備份進(jìn)行還原,然后利用歸檔日志進(jìn)行前滾,直到回滾到錯誤操作的時間點前,然后重置日志文件打開數(shù)據(jù)庫。
可以通過下列方法確認(rèn)是否是運行在歸檔模式:
c8406e42aef7ccc8ef232cfdd535e825.png
如果是如上所示,那么就是運行在歸檔模式了。
▲假定在前一天晚上11點做了全庫物理備份,那么可以考慮如下恢復(fù):
1、關(guān)閉數(shù)據(jù)庫:
由于數(shù)據(jù)庫的不完全恢復(fù)必須在一個關(guān)閉的數(shù)據(jù)庫上實施,利用一個舊的數(shù)據(jù)庫的備份還原,然后用日志根據(jù)需要逐步前滾,而不能還原一個新的備份,再回退到某個時間點。
通知各客戶端數(shù)據(jù)庫將關(guān)閉,然后發(fā)出:
401f68e89cbfa03388f5913bf5f1ecfd.png
數(shù)據(jù)庫已經(jīng)關(guān)閉。
已經(jīng)卸載數(shù)據(jù)庫。
ORACLE 例程已經(jīng)關(guān)閉。
2、確定錯誤操作的時間:
可以根據(jù)操作員的估計來確定不完全恢復(fù)需要前滾停止的時間,也可以利用LogMiner來分析日志文件(這個工具將在后面介紹),找出錯誤操作的準(zhǔn)確時間。
3、還原數(shù)據(jù)文件:
先對當(dāng)前的數(shù)據(jù)庫文件進(jìn)行備份,然后再用以前的最近一次備份覆蓋現(xiàn)有數(shù)據(jù)文件。注意:不覆蓋現(xiàn)有的控制文件。
4、基于時間點恢復(fù),啟動數(shù)據(jù)庫到裝配狀態(tài):
8802043c250eb2a060285be160f48c36.png
這樣數(shù)據(jù)庫就恢復(fù)到了2015年10月20日的9點58分零秒。
然后再利用業(yè)務(wù)資料補(bǔ)充這段時間內(nèi)的數(shù)據(jù)。
三、利用dbms_logmnr包從log文件中恢復(fù)
這個包是由Oracle提供,與dbms_logmnr_d包配合使用可以方便地分析聯(lián)機(jī)日志文件和歸檔日志文件,從這些日志文件中提取出所有對數(shù)據(jù)庫的更改操作。
在使用這個包之前,需要先做一些設(shè)置和修改:
1、打開initorcl.ora,修改初始化參數(shù)utl_file_dir,設(shè)置dbms_logmnr_d包將要使用的數(shù)據(jù)字典文件的放置目錄。
eb6dad504d6f5841641cbd02c5f6dee1.png
然后重啟數(shù)據(jù)庫使參數(shù)生效。
2、以sys用戶連接到數(shù)據(jù)庫執(zhí)行dbmslmd.sql腳本重建dbms_logmnr_d這個包。
應(yīng)用Logminer分析重做日志文件的操作主要有以下步驟:
● 使用dbms_logmnr_d里的存儲過程build創(chuàng)建一個外部數(shù)據(jù)字典文件;
● 使用dbms_logmnr里的存儲過程add_logfile添加要分析的日志文件;
● 使用dbms_logmnr里的存儲過程start_logmnr啟動分析;
● 查詢與dbms_logmnr相關(guān)的幾個視圖來獲取日志文件內(nèi)容;
● 使用dbms_logmnr里的存儲過程end_logmnr結(jié)束分析。
▲下面詳細(xì)講述使用的過程
1、使用dbms_logmnr_d里的存儲過程build創(chuàng)建一個外部數(shù)據(jù)字典文件:
a0975e25f5049f1ffdfdd49ad7ae943d.png
2、使用dbms_logmnr里的存儲過程add_logfile添加要分析的日志文件到待分析文件列表:
d16ea343204a3a15b29bc6b94985d48d.png
如果沒有運行在歸檔模式,那么由于重做日志文件的循環(huán)使用可能導(dǎo)致日志文件被覆蓋而無法獲取到所要尋找的恢復(fù)條目。如果運行在歸檔模式,則可以通過查看$ORACLE_HOMEadminorclbdump目錄下的alert_orcl.log里日志文件歸檔的時間和錯誤操作的時間來確定加入哪些歸檔日志文件到待分析的文件列表中去。
eff89b61175131d3edda456d8d9bc18e.png
注意:執(zhí)行以上過程時logfilename參數(shù)需要寫日志文件的全路徑,否則會報錯。重復(fù)以上操作直到把所有需要分析的文件都加到列表中去。這樣就可以啟動進(jìn)行分析。
3、使用dbms_logmnr里的存儲過程start_logmnr啟動分析;
3630359ea5afa57b5ea51c89da5b8c41.png
這樣就可以通過下面的查詢來獲取日志文件的內(nèi)容了。
4、查詢與dbms_logmnr相關(guān)的幾個視圖來獲取日志文件內(nèi)容;
3f8098efdbe50d4b5b4a5311eab6b5d0.png
這樣就可以找出要恢復(fù)所需的語句。注意:v$logmnr_contents只對執(zhí)行dbms_logmnr.start_logmnr的會話有效,如果通過其他會話或者使用dbms_logmnr.end_logmnr終止了分析,都將不能訪問v$logmnr_contents的數(shù)據(jù)。如果要使其他會話也能獲取到這些數(shù)據(jù),可以通過另外建表來實現(xiàn),如:
create table undo_sql as select * from v$logmnr_contents。
再對undo_sql進(jìn)行授權(quán),其他用戶就可以訪問v$logmnr_contents的數(shù)據(jù)了。
5、使用dbms_logmnr里的存儲過程end_logmnr結(jié)束分析。
使用完成以后用下面的命令來結(jié)束分析活動:exec dbms_logmnr.end_logmnr;
這樣就釋放了分配給logminer的資源(內(nèi)存和數(shù)據(jù)結(jié)構(gòu))。
從上面的過程可知,如果是更新的數(shù)據(jù)量比較大,而日志文件比較小,就可能會導(dǎo)致日志文件的切換。如果沒有及時去挖掘日志文件(沒有運行在歸檔模式),那么可能會由于日志文件的循環(huán)使用而導(dǎo)致數(shù)據(jù)不可恢復(fù)。如果運行在歸檔模式,也可能由于需要分析的日志文件比較多而時間較長。
四、利用flashback新特性恢復(fù)數(shù)據(jù)
Oracle9i 開始提供了閃回查詢(Flashback Query)功能,對于誤刪除或者誤更新并且已經(jīng)commit了的情況提供了簡便快捷的恢復(fù)方法;而在Oracle 提供閃回查詢之前,碰到這種情況只能通過備份來進(jìn)行基于時間點的恢復(fù)或者使用logmnr挖掘日志來恢復(fù),無疑這比閃回查詢要麻煩而且費時。
使用這個Flashback Query特性的前提條件:
1. 數(shù)據(jù)庫必須處于Automatic Undo Management 狀態(tài)。
9d9facd0a8d3e8675284d38f601525d1.png
2. 最大可以閃回查詢的時間段由UNDO_RETENTION 初始化參數(shù)(單位為秒)指定
b7a419e2f47bd4d31005ca2d9b4a7c58.png
可以通過ALTER SYSTEM SET UNDO_RETENTION = ;來動態(tài)修改參數(shù)值。
▲如何使用Flashback Query來恢復(fù)數(shù)據(jù)呢?
1. 通過SQL
28b1053a806762ec87261e80f0e8751f.png
使用SELECT 語句的AS OF 來進(jìn)行閃回查詢,語法如下:
使用AS OF 關(guān)鍵字來對表,視圖或者物化視圖進(jìn)行Flashback Query,如果指定了SCN,那么expr 部分必須是一個數(shù)字,如果指定了TIMESTAMP,那么expr 必須是一個timestamp類型的值。查詢結(jié)果將返回在指定的SCN 或者時間點上的數(shù)據(jù)。
下面我們使用scott 方案來作一個實驗。
24547dbf2f8f3515319435d98acc0f10.png
如果想在update 的子查詢部分使用AS OF,那么該查詢只能返回一條記錄,否則將會報錯。
可以通過添加一個臨時表作為中轉(zhuǎn),然后再作更新,如下:
5605ae591ab357c7148787937df03e17.png
2.通過DBMS_FLASHBACK包來恢復(fù)
DBMS_FLASHBACK 包提供了以下幾個函數(shù):
ENABLE_AT_TIME:設(shè)置當(dāng)前SESSION 的閃回查詢時間
ENABLE_AT_SYSTEM_CHANGE_NUMBER:設(shè)置當(dāng)前SESSION 的閃回查詢SCN
GET_SYSTEM_CHANGE_NUMBER:取得當(dāng)前數(shù)據(jù)庫的SCN
DISABLE:關(guān)閉當(dāng)前SESSION 的閃回查詢
當(dāng)將一個SESSION 設(shè)置為閃回查詢模式之后,后續(xù)的查詢都會基于那個時間點或者SCN 的數(shù)據(jù)庫狀態(tài),如果SESSION 結(jié)束,那么即使沒有明確指定DISABLE,閃回查詢也會自動失效。
當(dāng)SESSION 運行在閃回查詢狀態(tài)時,不允許進(jìn)行任何DML 和DDL 操作。如果要用DML操作來進(jìn)行數(shù)據(jù)恢復(fù)就必須使用PL/SQL 游標(biāo)。
▲示例:
fbaf8acfe357d8f21039d588c8b658df.png
通過上面的例子可以看出,只要這個修改的時間不早于sysdate- (UNDO_RETENTION指定的秒數(shù)),就可通過這種方式來恢復(fù)數(shù)據(jù)。
e93c4d7b11cf4e7c8ed9a0d27c79ea80.png
對于問題中的批量數(shù)據(jù),可以寫個過程來完成獲取到更改前的數(shù)據(jù):
然后再用這個臨時表里的數(shù)據(jù)來更新TFUNDASSET就可以了。
五、總結(jié)
比較以上幾種恢復(fù)數(shù)據(jù)的方法的使用過程,我們可以看出:
● exp/imp只適合于數(shù)據(jù)變化不大的表的數(shù)據(jù)丟失的情況,即使用這種方法處理后也需要從業(yè)務(wù)辦理資料中修正數(shù)據(jù),否則導(dǎo)致數(shù)據(jù)丟失;
● 采用基于時間點的不完全恢復(fù)可以恢復(fù)丟失的數(shù)據(jù),但是需要關(guān)關(guān)閉數(shù)據(jù)庫,減少系統(tǒng)可用時間,而且也會丟失恢復(fù)時間點以后的數(shù)據(jù);
● 使用LogMiner可以較好的恢復(fù)數(shù)據(jù),但是要求數(shù)據(jù)庫盡可能運行在歸檔模式,否則也可能導(dǎo)致數(shù)據(jù)丟失。好處是不用關(guān)閉系統(tǒng),能夠從日志文件中得到所有的數(shù)據(jù)。
● 使用Flashback最方便和簡潔,可以直接得到修改前的數(shù)據(jù),但是需要依賴系統(tǒng)設(shè)置,并且需要占用大量的回滾表空間。
因此選擇什么樣的方法來恢復(fù)數(shù)據(jù),取決于你的系統(tǒng)環(huán)境和具體情況,不能生搬硬套。采用正確的方法才能最大程度的減少數(shù)據(jù)的丟失。
當(dāng)然,最好是不需要用到這些恢復(fù)的辦法。前提是,你必須做好以下的工作:
1、 為不同環(huán)境創(chuàng)建不同的數(shù)據(jù)庫用戶、不同密碼(如果不能用戶不同,一定要密碼不同);
2、 將owner和應(yīng)用用戶分開,并做適度授權(quán);
3、 在做DML前,先用同樣的條件做查詢,看根據(jù)結(jié)果集是否符合預(yù)期。
主要軟件版本: 4.4 主要軟件修正版本: 4.4 次要軟件: N/A 解答:MAX數(shù)據(jù)庫崩潰非常罕見,但是當(dāng)突然斷電或者死機(jī)而導(dǎo)致系統(tǒng)非正常關(guān)機(jī)、重啟時可能會導(dǎo)致這一問題。數(shù)據(jù)庫崩潰可能出現(xiàn)的一個現(xiàn)象就是當(dāng)點擊MAX中任一文件夾旁邊的擴(kuò)展按鈕“+”時,文件夾不但不,“+”還消失了。如果這一現(xiàn)象是在安裝了新版本的MAX之后才產(chǎn)生的,您需要確認(rèn)一下安裝之后是否重啟了PC。 MAX會備份數(shù)據(jù)庫文件,這可以被用于恢復(fù)數(shù)據(jù)庫崩潰。具體步驟如下:以管理員身份或者有管理員權(quán)限的用戶賬號登錄(如果安裝了F-Secure之類的固件,請確保其在下面的過程中保持關(guān)閉?。和顺鏊械腘I應(yīng)用程序。
昨天 一個朋友公司的數(shù)據(jù)庫崩潰
這再次印證了我反復(fù)提到的一個命題 數(shù)據(jù)庫也需要休息
每逢節(jié)假日 數(shù)據(jù)庫也經(jīng)常會自我選擇放假
以前我說 年終難終 進(jìn)入數(shù)據(jù)庫事故多發(fā)期 一年一度今又是 記得另外一個圣誕節(jié) 我還和Biti一起在北京的時候 同樣遇到一個上海的朋友數(shù)據(jù)庫崩潰 我們遠(yuǎn)程指導(dǎo)這位朋友恢復(fù)了數(shù)據(jù)
這次的事情是這樣的
首先主機(jī)宕機(jī) 磁盤出錯
看到以下這類錯誤 一般你的數(shù)據(jù)都很危險了
Dec : : kernel: sda : rw= want= limit= Dec : : kernel: attempt to access beyond end of deviceDec : : kernel: sda : rw= want= limit= Dec : : kernel: attempt to access beyond end of deviceDec : : kernel: sda : rw= want= limit= Dec : : kernel: attempt to access beyond end of deviceDec : : kernel: sda : rw= want= limit= Dec : : kernel: attempt to access beyond end of deviceDec : : kernel: sda : rw= want= limit= Dec : : kernel: attempt to access beyond end of deviceDec : : kernel: sda : rw= want= limit= Dec : : kernel: attempt to access beyond end of deviceDec : : kernel: sda : rw= want= limit= Dec : : kernel: attempt to access beyond end of deviceDec : : kernel: sda : rw= want= limit= Dec : : kernel: attempt to access beyond end of deviceDec : : kernel: sda : rw= want= limit= Dec : : kernel: attempt to access beyond end of deviceDec : : kernel: sda : rw= want= limit=
數(shù)據(jù)文件大量損壞
當(dāng)然這次也不例外 大量文件損壞 dbv大量如下錯誤
[oracle@stat datafile]$ dbv file=o _mf_system_ mn _ dbf blocksize=
DBVERIFY: Release Production on Thu Dec : :
Copyright (c) Oracle All rights reserved
DBVERIFY Verification starting : FILE = o _mf_system_ mn _ dbfPage is influx most likely media corruptCorrupt block relative dba: x (file block )Fractured block found during dbv: Data in bad block:type: format: rdba: x last change scn: x f e seq: x flg: x spare : x spare : x spare : x consistency value in tail: xbc check value in block header: xc cbputed block checksum: xb
Page is influx most likely media corruptCorrupt block relative dba: x e (file block )Fractured block found during dbv: Data in bad block:type: format: rdba: x e last change scn: x b seq: x flg: x spare : x spare : x spare : x consistency value in tail: x c check value in block header: x d fputed block checksum: x dc
控制文件損壞
啟動數(shù)據(jù)庫出現(xiàn)如下錯誤
Wed Dec : : ALTER DATABASE MOUNed Dec : : Errors in file /opt/oracle/admin/stat/udump/stat_ora_ trc:ORA : internal error code arguments: [kccpb_sanity_check_ ] [ ] [ ] [ x ] [] [] [] []Wed Dec : : ORA signalled during: ALTER DATABASE MOUNT Wed Dec : : Starting ORACLE instance (normal)Wed Dec : : Corrupt block found during reading backup piece file=/opt/oracle/product/db g/dbs/snapcf_stat f corr_type=
經(jīng)過反復(fù)確認(rèn) 這個環(huán)境Over了
不完全的備份
以前的備份機(jī)制使得我可以從遠(yuǎn)程主機(jī)找到一系列備份集 但是沒有控制文件
通過備份集 dbms_backup_restore等手段 首先恢復(fù)出來數(shù)據(jù)文件 然后嘗試啟動數(shù)據(jù)庫
強(qiáng)制打開
通過強(qiáng)制resetlogs手段打開數(shù)據(jù)庫 出現(xiàn)ORA 錯誤
Wed Dec : : Errors in file /opt/oracle/admin/stat/udump/stat_ora_ trc:ORA : internal error code arguments: [ ] [ ] [] [] [] [] [] []Wed Dec : : Errors in file /opt/oracle/admin/stat/udump/stat_ora_ trc:ORA : bootstrap process failureORA : bootstrap process failureORA : internal error code arguments: [ ] [ ] [] [] [] [] [] []
通過BBED解決ORA 錯誤
這個沒說的 只能通過BBED搞定了 修復(fù)有問題的數(shù)據(jù)塊 再次嘗試打開數(shù)據(jù)庫
遇到ORA 錯誤
這個錯誤就好解決了 通過我網(wǎng)站上的示例就可以解決
Wed Dec : : Errors in file /opt/oracle/admin/stat/udump/stat_ora_ trc:ORA : internal error code arguments: [ ] [ ] [ ] [ ] [ ] [ ] [] []ORA : ORACLE instance terminated Disconnection forcedORA : internal error code arguments: [ ] [ ] [ ] [ ] [ ] [ ] [] []Wed Dec : : Errors in file /opt/oracle/admin/stat/udump/stat_ora_ trc:ORA : internal error code arguments: [ ] [ ] [ ] [ ] [ ] [ ] [] []ORA : internal error code arguments: [ ] [ ] [ ] [ ] [ ] [ ] [] []ORA : ORACLE instance terminated Disconnection forcedORA : internal error code arguments: [ ] [ ] [ ] [ ] [ ] [ ] [] []Wed Dec : : Errors in file /opt/oracle/admin/stat/udump/stat_ora_ trc:ORA : internal error code arguments: [ ] [ ] [ ] [ ] [ ] [ ] [] []ORA : internal error code arguments: [ ] [ ] [ ] [ ] [ ] [ ] [] []ORA : ORACLE instance terminated Disconnection forcedORA : internal error code arguments: [ ] [ ] [ ] [ ] [ ] [ ] [] []
解決ORA 號錯誤
接下來繼續(xù)出現(xiàn)ORA 號錯誤 這個也好解決 搞定UNDO表空間就Ok了
Wed Dec : : Errors in file /opt/oracle/admin/stat/bdump/stat_j _ trc:ORA : internal error code arguments: [ ] [] [] [] [] [] [] []
解決一些其他小問題
此處省略 字 終于搞定了用戶數(shù)據(jù)庫!
lishixinzhi/Article/program/Oracle/201311/17213
Oracle重做日志
Oracle的重做日志文件(Online redo logfile)循環(huán)記錄了數(shù)據(jù)庫所有的事務(wù) 它的大小 個數(shù)和存儲位置對數(shù)據(jù)庫性能和恢復(fù)有重要影響 它一般由大小相同的幾組文件構(gòu)成 我們可以查看數(shù)據(jù)庫視圖v$logfile知道redo logfile的個數(shù)和存儲位置 對每一個Oracle數(shù)據(jù)庫都要求至少具有兩個聯(lián)機(jī)重做日志
每一次新的事務(wù)提交時 Oracle將該事務(wù)寫入日志文件 但并非此時也將修改的數(shù)據(jù)塊寫回原數(shù)據(jù)文件 由于內(nèi)存讀寫和磁盤I/O存在幾個數(shù)量級的效率差別 Oracle通過減少數(shù)據(jù)文件的物理I/O讀寫來大大提高數(shù)據(jù)庫的性能 同時 又通過優(yōu)先寫日志文件來保證數(shù)據(jù)的正確性和一致性 基于這種機(jī)制 重做日志文件在數(shù)據(jù)庫的實例恢復(fù)和介質(zhì)恢復(fù)時至關(guān)重要 是oracle數(shù)據(jù)庫最重要的物理文件之一
如果數(shù)據(jù)庫在啟動時檢測到重做日志丟失 數(shù)據(jù)庫將無法啟動 如果數(shù)據(jù)庫在運行時切換日志文件組 檢測到下一組或者全部的重做日志丟失 數(shù)據(jù)庫將會崩潰 由于磁盤介質(zhì)損壞或者人為的誤刪除文件 造成嚴(yán)重后果的事件近期時有發(fā)生 本文列舉了重做日志丟失的數(shù)據(jù)庫恢復(fù) 但如果按照冗余原則合理分布日志文件組的成員 如果工程師了解日志文件的基本原理和使用原則 就完全可以避免出現(xiàn)下列問題
恢復(fù)方法
故障現(xiàn)象
SQL startup mount
Oracle Instance Started
Database mounted
ORA : open failed for members of log group of thread
ORA : online log thread : /ORACLE/ORADATA/H /REDO LOG
ORA : unable to open file
OSD : unable to open file
O/S Error: (OS ) The system cannot find the file specified
恢復(fù)注意事項
以下所列舉的恢復(fù)方法 都屬于不完全恢復(fù)或者強(qiáng)制恢復(fù) 會丟失當(dāng)前重做日志中的事務(wù)數(shù)據(jù) 一旦操作不當(dāng) 將帶來數(shù)據(jù)丟失等嚴(yán)重后果 請遵循以下幾個恢復(fù)原則
請勿在生產(chǎn)系統(tǒng)上試用
如果生產(chǎn)系統(tǒng)出現(xiàn)重做日志文件丟失的故障 請勿自行操作破壞現(xiàn)場 應(yīng)該立刻聯(lián)系Oracle工程師
恢復(fù)成功之后 需要馬上做一次數(shù)據(jù)庫的全備份
建議重做日志文件一定要實現(xiàn)鏡象在不同的磁盤上 避免這種情況的發(fā)生
恢復(fù)方法
首先檢查重做日志文件狀態(tài) 看看報錯的日志文件的狀態(tài)是否為Current
SQL select * from v$log;
SQL select * from v$logfile;
如果重做日志文件狀態(tài)為Inactive 我們可以直接清除該日志文件的內(nèi)容
SQL alter database clear logfile /ORACLE/ORADATA/H /REDO LOG ;
如果重做日志文件狀態(tài)為Current 恢復(fù)工作較為復(fù)雜 有以下四種情況
)通過下面步驟 數(shù)據(jù)庫順利打開
SQL recover database until cancel;
Type Cancel when prompted
SQLalter database open resetlogs;
)第一種情況的 recover database until cancel 操作遇到ORA ORA ORA 錯誤 需要整個數(shù)據(jù)庫的物理備份 并根據(jù)歸檔日志恢復(fù)到錯誤時間點 前提是數(shù)據(jù)庫是歸檔模式
restore old backup
SQL startup mount
SQL recover database until cancel using backup controlfile;
SQL alter database open resetlogs;
)如果數(shù)據(jù)庫是非歸檔模式 只能恢復(fù)整個物理備份 然后直接打開數(shù)據(jù)庫 這種情況將丟失物理備份至故障發(fā)生前的全部數(shù)據(jù)
)如果數(shù)據(jù)庫是非歸檔模式 且沒有物理備份 只能通過特殊的隱含參數(shù) 允許數(shù)據(jù)庫不一致的狀況下打開數(shù)據(jù)庫 這種恢復(fù)方法是沒有辦法之后的恢復(fù)方法 將導(dǎo)致數(shù)據(jù)庫不一致 一般情況下不要采用 如確有需要 請在Oracle的技術(shù)人員指導(dǎo)下使用該方法
???????? 關(guān)閉數(shù)據(jù)庫
SQLshutdown immediate
???????? 在initsid ora中加入如下參數(shù)
_allow_resetlogs_corruption=TRUE
???????? 重新啟動數(shù)據(jù)庫 利用until cancel恢復(fù)
SQLrecover database until cancel;
Cancel
???????? 打開數(shù)據(jù)庫
SQLalter database open resetlogs;
???????? 數(shù)據(jù)庫被打開后 馬上執(zhí)行一個全庫導(dǎo)出
關(guān)閉數(shù)據(jù)庫 在initsid ora中去掉_all_resetlogs_corrupt參數(shù)
lishixinzhi/Article/program/Oracle/201311/16743
Oracle概念問題 假如數(shù)據(jù)沒有提交 但是卻被dbwn進(jìn)程寫入了數(shù)據(jù)文件 會怎么樣呢?
案例分析
首先說明的是dbwn寫臟數(shù)據(jù)跟mit提交沒有關(guān)系!
在一個transaction發(fā)生的過程中 online redo log首先記錄transaction中修改的數(shù)據(jù)塊相關(guān)信息 修改的數(shù)據(jù)塊會被緩存在database buffer cache中 由于database buffer cache寫滿或者checkpoint等等條件觸發(fā)dbwn進(jìn)程 會導(dǎo)致這些緩存的數(shù)據(jù)塊寫入數(shù)據(jù)文件 但此時可能該transaction仍然還沒有提交 所以在數(shù)據(jù)文件中 可能會有mited 和 unmited 的數(shù)據(jù)塊 而原有的數(shù)據(jù)塊鏡像會存放在undo segment
IXDBA NET社區(qū)論壇
然而 dbwn寫臟數(shù)據(jù)時不管這個要寫的transaction是否提交
也沒有必要去管
這樣就發(fā)生了所謂的已經(jīng)提交的數(shù)據(jù) 但是還沒有寫入數(shù)據(jù)文件的現(xiàn)象
還有一種情況 數(shù)據(jù)沒有提交 但是已經(jīng)被寫入數(shù)據(jù)文件 此時發(fā)生回退 撤銷沒有提交的數(shù)據(jù)
那么 引發(fā)Oracle前滾與回退的根本原因就是什么呢?
根本原因是mit后寫redo buffer和觸發(fā)lgwr寫 redo buffer的區(qū)別
事務(wù)在執(zhí)行完畢后 隨即會被寫入redo buffer和undo中 同時在redo buffer和undo中對該事務(wù)都有一個是否提交的標(biāo)記 兩者的默認(rèn)狀態(tài)都是active的 即沒有提交時刻處于激活狀態(tài)
mit操作執(zhí)行時刻把此前的所有事務(wù)操作全部寫入redo log file mit成功后 redo buffer信息全部寫入redo file 同時修改兩者中的事務(wù)提交標(biāo)識為inactive 表示此前事務(wù)已經(jīng)遞交
oracle的前滾和回退根據(jù)就是依據(jù)事務(wù)是否提交而進(jìn)行的
在觸發(fā)lgwr進(jìn)程后 oracle同樣把此前的redo buffer信息寫入redo file 但是與mit觸發(fā)寫日志不同的是 redo file本身對lgwr寫日志操作不記錄任何信息標(biāo)識 lgwr寫到那里就是那里 就算此時掉電也無妨 redo file就記錄到掉電時刻的信息
lgwr是一個Oracle后臺執(zhí)行的進(jìn)程 具體的日志寫操作都有oracle去控制 這對于oracle來說是透明的 因此不用在redo file中寫入任何標(biāo)記信息 這也是正常的
mit操作是唯一一個可以前臺操作與oracle后臺通信的指令 因此當(dāng)加入這個操作以后 oracle本身必須要了解各個事務(wù)的讀寫狀況 那么怎么了解整個狀況 在redo以及undo中加入是否遞交的標(biāo)識 對于已經(jīng)提交的操作 但是還沒有寫入數(shù)據(jù)文件 那么就要前滾 相反 對于沒有提交 執(zhí)行回退!
于是 Oracle崩潰恢復(fù)步驟如下
首先rolling forward 前滾 由于oracle failure sga中的內(nèi)存信息丟失了 但是online redo log中還是存儲了transaction信息 包括mited or unmited data 可能這些修改信息并沒有被oracle正確的來處理 包含兩種情況 已經(jīng)提交的還沒有寫入數(shù)據(jù)文件 或者沒有提交的卻被寫入了數(shù)據(jù)文件 針對已經(jīng)提交的還沒有寫入數(shù)據(jù)文件就要發(fā)生前滾 在前滾過程中 *** on會根據(jù)online redo log中的記錄來完成對datafile的修改 保證已經(jīng)提交的數(shù)據(jù)已經(jīng)寫入數(shù)據(jù)文件
接下來 前滾結(jié)束后 數(shù)據(jù)庫正常open 此時用戶可以正常連接 可以訪問已經(jīng)recover的mited data 但是對于那些屬于unrecoverable transaction的unmited data 會被oracle 加鎖 是不可以訪問的
lishixinzhi/Article/program/Oracle/201311/16619
oracle數(shù)據(jù)庫恢復(fù),主要包括(1)系統(tǒng)崩潰只剩下數(shù)據(jù)文件的情況下的恢復(fù),甚至沒有system表空間而只有數(shù)據(jù)表空間的情況下的恢復(fù).只要提供數(shù)據(jù)文件就可恢復(fù).(2)undosystem表空間損壞數(shù)據(jù)恢復(fù).(3)非歸檔或者歸檔模式下誤delete數(shù)據(jù)的恢復(fù)、誤刪除表空間的恢復(fù)、droptruncate表的恢復(fù).(4)數(shù)據(jù)庫中有大量CLOBBLOB對象數(shù)據(jù)恢復(fù)等情況以及各種ora-錯誤的修復(fù).(5)DMP文件損壞導(dǎo)致文件不能導(dǎo)入數(shù)據(jù)庫的數(shù)據(jù)恢復(fù)(6)oracle數(shù)據(jù)庫中數(shù)據(jù)文件出現(xiàn)壞塊情況下的恢復(fù).(7)oracle數(shù)據(jù)庫無數(shù)據(jù)文件但有日志的情況下的恢復(fù).(8)UNIX、WINDOWS下ORACLE數(shù)據(jù)文件被誤刪除情況下的數(shù)據(jù)庫恢復(fù).(9)Oracle10G、Oracle11G的ASM損壞的數(shù)據(jù)庫恢復(fù).(10)Oracle10G、Oracle11GBIFGILETABLESPACE大文件表空間損壞數(shù)據(jù)恢復(fù)(11)Oracle9i、Oracle10G、Oracle11G壓縮表壓縮表空間損壞數(shù)據(jù)恢復(fù)(12)Oracle10GOracle11GExpdp導(dǎo)出Impdp導(dǎo)入DMP文件錯誤數(shù)據(jù)恢復(fù)恢復(fù)成功率高達(dá)90%以上,在數(shù)據(jù)恢復(fù)領(lǐng)域處于國內(nèi)領(lǐng)先的地位。具體案例見廣州拓飛官方網(wǎng)站