【數(shù)據(jù)恢復(fù)故障描述】
SUN 光纖存儲(chǔ)系統(tǒng),中心存儲(chǔ)為6枚300G硬盤組成的RAID6,劃分為若干LUN,MAP到不同業(yè)務(wù)的服務(wù)器上,服務(wù)器上運(yùn)行SUN SOLARIS操作系統(tǒng)。
正常工作狀態(tài)下,用戶需要新增應(yīng)用,所以增加了一臺(tái)IBM服務(wù)器,之后在線狀態(tài)下將存儲(chǔ)中的某個(gè)LUN映射到新增的IBM服務(wù)器,不料,映射的卷是原先已經(jīng)MAP到SOLARIS生產(chǎn)系統(tǒng)上的某個(gè)LUN上了,由于并未及時(shí)發(fā)現(xiàn),IBM服務(wù)器上已經(jīng)對(duì)此LUN進(jìn)行了部分初始化操作(操作不詳),之后SOLARIS上磁盤報(bào)錯(cuò),重啟后發(fā)現(xiàn)問題,卷無法掛載。
SUN工程師檢測(cè)后,執(zhí)行fsck,完成后文件系統(tǒng)可掛上,但很多數(shù)據(jù)丟失或大小變?yōu)?,尤其最新數(shù)據(jù)破壞嚴(yán)重。
【數(shù)據(jù)恢復(fù)故障分析】
SAN環(huán)境下此類故障較為常見,但多數(shù)是人為不小心導(dǎo)致,此故障也是如此。正常情況下,SAN分配出來的LUN是獨(dú)占模式的,如果同時(shí)為幾個(gè)操作系統(tǒng)所控制,極易導(dǎo)致寫操作不互斥,導(dǎo)致文件系統(tǒng)一致性出錯(cuò)。
如果要恢復(fù)此部分?jǐn)?shù)據(jù),需要深入文件系統(tǒng),考察其各結(jié)構(gòu)的破壞情況。本例中,因文件系統(tǒng)采用UFS,所以對(duì)任何一個(gè)需要恢復(fù)的文件而言,優(yōu)先考慮目錄信息、節(jié)點(diǎn)、數(shù)據(jù)區(qū)是否正常,如上述3個(gè)結(jié)構(gòu)均正常,數(shù)據(jù)可完整恢復(fù)。但多數(shù)情況下,fsck后INODE會(huì)清除,即使留下目錄信息,也無法與數(shù)據(jù)一一對(duì)應(yīng),這時(shí)候,就只能參考文件內(nèi)部格式進(jìn)行類型式的恢復(fù)了。
【數(shù)據(jù)恢復(fù)過程】
1、完整備份故障卷,因RAID無故障,所以直接在SOLARIS環(huán)境中對(duì)原LUN做dd備份。
2、在備份中分析文件系統(tǒng),確定需恢復(fù)文件的inode已經(jīng)全部清除,無法還原。只好按文件類型進(jìn)行處理。
3、對(duì)用戶需要恢復(fù)的特定文件進(jìn)行分析,發(fā)現(xiàn)采用vfs公文系統(tǒng)的索引文件具有強(qiáng)的類型特征,同時(shí)文件中包含目錄信息。
4、按照公文系統(tǒng)的索引結(jié)構(gòu)特征,寫程序提取,提取后根據(jù)特征重新命名。
5、按類型恢復(fù)數(shù)據(jù)文件,之后用戶人工根據(jù)索引文件,對(duì)數(shù)據(jù)文件進(jìn)行重新整理。
【數(shù)據(jù)恢復(fù)結(jié)論】
歷時(shí)24小時(shí),目錄索引文件99%恢復(fù)成功,數(shù)據(jù)文件大部分恢復(fù)成功,其余已破壞無法恢復(fù)的文件,用戶根據(jù)目錄索引文件重新向其他部門采集。
結(jié)論上,用戶認(rèn)可數(shù)據(jù)恢復(fù)成功。
五峰網(wǎng)站建設(shè)公司創(chuàng)新互聯(lián)公司,五峰網(wǎng)站設(shè)計(jì)制作,有大型網(wǎng)站制作公司豐富經(jīng)驗(yàn)。已為五峰成百上千提供企業(yè)網(wǎng)站建設(shè)服務(wù)。企業(yè)網(wǎng)站搭建\成都外貿(mào)網(wǎng)站建設(shè)要多少錢,請(qǐng)找那個(gè)售后服務(wù)好的五峰做網(wǎng)站的公司定做!