客戶的一臺(tái)服務(wù)器因?yàn)槲粗脑驅(qū)е乱粔K硬盤紅燈閃亮,不過(guò)服務(wù)器還在正常運(yùn)行,管理員未做處理,隨后該服務(wù)器內(nèi)的另一塊硬盤出現(xiàn)同樣的報(bào)警提示,服務(wù)器崩潰。數(shù)據(jù)恢復(fù)工程師對(duì)該磁盤陣列數(shù)據(jù)恢復(fù)過(guò)程如下(下列操作有風(fēng)險(xiǎn),請(qǐng)備份后再操作):
1.將服務(wù)器啟動(dòng),服務(wù)器自檢時(shí)手動(dòng)進(jìn)入管理程序查看raid磁盤陣列情況,發(fā)現(xiàn)硬盤的狀態(tài)為Failel,手動(dòng)將其中一塊離線硬盤重新設(shè)置為online狀態(tài)后嘗試重啟服務(wù)器但重啟失敗。
2.將該硬盤重新Fail掉,重復(fù)上次的操作步驟將另一塊硬盤上線,啟動(dòng)服務(wù)器,服務(wù)器啟動(dòng)成功。
3.檢查系統(tǒng)和服務(wù)器內(nèi)的數(shù)據(jù)庫(kù)數(shù)據(jù)運(yùn)行是否正常,然后用陣列配置工具把Failed后的盤手動(dòng)rebuild,待rebuild完成后服務(wù)器及raid磁盤陣列系統(tǒng)就恢復(fù)原狀了。
本案例中需要進(jìn)行數(shù)據(jù)恢復(fù)的服務(wù)器為某品牌的 2850型號(hào)。服務(wù)器內(nèi)有一組6塊硬盤的raid5磁盤陣列,陣列內(nèi)的硬盤為SCSI硬盤,單盤容量為300G,服務(wù)器操作系統(tǒng)為linux Redhat4;文件系統(tǒng)為ext3文件系統(tǒng)。服務(wù)器在正常使用過(guò)程中由于未知原因有兩塊硬盤離線,管理員使用了案例一中提到的方法對(duì)其中一塊硬盤進(jìn)行強(qiáng)制上線操作。但經(jīng)過(guò)嘗試發(fā)現(xiàn)服務(wù)器的操作系統(tǒng)啟動(dòng)異常,無(wú)法通過(guò)強(qiáng)制上線方式恢復(fù)數(shù)據(jù),于是聯(lián)系到北亞數(shù)據(jù)恢復(fù)中心進(jìn)行專業(yè)服務(wù)器數(shù)據(jù)恢復(fù)操作。
數(shù)據(jù)恢復(fù)工程師對(duì)客戶服務(wù)器進(jìn)行扇區(qū)級(jí)別的完整備份,在備份過(guò)程中發(fā)現(xiàn)該服務(wù)器內(nèi)的一塊并未離線的硬盤居然存在大量壞道,可能由于服務(wù)器尚未讀到硬盤的壞道部分,因此尚未離線。
備份工作完成后對(duì)raid陣列結(jié)構(gòu)分析并重組raid環(huán)境驗(yàn)證raid結(jié)構(gòu),通過(guò)人工的方式對(duì)被破壞的結(jié)構(gòu)進(jìn)行修正并存檔。最后將修正和存檔的數(shù)據(jù)嵌入一臺(tái)正常的服務(wù)器陣列上即可進(jìn)行數(shù)據(jù)驗(yàn)證。
在服務(wù)器數(shù)據(jù)恢復(fù)工作中我們遇到了大量的raid5磁盤陣列兩塊硬盤同時(shí)離線的故障。其實(shí)raid5陣列是支持一塊硬盤離線時(shí)的冗余保護(hù)的,一組raid5陣列在一塊硬盤離線時(shí)是不會(huì)導(dǎo)致服務(wù)器癱瘓的,但如果是兩塊甚至多塊硬盤處于離線狀態(tài)時(shí)服務(wù)器便處于癱瘓狀態(tài)并且無(wú)法自動(dòng)上線。由于raid控制器具有一定的敏感性,多數(shù)硬盤掉線僅僅是因?yàn)殡娫床▌?dòng)、控制器bug等隨機(jī)原因?qū)е?,所以掉線盤可能沒(méi)有嚴(yán)重的物理故障。本案例就是如此。但是此時(shí)管理員進(jìn)行強(qiáng)制上線操作風(fēng)險(xiǎn)性是很大的,一旦上線錯(cuò)誤就會(huì)導(dǎo)致控制器對(duì)數(shù)據(jù)產(chǎn)生一些不可逆的損壞,當(dāng)管理員進(jìn)入操作系統(tǒng)后因?yàn)槲募到y(tǒng)不一致進(jìn)行修復(fù),服務(wù)器中所有硬盤數(shù)據(jù)不一致,數(shù)據(jù)恢復(fù)難度非常大。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。