本案例中發(fā)生故障的存儲類型是HP P2000,虛擬化平臺為vmware exsi,共有10塊硬盤組成raid5(硬盤容量為1t,其中6號盤是熱備盤),由于某些故障導致陣列中兩塊硬盤亮黃燈掉線,硬盤無法讀取序列號,在SAS擴展卡上硬盤也無法讀取,
故障發(fā)生后用戶意識到故障比較嚴重,必須把RAID-5磁盤陣列帶到我公司進行檢測,以判斷陣列中每一塊硬盤故障情況為邏輯故障還是物理故障,同時把其他正常硬盤鏈接到鏡像服務器上使用鏡像工具進行扇區(qū)級鏡像。
首先將壞盤連接到外部的SAS擴展卡上,加電后通過硬盤工作聲音判斷硬盤電機能夠起轉,但是磁頭沒有進行尋道操作,于是嘗試把硬盤PCB分離下來對HDA組件氧化部分進行清潔操作,將PCB還原后故障依舊。于是和客戶溝通使用6號熱備盤的好PCB替換到故障盤上進行嘗試性修復,再將故障盤PCB上的ROM芯片替換到6號盤的好PCB上面后硬盤工作時起轉和磁頭尋道聲音都正常,但是在尋道結束后,有明顯的敲盤聲音,于是判斷有可能磁頭損壞。在和用戶溝通后嘗試使用6號熱備盤中的好磁頭對故障盤進行替換操作以讀取數(shù)據(jù)。在無塵室對故障盤進行開盤更換磁頭操作后frombyte.com,將故障盤連接到專業(yè)硬盤維修工作上進行檢測,發(fā)現(xiàn)故障盤已經(jīng)不能識別,數(shù)據(jù)無法讀取。
因為用戶有兩塊故障盤,之前嘗試修復的都是其中一塊,再次和客戶溝通嘗試對另一塊故障盤進行修復操作。和先前的故障盤一樣,這塊盤的故障依舊是磁頭損壞,因為用戶的HP OEM盤價格昂貴,于是嘗試在網(wǎng)上購買ST原廠的相同型號硬盤進行磁頭更換。這塊硬盤的磁頭更換完成后,設備能夠正常識別硬盤,于是將故障盤所有扇區(qū)完整鏡像到一塊相同容量的備份盤中。
3.重組RAID-5步驟
【判斷起始扇區(qū)】所有硬盤都鏡像好后就可以重組了,用WinHex打開9塊盤(熱備盤不需要加進去重組),先把鏡像文件解析成磁盤??梢钥吹竭@9塊盤的0扇區(qū)都有“55 AA”標志,如圖1所示。
圖1
查找結果如圖2所示,0x01C2H處表示該分區(qū)的類型,這里顯示“05”,代表這是一個擴展分區(qū)。因此從0扇區(qū)看這是一個不正常的MBR分區(qū)結構。
圖2
按圖1方式繼續(xù)往下找,分別在9號盤和8號盤找到了“55 AA”的標志。9號盤查詢結果如圖3所示。這是一個正常的MBR分區(qū),其0x01C6處數(shù)值代表指向的下一個扇區(qū)為GPT的頭部。
圖3
8號盤查詢結果如圖4所示。其0x01C6處數(shù)值代表指向下一個扇區(qū)。但是下一個扇區(qū)很明顯不是GPT的頭部。
圖4
由此可以確定9號盤是第一塊盤,8號盤可能是最后一塊盤。GPT分區(qū)所在扇區(qū)起始于172032扇區(qū),因此初步確定LUN的起始扇區(qū)是172032扇區(qū)。
【判斷條帶(stripe)大小】條帶也稱塊,它是RAID處理數(shù)據(jù)的基本單元。不同的RAID其條帶大小有所不同。RAID-5的1個條帶組中有1個校驗區(qū),1個校驗區(qū)的大小等于1個條帶的大小,根據(jù)這一點,針對這個RAID-5案例做分析。如果對VMFS的文件系統(tǒng)不熟悉,可以通過比較法確定條帶大小。如某一條帶組中的校驗區(qū)跟這一條帶組中的非校驗區(qū)可能相差的很明顯,通過WinHex查看并做對比,就可以找到條帶大小。本案例判斷出一個條帶是1024個扇區(qū)。
【判斷RAID-5成員盤盤序】按照1024扇區(qū)分割,使一個記錄為一個條帶的大小,如圖5所示。并且9塊盤跳到同一記錄283123。
圖5
當9塊盤都定位到同一位置時,通過對比可以判斷校驗區(qū)的走向,繼而判斷整個RAID-5的走向。之前已經(jīng)判斷出9號盤是第一塊盤了,把9號盤放在第一個位置,接著就可以判斷走向了,結果如圖6所示(drive9是第4塊盤)。確定RAID-5為左走向,盤序為9,2,3,4,10,1,7,8,5。
圖6
前面內容初步確定了LUN的起始扇區(qū)是172032扇區(qū)。用WinHex跳到172032扇區(qū),觀察各硬盤實際情況。如果172032扇區(qū)是LUN的起始扇區(qū),那么這個扇區(qū)所屬條帶中的5號盤應該是校驗區(qū),但是此條帶中卻顯示8號盤是檢驗區(qū),根據(jù)本案例RAID-5的左走向,5號盤的校驗區(qū)應該在172032-1024=171008扇區(qū),即上一個條帶。跳轉到171008扇區(qū),發(fā)現(xiàn)校驗區(qū)為5號盤。因此可以確定LUN的起始扇區(qū)為171008扇區(qū)。
【重組RAID-5】使用專業(yè)恢復工具按照確定的盤序組好,添加進去,如圖7所示。選擇RAID-5,Stripe size 512KB,左異步。
圖7
點擊Build進行重組。組好后,由于數(shù)據(jù)從1024*8=8192個扇區(qū)開始,若專業(yè)恢復工具沒有跳轉到此扇區(qū)的功能,那么剛組好的RAID必須和一個文件再進行一次Build重組操作。RAID的起始扇區(qū)(Start sectors_frombyte.com)選擇8192,這個文件可以任意選擇起始扇區(qū)和大小大小(Count sectors),如圖8和圖9所示,圖10是組好的RAID-5。
圖8
圖9
圖10
4.移交數(shù)據(jù)
整個RAID-5就重建好后,由我公司商務聯(lián)系用戶方驗收數(shù)據(jù),用戶方確定數(shù)據(jù)沒問題,簽訂完驗收合同后,完整的RAID-5數(shù)據(jù)即可移交。移交時根據(jù)用戶方要求把數(shù)據(jù)移交到用戶方帶來的新盤上?;謴屯甑臄?shù)據(jù)保留在我公司服務器上3天,之后數(shù)據(jù)自動被系統(tǒng)銷毀。
另外有需要云服務器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。