惠普服務(wù)器兩塊盤損壞恢復(fù),hp雙循環(huán)raid
瀏覽量: 次 發(fā)布日期:2018-11-14 17:11:01
1.惠普磁盤陣列故障:服務(wù)器型號(hào)為惠普 P2000服務(wù)器組raid5磁盤陣列,10塊磁盤/單盤容量1TB/熱備盤盤號(hào)為6,故障表現(xiàn)為磁盤陣列中2塊磁盤離線,提示黃色警報(bào)燈,初檢結(jié)果為陣列磁盤序列號(hào)不能讀取/無(wú)法通過(guò)擴(kuò)展卡識(shí)別,初步推斷磁盤物理故障。

我公司服務(wù)器數(shù)據(jù)恢復(fù)工程師對(duì)故障設(shè)備進(jìn)行初檢發(fā)現(xiàn)該磁盤陣列故障情況復(fù)雜,需對(duì)正常硬盤和掉線硬盤使用不同的方法進(jìn)行處理,針對(duì)raid陣列中的正常磁盤借助數(shù)據(jù)恢復(fù)軟件進(jìn)行鏡像備份即可,存在物理故障的離線硬盤則需要修復(fù)硬件故障再進(jìn)行備份,常用的磁盤故障修復(fù)方法為加電檢測(cè),判斷故障硬盤有無(wú)起轉(zhuǎn)、磁頭能否尋道,然后通過(guò)清潔HDA氧化組件、更換ROM芯片、更換磁頭等常用的硬盤數(shù)據(jù)恢復(fù)方法。但在實(shí)際的數(shù)據(jù)恢復(fù)過(guò)程中有一塊磁盤硬件損壞情況嚴(yán)重?zé)o法進(jìn)行修復(fù),只能通過(guò)另一塊磁盤進(jìn)行備份和恢復(fù)數(shù)據(jù)。
3.通過(guò)重組RAID5陣列進(jìn)行數(shù)據(jù)恢復(fù)
3.1.判斷起始扇區(qū)
將不包括熱備盤的所有9塊磁盤通過(guò)數(shù)據(jù)恢復(fù)工具打開(kāi)并將鏡像文件解析為磁盤發(fā)現(xiàn)該raid5陣列中所有磁盤的0扇區(qū)都表現(xiàn)為“55AA”,0x01C2H處顯示“05”代表一個(gè)擴(kuò)展分區(qū),該MBR分區(qū)不正確。繼續(xù)查找該陣列在另外1塊磁盤中發(fā)現(xiàn)了其中1塊磁盤的MBR分區(qū)正常的(0x01C6處數(shù)值代表指向的下一個(gè)扇區(qū)為GPT的頭部),基本可以斷定該盤是第一款硬盤,GPT分區(qū)所在扇區(qū)起始于172032扇區(qū),因此初步確定LUN的起始扇區(qū)是172032扇區(qū)。

3.2.判斷raid陣列stripe(條帶)大小
stripe(條帶)是raid磁盤陣列中用于數(shù)據(jù)處理的基本單元,條帶的大小受raid磁盤陣列影響各有不同,分析條帶大小的依據(jù)是在raid5磁盤陣列中每一條帶組含一個(gè)大小與之相等的校驗(yàn)區(qū)。因此查詢分析出該raid陣列中的條帶大小為1024扇區(qū)。
3.3確定磁盤陣列磁盤盤序
由于已經(jīng)分析到陣列的條帶大小為1024,按照此規(guī)律進(jìn)行分割,使每一條帶與記錄大小相同且陣列中所有磁盤全部跳到283123。然后通過(guò)對(duì)比分析raid5陣列走向,將已經(jīng)分析出來(lái)的第一塊硬盤放在第一位即可,實(shí)際分析的陣列盤序?yàn)?-3-10-4-2-1-5-8-7

3.重組RAID陣列
借助數(shù)據(jù)恢復(fù)工具將raid陣列進(jìn)行重組,屬性為raid5/Stripe size 512KB/左異步。陣列重組結(jié)束后即可進(jìn)行數(shù)據(jù)驗(yàn)證。
惠普raid算法一般比較特殊,相對(duì)比較復(fù)雜,一般采用雙循環(huán)raid5算法:
HP雙循環(huán)故障是指HP雙循環(huán)邏輯盤丟失或不可訪問(wèn)。導(dǎo)致HP雙循環(huán)故障的原因主要有以下幾個(gè)方面
1) RAID控制器出現(xiàn)物理故障
RAID控制器如果出現(xiàn)物理故障將不能被計(jì)算機(jī)識(shí)別,也就無(wú)法完成對(duì)HP雙循環(huán)中的各個(gè)物理成員盤的控制,在這種情況下,通過(guò)RAID控制器虛擬出來(lái)的邏輯盤就不存在了。
2) RAID信息出錯(cuò)
RAID控制器將物理盤配置為雙循環(huán)后,會(huì)產(chǎn)生一些參數(shù),包括該HP雙循環(huán)的盤序、條帶大小、RAID在每塊物理盤中的起始地址等,還會(huì)記錄有關(guān)該HP雙循環(huán)的相關(guān)信息,包括組成HP雙循環(huán)的物理盤數(shù)目、物理盤容量大小等信息。所以這些信息和參數(shù)就被稱為RAID信息,它們會(huì)被保存到RAID控制器中或者是HP雙循環(huán)的成員盤中。
RAID信息出錯(cuò)就是指該HP雙循環(huán)的配置信息和參數(shù)出現(xiàn)錯(cuò)誤,導(dǎo)致RAID程序不能正確地組織管理HP雙循環(huán)中的成員盤,從而導(dǎo)致HP雙循環(huán)邏輯盤丟失或者不可訪問(wèn)。
3) HP雙循環(huán)成員盤出現(xiàn)物理故障
HP雙循環(huán)可以允許其中一塊盤離線而不影響數(shù)據(jù)的完整性,如果HP雙循環(huán)中的某一塊成員盤出現(xiàn)物理故障,如電路損壞、磁頭損壞、固件損壞等導(dǎo)致該成員盤不能正常使用,但剩下的成員盤可以利用異或運(yùn)算計(jì)算出離線盤中的數(shù)據(jù),所以HP雙循環(huán)還不會(huì)崩潰。如果系統(tǒng)管理員沒(méi)有及時(shí)替換出現(xiàn)故障的成員盤,當(dāng)再有一塊成員盤再出現(xiàn)故障后,HP雙循環(huán)將徹底崩潰。