****欧欧美毛片4,国产午夜精品视频,97视频在线观看免费视频,久久七国产精品

數(shù)據(jù)恢復(fù)咨詢熱線:400-666-3702??

歡迎訪問(wèn)南京兆柏?cái)?shù)據(jù)恢復(fù)公司,專業(yè)數(shù)據(jù)恢復(fù)15年

兆柏?cái)?shù)據(jù)恢復(fù)公司

?RAID數(shù)據(jù)恢復(fù)案例

揚(yáng)州服務(wù)器恢復(fù)成功

瀏覽量: 次 發(fā)布日期:2019-01-07 23:58:05

揚(yáng)州某企業(yè),ibm 3650m4 服務(wù)器,故障燈報(bào)錯(cuò),服務(wù)器無(wú)法啟動(dòng)檢測(cè)后發(fā)現(xiàn)硬盤報(bào)錯(cuò),5塊300g sas盤有兩塊報(bào)錯(cuò)。
檢測(cè)結(jié)果:服務(wù)器使用win2008 系統(tǒng),用于公司數(shù)據(jù)庫(kù)和文件服務(wù)器,0號(hào)和3號(hào)硬盤報(bào)錯(cuò),5塊盤組raid5,無(wú)熱備。
恢復(fù)結(jié)果:兆柏工程師檢測(cè)后發(fā)現(xiàn),3號(hào)硬盤最后損壞,直接檢測(cè)3號(hào)盤,發(fā)現(xiàn)有大量壞道,使用pc3000 sas修復(fù)后數(shù)據(jù)恢復(fù)正常。然后更換硬盤后將數(shù)據(jù)回寫后,系統(tǒng)啟動(dòng)正常,客戶非常滿意。

1、磁盤陣列處于降級(jí)狀態(tài)時(shí)未及時(shí)rebuild磁盤陣列:
RAID磁盤陣列的數(shù)據(jù)安全冗余原理是利用空余出的部分空間實(shí)現(xiàn)的,當(dāng)陣列中有成員盤下線后便無(wú)法繼續(xù)提供冗余存儲(chǔ)。如果此時(shí)未能及時(shí)更換新磁盤并rebuild整個(gè)卷的話一旦raid陣列中其他成員盤發(fā)生離線行為將導(dǎo)致整個(gè)raid卷無(wú)法工作,這也是在數(shù)據(jù)恢復(fù)工作中遇到較多的故障類型。
2、raid陣列控制器故障:
控制器在磁盤陣列中充當(dāng)著操作系統(tǒng)與物理硬盤之間的鏈接紐帶,并且每組不同的磁盤陣列中的硬盤數(shù)量、容量大小、raid級(jí)別、校驗(yàn)方式等raid信息都各有不同,這些信息有的存儲(chǔ)于硬盤,有的存儲(chǔ)于陣列卡或者二者都有存儲(chǔ)。如果控制器出現(xiàn)故障一般情況下無(wú)法進(jìn)行raid信息的還原,即使能夠還原raid結(jié)構(gòu)再次重建raid陣列也無(wú)法進(jìn)行數(shù)據(jù)恢復(fù)。
3、固件算法缺陷:
RAID的創(chuàng)建、重建、降級(jí)、保護(hù)等工作在控制器的實(shí)現(xiàn)上是非常復(fù)雜的算法,當(dāng)然這里面的復(fù)雜更多地是提供盡可能萬(wàn)無(wú)一失的無(wú)漏洞算法,盡管廠商不會(huì)輕易承認(rèn)控制器的BUG,但毫無(wú)疑問(wèn),這些問(wèn)題在任何一款控制器上都無(wú)法避免。因?yàn)楣碳惴ㄉ螧UG,可能會(huì)產(chǎn)生很多無(wú)法解釋的故障。比如在部分服務(wù)器數(shù)據(jù)恢復(fù)案例中,有一些早期生產(chǎn)的DELL 2950服務(wù)器,會(huì)有RAID一塊盤OFFLINE后故障盤與報(bào)警燈不一致的情況,導(dǎo)致客戶在更換故障盤REBUILD時(shí)拔錯(cuò)盤,整個(gè)RAID組崩潰。
4、IO通道受阻導(dǎo)致RAID掉盤:
RAID控制器在設(shè)計(jì)時(shí)為了數(shù)據(jù)的絕對(duì)安全,會(huì)盡可能避免寫數(shù)據(jù)到不穩(wěn)定的存儲(chǔ)介質(zhì)上,這樣,當(dāng)控制器與物理硬盤進(jìn)行IO時(shí),如果時(shí)間超過(guò)某個(gè)閥值,或不滿足校驗(yàn)關(guān)系,便會(huì)認(rèn)為對(duì)應(yīng)的存儲(chǔ)設(shè)備已不具備持續(xù)工作的能力,但會(huì)讓其強(qiáng)制下線,通知管理員盡快解決問(wèn)題。這種設(shè)計(jì)的初衷很好,同時(shí)也是正確的設(shè)計(jì)方式,但對(duì)于如物理鏈接線路松動(dòng),或因硬盤機(jī)械工作時(shí)反應(yīng)超時(shí)(可能硬盤還是完好的)等隨機(jī)原因?qū)刂破鞫詿o(wú)法分辨設(shè)備是否具備和之前一樣的穩(wěn)定狀態(tài),所以很不在意的某些小環(huán)節(jié),便會(huì)導(dǎo)致RAID卷出現(xiàn)故障,此類故障的發(fā)生概率極大,而且無(wú)法避免。這也是大多數(shù)RAID出現(xiàn)故障后,硬盤并未有故障的原因,我們好多數(shù)據(jù)恢復(fù)服務(wù)的客戶會(huì)因此質(zhì)疑服務(wù)器廠商,實(shí)際上是有苦難言的,一定程度上,越是設(shè)計(jì)安全的控制器,越會(huì)發(fā)生此類現(xiàn)象。
5、控制器的穩(wěn)定性:
RAID的控制器在ONLINE狀態(tài)下(無(wú)離線盤)工作是最穩(wěn)定的,相對(duì)而言,當(dāng)部分硬盤損壞(可能是邏輯故障)后離線,控制器便會(huì)工作在一個(gè)比較吃力的狀態(tài),這也是好多中低端的RAID控制器在一塊盤離線后讀寫性能急速下降的原因。控制器的負(fù)載太重便會(huì)極大地增加數(shù)據(jù)吞吐時(shí)出現(xiàn)IO滯留的可能性,從而導(dǎo)致如上面第4點(diǎn)提及的RAID離線。一個(gè)不具備高速硬件處理芯片,不具備高速緩沖的控制器發(fā)生這類故障的概率要高得多。為了避免出現(xiàn)故障后數(shù)據(jù)恢復(fù)帶來(lái)的業(yè)務(wù)停頓與額外開銷,還是盡量不要選擇這類磁盤陣列控制器。
6、陣列中硬盤故障:
多數(shù)管理員認(rèn)為只要正常工作的磁盤陣列中就不會(huì)存在損壞的硬盤,因?yàn)閞aid陣列中一旦有硬盤損壞后陣列會(huì)踢損壞硬盤下線,然而實(shí)際上并非如此。一組RAID卷在工作很長(zhǎng)時(shí)間以后也很少會(huì)讀到物理硬盤的所有磁盤空間,同一時(shí)間更是不可能。部分情況下,硬盤會(huì)在沒有讀到的區(qū)域或者以前讀取是良好的區(qū)域產(chǎn)生壞道,這類壞道因?yàn)闆]有讀寫過(guò),所以在控制器看來(lái)是好的。產(chǎn)生這種壞磁道的最直接危害是在REBUILD過(guò)程中。當(dāng)一塊物理硬盤離線后,通常所有的技術(shù)人員及官方資料都會(huì)寫盡快做REBUILD,但如果其他硬盤存在這類平常不知的壞磁道,REBUILD又都是對(duì)全盤做全面同步,就一定會(huì)讀寫到那些壞道,這時(shí)候REBUILD沒完成,新盤無(wú)法上線,因舊盤里又發(fā)現(xiàn)了壞道,便會(huì)導(dǎo)致RAID又多出一些下線的硬盤,這樣就可能會(huì)導(dǎo)致RAID出現(xiàn)故障,無(wú)法自行進(jìn)行數(shù)據(jù)恢復(fù)了。
7、人為誤操作:
涉及數(shù)據(jù)恢復(fù)的數(shù)據(jù)災(zāi)難有相當(dāng)一部分也是可以避免的,例如操作失誤導(dǎo)致誤拔了RAID里的硬盤、更換壞盤不及時(shí)、給RAID陣列除塵時(shí)忘了原來(lái)的順序、不小心刪除了原RAID配置等
相關(guān)推薦