本篇文章給大家分享的是有關(guān)怎樣預(yù)測(cè)硬盤的失效,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
10年的綿陽網(wǎng)站建設(shè)經(jīng)驗(yàn),針對(duì)設(shè)計(jì)、前端、開發(fā)、售后、文案、推廣等六對(duì)一服務(wù),響應(yīng)快,48小時(shí)及時(shí)工作處理。成都全網(wǎng)營(yíng)銷推廣的優(yōu)勢(shì)是能夠根據(jù)用戶設(shè)備顯示端的尺寸不同,自動(dòng)調(diào)整綿陽建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調(diào)整網(wǎng)站的寬度,無論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設(shè)計(jì),從而大程度地提升瀏覽體驗(yàn)。創(chuàng)新互聯(lián)從事“綿陽網(wǎng)站設(shè)計(jì)”,“綿陽網(wǎng)站推廣”以來,每個(gè)客戶項(xiàng)目都認(rèn)真落實(shí)執(zhí)行。
我們都知道,目前大部分的主流廠商都宣傳自己可以實(shí)現(xiàn)HDD的故障預(yù)測(cè),這樣可以在HDD發(fā)生故障前,提前把數(shù)據(jù)預(yù)COPY出來,避免RAID重構(gòu)帶來的性能下降和數(shù)據(jù)丟失風(fēng)險(xiǎn)。
大家都知道,HDD的固件里面都有硬盤參數(shù)提供的一些數(shù)據(jù),叫Self-Monitoring, Analysis, and Reporting Technology (SMART)。所有的陣列廠商都說,根據(jù)S.M.A.R.T參數(shù)來預(yù)測(cè)硬盤的失效,但沒有一個(gè)廠商肯告訴你采用哪些參數(shù),啥算法做出的預(yù)測(cè)。其實(shí),這個(gè)預(yù)測(cè)算法才是真正的核心機(jī)密,對(duì)預(yù)測(cè)的準(zhǔn)確性非常關(guān)鍵。硬盤沒有壞你預(yù)測(cè)壞了,對(duì)客戶和自己都是損失,因?yàn)樾枰崆案鼡Q硬盤。硬盤快壞了你預(yù)測(cè)不出來,給客戶帶來風(fēng)險(xiǎn)。這些預(yù)測(cè),需要大量的使用去驗(yàn)證,而且不斷完善預(yù)測(cè)算法。我們看到很多新進(jìn)入存儲(chǔ)的廠商也宣傳具備預(yù)測(cè)硬盤失效的功能,但沒有一定的積累是很難發(fā)揮價(jià)值的。
今天帶大家了解一下美國(guó)的云存儲(chǔ)服務(wù)商BACKBLAZE的研究成果。BACKBLAZE現(xiàn)在有4萬塊硬盤,100PB的數(shù)據(jù),因此,他們的統(tǒng)計(jì)還是有一點(diǎn)說服力的。
BACKBLAZE不知道大家是否還有印象,西瓜哥以前分享過他們對(duì)各個(gè)硬盤廠商的壞盤率的統(tǒng)計(jì)數(shù)據(jù)。簡(jiǎn)單看,好像希捷的硬盤故障率最高,后來很多大V寫了各種分析,希捷應(yīng)該也做了緊急公關(guān),因此,應(yīng)該對(duì)希捷沒有造成太大的影響,否則希捷Q3的增長(zhǎng)不會(huì)這么快。
下面這個(gè)統(tǒng)計(jì)其實(shí)對(duì)大家還是有一些價(jià)值,第一年的硬盤故障率是5.1%,第二年是1.4%,第三年急升到11.8%。看來,云存儲(chǔ)的服務(wù)商的硬盤3年后故障率老高了。當(dāng)然,由于業(yè)務(wù)模型不同,企業(yè)應(yīng)用應(yīng)該沒有惡化這么厲害。
SMART一共有200多個(gè)參數(shù),由于沒有一個(gè)標(biāo)準(zhǔn),很多參數(shù)都是廠商定義的,因此,存儲(chǔ)廠商必須和硬盤生產(chǎn)廠商深度合作,挖掘里面對(duì)自己有用的信息。
BACKBLAZE經(jīng)過研究發(fā)現(xiàn),200多個(gè)參數(shù)里面,只有下面5個(gè)參數(shù)和硬盤失效強(qiáng)相關(guān)。BACKBLAZE也只用這5個(gè)參數(shù)來預(yù)測(cè)硬盤是否失效。
比如這SMART 187,表示不可恢復(fù)的讀錯(cuò)誤個(gè)數(shù)(ECC也不行恢復(fù))。這個(gè)值大于0,硬盤就快失效了。這個(gè)值越大,平均年故障率最高。
而SMART 12這個(gè)參數(shù),代表硬盤電源開關(guān)的次數(shù)。BACKBLAZE發(fā)現(xiàn),硬盤的電源開關(guān)次數(shù)和硬盤故障率沒有線性關(guān)系,因此沒有用這個(gè)參數(shù)來預(yù)測(cè)硬盤故障。
這個(gè)其實(shí)也給很多做冷存儲(chǔ)的廠商吃了一顆定心丸,因?yàn)檫@些存儲(chǔ)有休眠的功能,當(dāng)某些機(jī)柜的硬盤不用的時(shí)候,可以讓硬盤休眠,甚至可以關(guān)掉電源。原來還擔(dān)心頻繁開關(guān)電源對(duì)硬盤壽命產(chǎn)生影響,現(xiàn)在看好像關(guān)系不大。
今天分享這些知識(shí),就是告訴大家,其實(shí)HDD的水很深。所有新進(jìn)入存儲(chǔ)的廠商,都會(huì)在HDD的使用上交過很多學(xué)費(fèi)。因此,也給大家?guī)讉€(gè)建議:
從可靠性考慮,存儲(chǔ)大廠都要求必須購(gòu)買自己的硬盤。因?yàn)椴煌脖P廠商不同固件對(duì)SMART值的定義都不同。很多用戶都不理解,為啥都是希捷硬盤,不能我自己去購(gòu)買?了解這些知識(shí),相信你就理解了這個(gè)行業(yè)的“潛規(guī)則”;
如果有可能,盡量選擇出貨量大的廠商。只有出貨量大,才能和硬盤廠商進(jìn)行深度的合作,拿到SMART數(shù)據(jù)的更多細(xì)節(jié)。并且出貨量大,說明這些存儲(chǔ)廠商的硬盤壽命預(yù)測(cè)功能已經(jīng)得到市場(chǎng)的驗(yàn)證,其預(yù)測(cè)算法應(yīng)該是比較有效的。
當(dāng)然,如果用SDD,就沒有這么麻煩的問題了,這也是SDD的優(yōu)勢(shì),壽命預(yù)測(cè)更加準(zhǔn)確。
以上就是怎樣預(yù)測(cè)硬盤的失效,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見到或用到的。希望你能通過這篇文章學(xué)到更多知識(shí)。更多詳情敬請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。