這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)碛嘘P(guān)使用云服務(wù)器可能宕機(jī)嗎,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
堅(jiān)守“ 做人真誠 · 做事靠譜 · 口碑至上 · 高效敬業(yè) ”的價(jià)值觀,專業(yè)網(wǎng)站建設(shè)服務(wù)10余年為成都自上料攪拌車小微創(chuàng)業(yè)公司專業(yè)提供成都企業(yè)網(wǎng)站定制營銷網(wǎng)站建設(shè)商城網(wǎng)站建設(shè)手機(jī)網(wǎng)站建設(shè)小程序網(wǎng)站建設(shè)網(wǎng)站改版,從內(nèi)容策劃、視覺設(shè)計(jì)、底層架構(gòu)、網(wǎng)頁布局、功能開發(fā)迭代于一體的高端網(wǎng)站建設(shè)服務(wù)。
很有可能會(huì),宕機(jī)是指操作系統(tǒng)無法從一個(gè)嚴(yán)重系統(tǒng)錯(cuò)誤中恢復(fù)過來,或系統(tǒng)硬件層面出問題,以致系統(tǒng)長時(shí)間無響應(yīng),而不得不重新啟動(dòng)計(jì)算機(jī)的現(xiàn)象。它屬于云服務(wù)器運(yùn)作中一種比較常見的現(xiàn)象,任何服務(wù)器都有可能會(huì)出現(xiàn)這種情況。
用戶可以通過以下操作來準(zhǔn)確發(fā)現(xiàn)云服務(wù)器宕機(jī)的情況,減少誤報(bào)。
1、異常排除
排除非物理機(jī)器,將系統(tǒng)中暫時(shí)不關(guān)注的VM等產(chǎn)生的異常信息排除掉。排除非業(yè)務(wù)狀態(tài)的機(jī)器,如裝機(jī)狀態(tài)中的,包括生產(chǎn)中、遷移中、重裝中、銷毀中,重啟中,無管控狀態(tài),只監(jiān)控正常狀態(tài)的機(jī)器。排除非正在工作的機(jī)器,如非working狀態(tài)機(jī)器。
2、網(wǎng)絡(luò)干擾排除
宕機(jī)分析中,較多誤報(bào)是由于網(wǎng)絡(luò)問題干擾,無法準(zhǔn)確判斷出物理機(jī)是否宕機(jī),有可能是網(wǎng)絡(luò)問題。排除上網(wǎng)絡(luò)設(shè)備異常導(dǎo)致的誤報(bào),包括機(jī)房斷網(wǎng)演練,小面積網(wǎng)絡(luò)故障,上聯(lián)網(wǎng)絡(luò)故障,如通過探測丟包情況,使用一些邏輯初步判斷網(wǎng)絡(luò)問題。
服務(wù)器本身未丟包的誤報(bào),除了需要過濾出網(wǎng)絡(luò)問題,還要通過丟包數(shù)據(jù)分析,過濾掉SA誤報(bào)問題,SA異常會(huì)上報(bào)心跳異常,被誤理解為宕機(jī)。icmp及tcp丟包分析,icmp采集頻率為固定數(shù)秒,tcp采集頻率固定數(shù)秒,包括多個(gè)不同大小包(16,32,64,128,256等)的丟包情況,根據(jù)分析時(shí)間窗內(nèi)兩項(xiàng)數(shù)據(jù)的丟包情況。
3、特殊情況干擾排除
個(gè)別云主機(jī)機(jī)房有時(shí)候會(huì)出現(xiàn)大面積風(fēng)暴式的無故心跳異常,同時(shí)網(wǎng)絡(luò)ping包異常,但上聯(lián)網(wǎng)絡(luò)設(shè)備ping包正常,這種誤報(bào),一般根據(jù)具體case具體進(jìn)行針對(duì)性的分析。如根據(jù)監(jiān)控每個(gè)機(jī)房的上報(bào)頻率,排除干擾。
4、進(jìn)一步識(shí)別誤報(bào)
大部分干擾已經(jīng)過濾掉,但仍有一部分誤報(bào)隱藏其中。比如心跳異常,ping異常,都合乎宕機(jī)判斷的邏輯,會(huì)導(dǎo)致誤判成宕機(jī)。如網(wǎng)卡被打爆,或者重試率高,這是業(yè)務(wù)原因?qū)е戮W(wǎng)絡(luò)異常,但業(yè)務(wù)認(rèn)為不是異常,需要排除掉。服務(wù)器并沒有掛掉,但是IO延時(shí)和資源占用率各項(xiàng)指標(biāo)都不正常等場景。要增加uptime判斷以及帶外日志分析排查。
5、長尾再次處理
未確認(rèn)的待處理的,會(huì)加入到長尾列表中,像這種分鐘級(jí)的心跳異常,ping異常,但串口日志一直正常輸出的情況,一般就是某種死機(jī),死到連網(wǎng)絡(luò)都不通的場景。會(huì)觀察一段時(shí)間,一個(gè)固定時(shí)間窗內(nèi)仍未恢復(fù)或重啟的話,就暫時(shí)報(bào)宕機(jī)。后期會(huì)把這種死機(jī)單獨(dú)找劃分歸類。
上述就是小編為大家分享的使用云服務(wù)器可能宕機(jī)嗎了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。