這篇文章將為大家詳細(xì)講解有關(guān)DISK OPERATION ERROR交換機(jī)級聯(lián)單模光纖鏈路故障該怎么解決,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對相關(guān)知識有一定的了解。
目前創(chuàng)新互聯(lián)公司已為上千多家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)站空間、綿陽服務(wù)器托管、企業(yè)網(wǎng)站設(shè)計(jì)、武強(qiáng)網(wǎng)站維護(hù)等服務(wù),公司將堅(jiān)持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
問題描述
兩臺IBM DS6800分別放置在主中心機(jī)房和容災(zāi)機(jī)房,通過B5000和McData4400兩個(gè)光纖交換機(jī)的級聯(lián),實(shí)現(xiàn)LVM的容災(zāi).兩個(gè)交換機(jī)之間通過單模光纖連接,兩個(gè)機(jī)房的物理距離大致為3.5公里.
因?yàn)閯e的單位的施工導(dǎo)致了單模光纖的中斷 ,通信公司修復(fù)故障后,單模光纖恢復(fù)連接,可能是光纖的連接節(jié)點(diǎn)增加或者接線質(zhì)量的問題,光纖鏈路的損耗達(dá)到8.23DB.1公里的損耗大概是1DB.而容災(zāi)中心的單模模塊是4KM,所以連接雖然是通的,但中間不斷有連接故障,最終導(dǎo)致操作系統(tǒng)層報(bào)磁盤錯(cuò)誤.
[@more@]
#errpt
DCB479971118230710 T H hdisk86DISK OPERATION ERROR
DCB479971118211010 T H hdisk86DISK OPERATION ERROR
DC73C03A1118143810 T S fscsi0SOFTWARE PROGRAM ERROR
DC73C03A1118143810 T S fscsi0SOFTWARE PROGRAM ERROR
D666A8C71118143810 T H fcs0ADAPTER ERROR
DC73C03A1118143810 T S fscsi0SOFTWARE PROGRAM ERROR
DC73C03A1118143810 T S fscsi0SOFTWARE PROGRAM ERROR
D666A8C71118143810 T H fcs0ADAPTER ERROR
D666A8C71118143710 T H fcs0ADAPTER ERROR
C62E1EB71118143610 P H hdisk86DISK OPERATION ERROR
……
如上,AIX不斷的報(bào)錯(cuò),差不多每一分鐘都在報(bào)'DISK OPERATION ERROR'的錯(cuò)誤.
#datapath query device
DEV#:2DEVICE NAME: vpath3TYPE: 1750500POLICY:Optimized
SERIAL: 68947310208
==========================================================================
Path#Adapter/Hard DiskStateModeSelectErrors
0fscsi0/hdisk86OPENNORMAL 2743907375193
1fscsi0/hdisk88OPENNORMAL00
2fscsi1/hdisk94OPENNORMAL 294658485810
3fscsi1/hdisk96OPENNORMAL00
我們可以看到,存儲到主機(jī)的4個(gè)鏈路都是open/normal狀態(tài).但errors在不斷增加。
Hdisk86是通過fcs0設(shè)備連接的,所以先檢查這個(gè)鏈路的情況
#lscfg -vl fcs0
Device Specific.(Z8)........20000000C98F0996
…...
Hardware Location Code......U5802.001.0080624-P1-C4-T1
問題分析
根據(jù)HBA卡的wwn(20000000C98F0996),我們確定了它連接的光纖交換機(jī)。這個(gè)交換機(jī)就是鏈路出現(xiàn)問題的那個(gè);然后檢查通過這個(gè)交換機(jī)連接IBM DS6800與aix主機(jī)的磁盤都在報(bào)錯(cuò)。從而確定是這個(gè)鏈路恢復(fù)以后信號衰減多于以前導(dǎo)致了鏈路的連接出現(xiàn)傳輸不穩(wěn)定的故障。
問題解決
更換容災(zāi)中心的單模模塊,由原來的4km更換為10km的單模模塊,經(jīng)過半小時(shí)的觀察,OS層不再報(bào)'DISK OPERATION ERROR'的錯(cuò)誤了,問題得到解決。
單模光纖的連接的衰耗的范圍為5-18,目前的這個(gè)鏈路的衰耗在正常的范圍內(nèi),問題出在單模模塊的選擇上,容災(zāi)中心的單模模塊是4KM的所以無法實(shí)現(xiàn)正常穩(wěn)定的通訊,更換為10km后,鏈路恢復(fù)了正常。
關(guān)于DISK OPERATION ERROR交換機(jī)級聯(lián)單模光纖鏈路故障該怎么解決就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。