前段時間接到深圳同事的反應,有個oracle集群中的一臺負載過高,為了排查問題,系統(tǒng)已經(jīng)重啟了,但是系統(tǒng)重啟后,6塊仲裁盤丟失了。
成都創(chuàng)新互聯(lián)擁有10余年成都網(wǎng)站建設工作經(jīng)驗,為各大企業(yè)提供做網(wǎng)站、網(wǎng)站制作服務,對于網(wǎng)頁設計、PC網(wǎng)站建設(電腦版網(wǎng)站建設)、成都App制作、wap網(wǎng)站建設(手機版網(wǎng)站建設)、程序開發(fā)、網(wǎng)站優(yōu)化(SEO優(yōu)化)、微網(wǎng)站、國際域名空間等,憑借多年來在互聯(lián)網(wǎng)的打拼,我們在互聯(lián)網(wǎng)網(wǎng)站建設行業(yè)積累了很多網(wǎng)站制作、網(wǎng)站設計、網(wǎng)絡營銷經(jīng)驗,集策劃、開發(fā)、設計、營銷、管理等網(wǎng)站化運作于一體,具備承接各種規(guī)模類型的網(wǎng)站建設項目的能力。
為了查明原因,登入系統(tǒng)后,執(zhí)行df -h,發(fā)現(xiàn)系統(tǒng)的/boot分區(qū)變成了mpathap1,進入/dev/mapper目錄,發(fā)現(xiàn)多了mpathap1-3 三個文件。初步判斷是由于系統(tǒng)自帶多路徑軟件導致,查看了初始的配置/etc/multipath.conf 其中并未添加屏蔽本地磁盤的設置。于是手動按文檔添加后,由于改變的是系統(tǒng)本地分區(qū),所以需要重啟系統(tǒng),發(fā)現(xiàn)重啟后,問題依舊;繼續(xù)嘗試了/etc/fstab的修改,將boot直接綁定到/dev/sda,結果系統(tǒng)重啟不正常,只能進單用戶修改。嘗試卸載multipath軟件后重啟,原以為系統(tǒng)會自動恢復到初始狀態(tài),結果重啟后無法進入系統(tǒng),需要單用戶模式進入,并重新安裝軟件。進入/dev/下查看是否有sda1-3發(fā)現(xiàn)系統(tǒng)并沒有此分區(qū)。最終確認系統(tǒng)重啟后系統(tǒng)已被多路徑軟件將分區(qū)篡改,而且不可逆,如果解決此問題只能重新安裝系統(tǒng)。所以配置多路徑前,一定要把本地磁盤給屏蔽掉。而且此問題的發(fā)生概率很小,因為之前也重啟過很多次,所以配置時千萬小心。
通過執(zhí)行 multipath -ll 發(fā)現(xiàn)兩臺的wwid 對應的磁盤盤符是錯亂的,以后查看的時候看來確實需要仔細,這里耽誤了很長時間,因為有15個盤符,一個一個對確實挺費事。為了避免盤符錯亂,修改了/etc/multipath.conf ,為每個wwid對應了一個固定的盤符。
方法:
multipath {
wwid 36005076802810fb3000000000000007d
alias mpathf
}
然后執(zhí)行
multipath -F 清除配置。
service multipathd restart 重啟服務。
multipath -v2 重新掃描。
multipath -ll
至此磁盤對應關系解決了,剩下的工作就是DBA的事情了。
附錄添加方法: 執(zhí)行/lib/udev/scsi_id --page=0x83 --whitelisted --device=/dev/sda 查看對應的wwid
然后添加:
blacklist {
wwid 36234567890abcde01c6a312c0a867e33
}
這樣就把本地盤給屏蔽掉了,而不是直接放開默認注釋:
#blacklist {
# wwid 0x6234567890abcde01c6a312c0a867e33
# devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*"
# devnode "^hd[a-z]"
#}
這個屏蔽掉光驅等外置設備,如果直接屏蔽設備也可以寫成devnode "^sd[a-z]*"