一、背景
創(chuàng)新互聯(lián)建站-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比涇源網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式?jīng)茉淳W(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋涇源地區(qū)。費(fèi)用合理售后完善,十年實(shí)體公司更值得信賴。目前namenode使用了ha的部署模式,但系統(tǒng)會(huì)經(jīng)常出現(xiàn)ha的自動(dòng)切換(namenode節(jié)點(diǎn)其實(shí)正常)。經(jīng)過調(diào)研發(fā)現(xiàn)可能的原因如下:
HealthMonitor check本地namenode的rpc端口時(shí)超時(shí),導(dǎo)致HealthMonitor認(rèn)為namenode掛掉。
zk上的session timeout,導(dǎo)致丟掉當(dāng)前持有的active鎖(temp節(jié)點(diǎn)),引起自動(dòng)切換。
二、優(yōu)化
下面的優(yōu)化將針對(duì)1)和2)調(diào)整相應(yīng)的超時(shí)參數(shù),看是否起效。修改core-site.xml
ha.health-monitor.rpc-timeout.ms 300000 ha.zookeeper.session-timeout.ms 180000
無,不需要重啟hadoop,不會(huì)引起namenode切換
下面操作假設(shè)master1(active),master2(standby),只有按照該順序操作,才能實(shí)現(xiàn)namenode不切換
1)登陸master2(standby),注釋掉crontab中的restart-zkfc.sh任務(wù),
執(zhí)行
sbin/hadoop-daemon.sh stop zkfc
2)登陸master1(active),注釋掉crotab中的restart-zkfc.sh任務(wù),執(zhí)行
sbin/hadoop-daemon.sh stop zkfc
3)備份master1和master2的core-site.xml文件,將上述配置項(xiàng)加到master1和master2的core-site.xml配置文件中
4)登陸master1(active),執(zhí)行
sbin/hadoop-daemon.sh start zkfc
5)登陸master2(standby),執(zhí)行
sbin/hadoop-daemon.sh start zkfc
6)check
hadoop集群狀態(tài)
7)重要!!!
登錄master1和master2,恢復(fù)crontab中的restart-zkfc.sh任務(wù)
8)完成
1)需要先注釋掉機(jī)器上的crontab任務(wù)restart-zkfc.sh,否則該程序會(huì)自動(dòng)拉起zkfc進(jìn)程。導(dǎo)致namenode
active產(chǎn)生切換
2)任務(wù)完成后要恢復(fù)crontab中注釋掉的restart-zkfc.sh任務(wù)
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。