Kafka生產(chǎn)集群中有一臺(tái)機(jī)器cdh-003由于物理故障原因掛掉了,并且系統(tǒng)起不來了,使得線上的spark Streaming實(shí)時(shí)任務(wù)不能正常消費(fèi),重啟實(shí)時(shí)任務(wù)都不行。查看kafka topic狀態(tài),發(fā)現(xiàn)broker Leader出現(xiàn)-1的情況,如下圖
創(chuàng)新互聯(lián)公司專注于吉安網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠為您提供吉安營銷型網(wǎng)站建設(shè),吉安網(wǎng)站制作、吉安網(wǎng)頁設(shè)計(jì)、吉安網(wǎng)站官網(wǎng)定制、小程序制作服務(wù),打造吉安網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供吉安網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。
Kafka Broker Leader 為-1,表示有partition在選舉Leader的時(shí)候失敗了,因此引起了消費(fèi)該Topic的實(shí)時(shí)任務(wù)都出現(xiàn)了異常,經(jīng)過排除發(fā)現(xiàn)掛掉的cdh-003機(jī)器正好是broker id為257。(但為何192沒有被選舉為leader呢??)
?
kafka partition狀態(tài)信息存在Zookeeper上,我的環(huán)境目錄是 /kafka/brokers/topics/,具體操作如下:
[zk: localhost:2181(CONNECTED) 2] get /kafka/brokers/topics/mds001/partitions/1/state
{"controller_epoch":87,"leader":-1,"version":1,"leader_epoch":96,"isr":[257]}
[zk: localhost:2181(CONNECTED) 3] set /kafka/brokers/topics/mds001/partitions/1/state {"controller_epoch":87,"leader":192,"version":1,"leader_epoch":96,"isr":[192]}
[zk: localhost:2181(CONNECTED) 4] get /kafka/brokers/topics/mds001/partitions/1/state
{"controller_epoch":87,"leader":192,"version":1,"leader_epoch":96,"isr":[192]}
[zk: localhost:2181(CONNECTED) 5]