這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)Kafka的體系架構(gòu)是怎樣的,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
讓客戶滿意是我們工作的目標,不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價值的長期合作伙伴,公司提供的服務(wù)項目有:申請域名、網(wǎng)絡(luò)空間、營銷軟件、網(wǎng)站建設(shè)、馬鞍山網(wǎng)站維護、網(wǎng)站推廣。
一、什么是Kafka?
數(shù)據(jù)工程中最具挑戰(zhàn)性的部分之一是如何從不同點收集和傳輸大量數(shù)據(jù)到分布式系統(tǒng)進行處理和分析。需要通過消息隊列正確地分離大量數(shù)據(jù),因為如果一部分數(shù)據(jù)無法傳送,則可以在系統(tǒng)恢復(fù)時傳輸和分析其他數(shù)據(jù)。有兩種消息排隊,對于上述目的,它們都是可靠的和異步的。點對點(Point to point)和發(fā)布者——訂閱者(publisher-subscriber)。下圖展示了一個典型的消息系統(tǒng),其中:消息的生產(chǎn)者負責(zé)產(chǎn)生消息;消息的消費者負責(zé)處理消息。
Kafka是一個分布式發(fā)布——訂閱消息傳遞系統(tǒng)。Kafka快速、可擴展且耐用。它保留主題中的消息源。生產(chǎn)者將數(shù)據(jù)寫入主題,消費者從主題中讀取數(shù)據(jù)。
Zookeeper需要覆蓋Kafka生態(tài)系統(tǒng),因此有必要下載它,更改其屬性并最終設(shè)置環(huán)境。在運行Zookeeper之后,應(yīng)該下載Kafka,然后開發(fā)人員可以借助一些指令創(chuàng)建代理,集群和主題。
點對點(Queue)
在點對點或一對一中,有一個發(fā)件人和正在監(jiān)聽發(fā)件人的多個消費者。當(dāng)一個消費者從隊列收到消息時,該特定消息將從隊列中消失,而其他消費者無法獲得該消息。
發(fā)布和訂閱系統(tǒng)(Topic)
在發(fā)布者——訂閱者中,發(fā)布者向同時收聽發(fā)布者的多個消費者或訂閱者發(fā)送消息,并且每個訂閱者可以獲得相同的消息。數(shù)據(jù)應(yīng)通過數(shù)據(jù)管道傳輸,數(shù)據(jù)管道負責(zé)整合來自數(shù)據(jù)源的數(shù)據(jù)。
主題和發(fā)布者
有一個發(fā)布者發(fā)送消息。消息根據(jù)主題進行分類,每個主題都有一個或多個分區(qū),并有自己的偏移地址。例如,如果我們?yōu)橐粋€主題分配復(fù)制因子= 2,那么Kafka將為每個分區(qū)創(chuàng)建兩個相同的副本并在群集中找到它。
集群和Brokers
Kafka集群包括代理——服務(wù)器或節(jié)點,每個代理可以位于不同的機器中,并允許訂戶選擇消息。因此,復(fù)制就像備份分區(qū)一樣,這意味著Kafka是持久的,這有助于容錯。
Zookeeper
Kafka集群不保留其自身生態(tài)系統(tǒng)的元數(shù)據(jù),因為它是無狀態(tài)的。因此,Kafka依賴于Zookeeper來跟蹤元數(shù)據(jù)。Zookeeper應(yīng)該首先啟動。實際上,Zookeeper是brokers和consumers之間的接口,它的存在是容錯的必要條件。Kafka代理負責(zé)負載平衡,假設(shè)該主題有一個主題和多個分區(qū),每個分區(qū)都有一個領(lǐng)導(dǎo)者,定期確認其與Zookeeper的偏移量。因此,如果一個節(jié)點或代理失敗,Kafka可以從Zookeeper請求的最后一個偏移地址繼續(xù)操作,因此Zookeeper在崩潰情況下在Kafka恢復(fù)中起著至關(guān)重要的作用。
部署ZooKeeper
配置/root/training/zookeeper-3.4.6/conf/zoo.cfg文件 dataDir=/root/training/zookeeper-3.4.6/tmp server.1=hadoop112:2888:3888 在/root/training/zookeeper-3.4.6/tmp目錄下創(chuàng)建一個myid的空文件 echo 1 > /root/training/zookeeper-3.4.6/tmp/myid 啟動ZooKeeper zkServer.sh start 查看ZooKeeper的狀態(tài) zkServer.sh status
由于我們部署的是單節(jié)點的ZooKeeper,所以ZooKeeper的狀態(tài)將是Standalone。
部署Kafka
修改server.conf文件 broker.id=0 port=9092 log.dirs=/root/training/kafka_2.11-2.4.0/logs/broker0 zookeeper.connect=localhost:2181 啟動Kafka bin/kafka-server-start.sh config/server.properties &
使用JPS查看后臺進程
創(chuàng)建Topic bin/kafka-topics.sh --create --zookeeper bigdata111:2181 --replication-factor 1 --partitions 3 --topic mytopic1 發(fā)送消息 bin/kafka-console-producer.sh --broker-list bigdata111:9092 --topic mytopic1 接收消息 消息消費 bin/kafka-console-consumer.sh --bootstrap-server bigdata111:9092 --topic mytopic1 從開始位置消費 bin/kafka-console-consumer.sh --bootstrap-server bigdata111:9092 --from-beginning --topic topicName 顯示key消費 bin/kafka-console-consumer.sh --bootstrap-server bigdata111:9092 --property print.key=true --topic mytopic1
上述就是小編為大家分享的Kafka的體系架構(gòu)是怎樣的了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。