真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

kafka深入研究之路(1)-剖析各原理01

kafka深入研究之路(1)-剖析各原理01

引言:來到了新公司,需要對kafka組件有很深的研究,本人之前對老版的kafka有過一定的研究,但是談不上深入,新公司力推kafka,比較kafka作為消息系統(tǒng)在目前的市場上的占有率還是很高的,可以看本人之前kafka的博客中有關(guān)kafka的優(yōu)點和為什么要用kafka。
在眾多優(yōu)點中,我本人認(rèn)為最重要的2個優(yōu)點如下:

創(chuàng)新互聯(lián)公司是專業(yè)的千山網(wǎng)站建設(shè)公司,千山接單;提供網(wǎng)站制作、成都做網(wǎng)站,網(wǎng)頁設(shè)計,網(wǎng)站設(shè)計,建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進行千山網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團隊,希望更多企業(yè)前來合作!

1、削峰
數(shù)據(jù)庫的處理能力是有限的,在峰值期,過多的請求落到后臺,一旦超過系統(tǒng)的處理能力,可能會使系統(tǒng)掛掉。

kafka深入研究之路(1)-剖析各原理01

如上圖所示,系統(tǒng)的處理能力是 2k/s,MQ 處理能力是 8k/s,峰值請求 5k/s,MQ 的處理能力遠遠大于數(shù)據(jù)庫,在高峰期,請求可以先積壓在 MQ 中,系統(tǒng)可以根據(jù)自身的處理能力以 2k/s 的速度消費這些請求。
這樣等高峰期一過,請求可能只有 100/s,系統(tǒng)可以很快的消費掉積壓在 MQ 中的請求。
注意,上面的請求指的是寫請求,查詢請求一般通過緩存解決。

2、解耦
如下場景,S 系統(tǒng)與 A、B、C 系統(tǒng)緊密耦合。由于需求變動,A 系統(tǒng)修改了相關(guān)代碼,S 系統(tǒng)也需要調(diào)整 A 相關(guān)的代碼。
過幾天,C 系統(tǒng)需要刪除,S 緊跟著刪除 C 相關(guān)代碼;又過了幾天,需要新增 D 系統(tǒng),S 系統(tǒng)又要添加與 D 相關(guān)的代碼;再過幾天,程序猿瘋了...

kafka深入研究之路(1)-剖析各原理01

這樣各個系統(tǒng)緊密耦合,不利于維護,也不利于擴展。現(xiàn)在引入 MQ,A 系統(tǒng)變動,A 自己修改自己的代碼即可;C 系統(tǒng)刪除,直接取消訂閱;D 系統(tǒng)新增,訂閱相關(guān)消息即可。
kafka深入研究之路(1)-剖析各原理01

這樣通過引入消息中間件,使各個系統(tǒng)都與 MQ 交互,從而避免它們之間的錯綜復(fù)雜的調(diào)用關(guān)系。


kafka架構(gòu)原理:

最經(jīng)典的圖也就是官方的圖了
kafka深入研究之路(1)-剖析各原理01

找了一些其他博主的圖:這里自己就懶的畫了

kafka深入研究之路(1)-剖析各原理01

詳細復(fù)雜的kafka架構(gòu)
kafka深入研究之路(1)-剖析各原理01

通俗點講:就是producer ----> kafka cluster(brokers) -----> consumer
生產(chǎn)者生產(chǎn)消息 經(jīng)過 kafka隊列 被消費者消費

相關(guān)的組件概念見:


topic and logs

廢話不多說,先見圖
kafka深入研究之路(1)-剖析各原理01

文字解釋如下:
Message 是按照 Topic 來組織的,每個 Topic 可以分成多個 Partition(對server.properties/num.partitions)。 本人習(xí)慣性配置文件為num.partitions=broker個數(shù),人為的分配到各個節(jié)點上。

Partition 中的每條記錄(Message)包含三個屬性:Offset,messageSize 和 Data。
其中 Offset 表示消息偏移量;messageSize 表示消息的大??;Data 表示消息的具體內(nèi)容。

Partition 是以文件的形式存儲在文件系統(tǒng)中,位置由 server.properties/log.dirs 指定,其命名規(guī)則為 -。
生產(chǎn)配置文件為:log.dirs=/data/kafka/kafka-logs

[hadoop@kafka03-55-13 kafka-logs]$ pwd
/data/kafka/kafka-logs
[hadoop@kafka03-55-13 kafka-logs]$ ls |grep mjh
topic-by-mjh-0
topic-by-mjh-1
topic-by-mjh-10
topic-by-mjh-11
topic-by-mjh-12
...
...
...

Partition 可能位于不同的 Broker 上,Partition 是分段的,每個段是一個 Segment 文件。

Partition 目錄下包括了數(shù)據(jù)文件和索引文件

[hadoop@kafka03-55-13 kafka-logs]$ cd topic-by-mjh-0
[hadoop@kafka03-55-13 topic-by-mjh-0]$ ll
total 4
-rw-rw-r-- 1 hadoop hadoop 10485760 Aug 24 20:13 00000000000000000334.index
-rw-rw-r-- 1 hadoop hadoop        0 Aug 13 17:42 00000000000000000334.log
-rw-rw-r-- 1 hadoop hadoop 10485756 Aug 24 20:13 00000000000000000334.timeindex
-rw-rw-r-- 1 hadoop hadoop        4 Aug 16 14:16 leader-epoch-checkpoint

Index 采用稀疏存儲的方式,它不會為每一條 Message 都建立索引,而是每隔一定的字節(jié)數(shù)建立一條索引,避免索引文件占用過多的空間。
缺點是沒有建立索引的 Offset 不能一次定位到 Message 的位置,需要做一次順序掃描,但是掃描的范圍很小。
索引包含兩個部分(均為 4 個字節(jié)的數(shù)字),分別為相對 Offset 和 Position。
相對 Offset 表示 Segment 文件中的 Offset,Position 表示 Message 在數(shù)據(jù)文件中的位置。

Segment下的log文件就是存儲消息的地方
每個消息都會包含消息體、offset、timestamp、key、size、壓縮編碼器、校驗和、消息版本號等。

在磁盤上的數(shù)據(jù)格式和producer發(fā)送到broker的數(shù)據(jù)格式一模一樣,也和consumer收到的數(shù)據(jù)格式一模一樣。由于磁盤格式與consumer以及producer的數(shù)據(jù)格式一模一樣,這樣就使得Kafka可以通過零拷貝(zero-copy)技術(shù)來提高傳輸效率。 // 關(guān)于零拷貝技術(shù),后期會專門寫一遍博客來解釋

小結(jié):
1、Partition 是一個順序的追加日志,屬于順序?qū)懘疟P(順序?qū)懘疟P效率比隨機寫內(nèi)存要高,保障 Kafka 吞吐率)。
2、Kafka 的 Message 存儲采用了分區(qū)(Partition),磁盤順序讀寫,分段(LogSegment)和稀疏索引這幾個手段來達到高效性。
3、在 Kafka 的文件存儲中,同一個 Topic 下有多個不同的 Partition,每個 Partition 都為一個目錄,而每一個目錄又被平均分配成多個大小相等的 Segment File 中(Segment 大小我們在生產(chǎn)上設(shè)置成1G或者 500MB ),Segment File 又由 index file 和 data file 組成,他們總是成對出現(xiàn),后綴 ".index" 和 ".log" 分表表示 Segment 索引文件和數(shù)據(jù)文件。


Partition and Replica

kafka深入研究之路(1)-剖析各原理01

一個 Topic 物理上分為多個 Partition,位于不同的 Broker 上。如果沒有 Replica,一旦 Broker 宕機,其上所有的 Patition 將不可用。

每個 Partition 可以有多個Replica(對應(yīng)server.properties/default.replication.factor),分配到不同的 Broker 上。本人默認(rèn)習(xí)慣為 default.replication.factor=2 也就是默認(rèn)2個副本,比較合理

其中有一個 Leader 負(fù)責(zé)讀寫,處理來自 Producer 和 Consumer 的請求;其他作為 Follower 從 Leader Pull 消息,保持與 Leader 的同步。

如何分配 Partition 和 Replica 到 Broker 上?步驟如下:

1、將所有 Broker(假設(shè)共 n 個 Broker)和待分配的 Partition 排序。
2、將第 i 個 Partition 分配到第(i mod n)個 Broker 上。
3、將第 i 個 Partition 的第 j 個 Replica 分配到第((i + j) mode n)個 Broker 上。
根據(jù)上面的分配規(guī)則,若 Replica 的數(shù)量大于 Broker 的數(shù)量,必定會有兩個相同的 Replica 分配到同一個 Broker 上,產(chǎn)生冗余。因此 Replica 的數(shù)量應(yīng)該小于或等于 Broker 的數(shù)量。
//這里kafka硬性規(guī)定了創(chuàng)建的replica不能超過broker的數(shù)量,必須等于小于broker的數(shù)量

這里有2個算法函數(shù)解釋一下
1、mod:求余函數(shù);
2、mode:返回在某數(shù)組或數(shù)據(jù)區(qū)域中出現(xiàn)頻率最多的數(shù)值,mode是一個位置測量函數(shù)。

我這里只有3個broker 創(chuàng)建4個replica就出現(xiàn)報錯 具體見下
[root@kafka02-55-12 ~]# kafka-topics.sh --zookeeper 10.211.55.11:2181,10.211.55.12:2181,10.211.55.13:2181/kafkagroup  --replication-factor 4 --partitions 9 --create  --topic topic-zhuhair
**Error while executing topic command : Replication factor: 4 larger than available brokers: 3.**
[2019-08-24 20:41:40,611] ERROR org.apache.kafka.common.errors.InvalidReplicationFactorException: Replication factor: 4 larger than available brokers: 3.

pratition的leader是如何選舉的---broker failover故障轉(zhuǎn)移
//通俗點講也就是當(dāng)broker發(fā)生宕機了,如何保證高可用的

kafka深入研究之路(1)-剖析各原理01

文字描述如下:
Kafka 在 Zookeeper 中(/brokers/topics/[topic]/partitions/[partition]/state)動態(tài)維護了一個 ISR(in-sync replicas)。
ISR 里面的所有 Replica 都"跟上"了 Leader,Controller 將會從 ISR 里選一個做 Leader。

具體流程文字描述如下:
1、Controller 在 Zookeeper 的 /brokers/ids/[brokerId] 節(jié)點注冊 Watcher,
2、當(dāng) Broker 宕機時 Zookeeper 會 Fire Watch。
3、Controller 從 /brokers/ids 節(jié)點讀取可用 Broker。
4、Controller 決定 set_p,該集合包含宕機 Broker 上的所有 Partition。
5、對 set_p 中的每一個 Partition,從/brokers/topics/[topic]/partitions/[partition]/state 節(jié)點讀取 ISR,決定新 Leader,將新 Leader、ISR、controller_epoch 和 leader_epoch 等信息寫入 State 節(jié)點。
6、zk通過 RPC 向相關(guān) Broker 發(fā)送 leaderAndISRRequest 命令。

極端情況下需要考慮的是:
當(dāng) ISR 為空時,會選一個 Replica(不一定是 ISR 成員)作為 Leader;
當(dāng)所有的 Replica 都歇菜了,會等任意一個 Replica 復(fù)活,將其作為 Leader。
//
這就需要在可用性和一致性當(dāng)中作出一個簡單的折衷。如果一定要等待ISR中的Replica“活”過來,那不可用的時間就可能會相對較長。而且如果ISR中的所有Replica都無法“活”過來了,或者數(shù)據(jù)都丟失了,這個Partition將永遠不可用。選擇第一個“活”過來的Replica作為Leader,而這個Replica不是ISR中的Replica,那即使它并不保證已經(jīng)包含了所有已commit的消息,它也會成為Leader而作為consumer的數(shù)據(jù)源(前文有說明,所有讀寫都由Leader完成)。Kafka0.8.*使用了第二種方式。根據(jù)Kafka的文檔,在以后的版本中,Kafka支持用戶通過配置選擇這兩種方式中的一種,從而根據(jù)不同的使用場景選擇高可用性還是強一致性。

ISR(同步列表)中的 Follower 都"跟上"了Leader,"跟上"并不表示完全一致,它由 server.properties/replica.lag.time.max.ms 配置。表示 Leader 等待 Follower 同步消息的最大時間,如果超時,Leader 將 Follower 移除 ISR。配置項 replica.lag.max.messages 已經(jīng)移除。


Replica 副本如何同步 消息傳遞同步策略

1、Producer在發(fā)布消息到某個Partition時,先通過ZooKeeper找到該Partition的Leader,
2、無論該Topic的Replication Factor為多少,Producer只將該消息發(fā)送到該Partition的Leader。
3、Leader會將該消息寫入其本地Log。
4、每個Follower都從Leader pull數(shù)據(jù)。這種方式上,F(xiàn)ollower存儲的數(shù)據(jù)順序與Leader保持一致。
5、Follower在收到該消息并寫入其Log后,向Leader發(fā)送ACK。
6、一旦Leader收到了ISR中的所有Replica的ACK,該消息就被認(rèn)為已經(jīng)commit了,Leader將增加HW并且向Producer發(fā)送ACK。

為了提高性能,每個Follower在接收到數(shù)據(jù)后就立馬向Leader發(fā)送ACK,而非等到數(shù)據(jù)寫入Log中。
因此,對于已經(jīng)commit的消息,Kafka只能保證它被存于多個Replica的內(nèi)存中,而不能保證它們被持久化到磁盤中,也就不能完全保證異常發(fā)生后該條消息一定能被Consumer消費。

Consumer讀消息也是從Leader讀取,只有被commit過的消息才會暴露給Consumer。

kafka深入研究之路(1)-剖析各原理01

具體的可靠性,是由生產(chǎn)者(根據(jù)配置項 producer.properties/acks)來決定的。
有資料說 最新的文檔 2.2.x request.required.acks 已經(jīng)不存在了,這一點有待我去確認(rèn)

通俗一點講對ack的三個參數(shù)的含義為
Kafka?producer有三種ack機制 ?初始化producer時在config中進行配置

0?:意味著producer不等待broker同步完成的確認(rèn),繼續(xù)發(fā)送下一條(批)信息
提供了最低的延遲。但是最弱的持久性,當(dāng)服務(wù)器發(fā)生故障時,就很可能發(fā)生數(shù)據(jù)丟失。例如leader已經(jīng)死亡,producer不知情,還會繼續(xù)發(fā)送消息broker接收不到數(shù)據(jù)就會數(shù)據(jù)丟失
1:意味著producer要等待leader成功收到數(shù)據(jù)并得到確認(rèn),才發(fā)送下一條message。此選項提供了較好的持久性較低的延遲性。Partition的Leader死亡,follwer尚未復(fù)制,數(shù)據(jù)就會丟失
-1:意味著producer得到follwer確認(rèn),才發(fā)送下一條數(shù)據(jù)

持久性最好,延時性最差。

在這里強調(diào)的一點是,在kafak的partition中的fllower和leader中的復(fù)制不是完全的同步復(fù)制,也不是單純的異步復(fù)制
同步復(fù)制:所有的fllower復(fù)制完才提交 這樣的缺點是極大的影響了吞吐率
異步復(fù)制:Follower異步的從Leader復(fù)制數(shù)據(jù),數(shù)據(jù)只要被Leader寫入log就被認(rèn)為已經(jīng)commit,這種情況下如果Follower都復(fù)制完都落后于Leader,而如果Leader突然宕機,則會丟失數(shù)據(jù)。
所有 kafak采用的是ISR 的方式則很好的均衡了確保數(shù)據(jù)不丟失以及吞吐率。Follower可以批量的從Leader復(fù)制數(shù)據(jù),這樣極大的提高復(fù)制性能(批量寫磁盤),極大減少了Follower與Leader的差距。


producer如何發(fā)送消息
Producer 首先將消息封裝進一個 ProducerRecord 實例中。
kafka深入研究之路(1)-剖析各原理01

寫消息的路由模式

1、 指定了 patition,則直接使用;
2、 未指定 patition 但指定 key,通過對 key 的 value 進行hash 選出一個 patition
這個 Hash(即分區(qū)機制)由 producer.properties/partitioner.class 指定的類實現(xiàn),這個路由類需要實現(xiàn) Partitioner 接口。
3、 patition 和 key 都未指定,使用輪詢選出一個 patition。

備注:消息并不會立即發(fā)送,而是先進行序列化后,發(fā)送給 Partitioner,
也就是上面提到的 Hash 函數(shù),由 Partitioner 確定目標(biāo)分區(qū)后,發(fā)送到一塊內(nèi)存緩沖區(qū)中(發(fā)送隊列)。Producer 的另一個工作線程(即 Sender 線程),
則負(fù)責(zé)實時地從該緩沖區(qū)中提取出準(zhǔn)備好的消息封裝到一個批次內(nèi),統(tǒng)一發(fā)送到對應(yīng)的 Broker 中。

具體寫數(shù)據(jù)流程如下:
kafka深入研究之路(1)-剖析各原理01

具體流程如下:
1、 producer 先從 zookeeper 的 "/brokers/.../state" 節(jié)點找到該 partition 的 leader
2、 producer 將消息發(fā)送給該 leader
3、 leader 將消息寫入本地 log
4、 followers 從 leader pull 消息,寫入本地 log 后 leader 發(fā)送 ACK
5、 leader 收到所有 ISR 中的 replica 的 ACK 后,增加 HW(high watermark,最后 commit 的 offset) 并向 producer 發(fā)送 ACK

參考網(wǎng)上的資料,有的文字版的解釋是這樣的 個人覺得下面的這樣的文字解釋的更加通俗易懂
流程如下:
1、首先,我們需要創(chuàng)建一個ProducerRecord,這個對象需要包含消息的主題(topic)和值(value),可以選擇性指定一個鍵值(key)或者分區(qū)(partition)。
2、發(fā)送消息時,生產(chǎn)者會對鍵值和值序列化成字節(jié)數(shù)組,然后發(fā)送到分配器(partitioner)。
3、如果我們指定了分區(qū),那么分配器返回該分區(qū)即可;否則,分配器將會基于鍵值來選擇一個分區(qū)并返回。
4、選擇完分區(qū)后,生產(chǎn)者知道了消息所屬的主題和分區(qū),它將這條記錄添加到相同主題和分區(qū)的批量消息中,另一個線程負(fù)責(zé)發(fā)送這些批量消息到對應(yīng)的Kafka broker。
5、當(dāng)broker接收到消息后,如果成功寫入則返回一個包含消息的主題、分區(qū)及位移的RecordMetadata對象,否則返回異常。
6、生產(chǎn)者接收到結(jié)果后,對于異??赡軙M行重試。

參考鏈接:
架構(gòu)成長之路:Kafka設(shè)計原理看了又忘,忘了又看?一文讓你掌握: https://www.toutiao.com/i6714606866355192328/
Kafka的ACK機制有三種,是哪三種 : https://blog.csdn.net/Sun1181342029/article/details/87806207
kafka原理系列ACK機制(數(shù)據(jù)可靠性和持久性保證) https://blog.csdn.net/bluehawksk/article/details/96120803
kafka入門介紹 https://www.orchome.com/5
Kafka學(xué)習(xí)之路 (三)Kafka的高可用 https://www.cnblogs.com/qingyunzong/p/9004703.html


網(wǎng)頁標(biāo)題:kafka深入研究之路(1)-剖析各原理01
新聞來源:http://weahome.cn/article/jidhjp.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部