消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么，針對(duì)這個(gè)問題，這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答，希望可以幫助更多想解決這個(gè)問題的小伙伴找到更簡(jiǎn)單易行的方法。

創(chuàng)新互聯(lián)-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比習(xí)水網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式習(xí)水網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們，業(yè)務(wù)覆蓋習(xí)水地區(qū)。費(fèi)用合理售后完善，10余年實(shí)體公司更值得信賴。

摘要：消息隊(duì)列Kafka是一個(gè)分布式的、高吞吐量、高可擴(kuò)展性消息隊(duì)列服務(wù)，廣泛用于日志收集、監(jiān)控?cái)?shù)據(jù)聚合、流式數(shù)據(jù)處理、在線和離線分析等，是大數(shù)據(jù)生態(tài)中不可或缺的產(chǎn)品之一。

消息隊(duì)列Kafka

消息隊(duì)列Kafka是一個(gè)分布式的、高吞吐量、高可擴(kuò)展性消息隊(duì)列服務(wù)。相比于Apache Kafka，消息隊(duì)列Kafka所提供的是全托管的服務(wù)。這里也簡(jiǎn)單地介紹一下Apache Kafka，Apache Kafka是一個(gè)分布式的基于push-subscribe的消息系統(tǒng)，它具備快速、可擴(kuò)展、可持久化的特點(diǎn)。它現(xiàn)在是Apache旗下的一個(gè)開源系統(tǒng)，作為hadoop生態(tài)系統(tǒng)的一部分，目前被廣泛使用在大數(shù)據(jù)場(chǎng)景中。

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

而消息隊(duì)列 Kafka 針對(duì)Apache Kafka提供全托管服務(wù)，徹底解決開源產(chǎn)品長(zhǎng)期以來的痛點(diǎn)。用戶只需專注于業(yè)務(wù)開發(fā)，無需部署運(yùn)維，低成本、更彈性、更可靠。消息隊(duì)列產(chǎn)品最大的特點(diǎn)就是全托管服務(wù)，這里主要涉及到兩個(gè)特性：兼容性和便捷性。首先，對(duì)于兼容性，消息隊(duì)列Kafka能夠100%兼容Apache Kafka，對(duì)于用戶而言，可使用各種語言的開源客戶端進(jìn)行無縫接入，目前使用開源Kafka的用戶，只需要更改一個(gè)接入點(diǎn)就可以使用消息隊(duì)列Kafka產(chǎn)品。同時(shí)，消息隊(duì)列Kafka兼容Apache Kafka的所有生態(tài)。其次，對(duì)于便捷性而言，消息隊(duì)列Kafka不需要部署，用戶只要在購買消息隊(duì)列Kafka后，填入實(shí)例信息，15分鐘內(nèi)就能使用消息隊(duì)列Kafka的服務(wù)了，因此是非常便捷易用的。

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

上述是對(duì)于消息隊(duì)列Kafka的整體介紹，接下來將分為痛點(diǎn)、優(yōu)勢(shì)以及場(chǎng)景這三個(gè)模塊與大家進(jìn)行較為細(xì)節(jié)的分享。首先將與大家分享目前阿里云針對(duì)于消息隊(duì)列服務(wù)所收集到的用戶痛點(diǎn)，以及根據(jù)這些痛點(diǎn)來解決問題，消息隊(duì)列Kafka所具備的優(yōu)勢(shì)又是什么，最后還將與大家介紹一下消息隊(duì)列Kafka所適用的場(chǎng)景。

痛點(diǎn)：自建Kafka的煩惱

Apache Kafka運(yùn)維難度大

對(duì)于Kafka而言，從用戶視角來看，是一個(gè)非常簡(jiǎn)單的產(chǎn)品，其所提供的是發(fā)布與訂閱模型。那么，在對(duì)于Kafka進(jìn)行運(yùn)維方面而言，其難度又會(huì)非常大，這是因?yàn)樗粌H僅需要關(guān)注整個(gè)集群之內(nèi)像broker、controller類似的角色，還需要關(guān)注其所依賴的一些產(chǎn)品像ZooKeeper等。所以對(duì)于以上這些模塊的運(yùn)維不僅僅涉及到參數(shù)的調(diào)優(yōu)，同時(shí)隨著業(yè)務(wù)的增長(zhǎng)，還會(huì)面臨擴(kuò)縮容等問題。此外，還需要關(guān)注磁盤以及網(wǎng)絡(luò)情況。因此，綜上所述，自建Kafka的運(yùn)維成本和運(yùn)維難度都是非常大的。接下來就為大家分享一些具體的例子。

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

數(shù)據(jù)混亂

一些用戶反饋在自己使用Kafka集群的時(shí)候出現(xiàn)了數(shù)據(jù)混亂的問題。大家都知道，在Kafka集群里面存在Controller和Broker兩種角色，在Controller出現(xiàn)異常的情況之下，會(huì)從Broker里面自動(dòng)地選擇一個(gè)Broker成為新的Controller。但是由于網(wǎng)絡(luò)等異常情況，最開始掛掉的Controller可能重新復(fù)活了，那么在復(fù)活之后，對(duì)于整個(gè)集群而言就會(huì)出現(xiàn)“腦裂”的情況。因?yàn)镃ontroller的主要職責(zé)是管理整個(gè)集群的分區(qū)和副本的狀態(tài)，而當(dāng)出現(xiàn)“腦裂”就會(huì)造成數(shù)據(jù)混亂的問題，而這對(duì)于用戶而言，是不可接受的。

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

ZooKeeper不可用

整個(gè)Kafka集群對(duì)于ZK是強(qiáng)依賴的，而ZooKeeper的運(yùn)維工作也是龐大而復(fù)雜的。比如在運(yùn)維人員對(duì)于ZooKeeper不是非常了解的情況之下，可能不知道如何部署ZooKeeper，不知道如何保證ZK在同機(jī)房或者多機(jī)房的情況下保證其一定可用，而這些往往需要運(yùn)維人員的思考和權(quán)衡。而ZooKeeper上面會(huì)存儲(chǔ)Kafka的重要數(shù)據(jù)，當(dāng)ZK不可用的情況下，整個(gè)集群的災(zāi)備選組以及存儲(chǔ)的數(shù)據(jù)都會(huì)受到影響。

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

帶寬關(guān)注

對(duì)于用戶而言，自建Kafka時(shí)不僅僅需要關(guān)注其外圍的依賴產(chǎn)品，其實(shí)還需要關(guān)注一個(gè)在集群內(nèi)部經(jīng)常會(huì)遇到的問題——帶寬。站在用戶的使用角度來看，經(jīng)常需要做出對(duì)于副本數(shù)的權(quán)衡。而為了提升可靠性以及容災(zāi)能力，集群往往需要三副本，而當(dāng)副本數(shù)量一多，那么就會(huì)涉及到機(jī)器之間的數(shù)據(jù)復(fù)制，這種情況就會(huì)增加網(wǎng)絡(luò)的帶寬。同時(shí)，由于Broker之間是對(duì)等的，并且需要從Controller里面同步數(shù)據(jù)。這樣一來，Controller不僅僅需要承擔(dān)自己的本身的任務(wù)，還需要對(duì)外提供服務(wù)，而就其本身的設(shè)計(jì)而言，這兩部分任務(wù)是沒有優(yōu)先級(jí)先后的，所以在集群規(guī)模大的情況之下，就會(huì)引發(fā)網(wǎng)絡(luò)帶寬的擁堵問題。而阿里云消息隊(duì)列Kafka就已經(jīng)幫助用戶解決了上述問題了，用戶不需要去做備份之間的權(quán)衡，阿里云會(huì)幫助用戶實(shí)現(xiàn)數(shù)據(jù)的三副本存儲(chǔ)，并且使得服務(wù)可用性能夠達(dá)到99.9%

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

磁盤運(yùn)維

用戶自建Kafka還會(huì)遇到其他的一些問題，比如磁盤的運(yùn)維問題。從0.110版本之后，Consumer offsets不僅僅存儲(chǔ)在ZK端，其可以作為一個(gè)普通的Topic存儲(chǔ)在Kafka集群里面。而整個(gè)Consumer offsets的留存策略決定了磁盤的占用情況，因此有可能因?yàn)樵O(shè)置了錯(cuò)誤的參數(shù)導(dǎo)致磁盤的占用過高。同時(shí)，用戶經(jīng)?？吹降那闆r是：自己的集群有100T的磁盤，僅僅使用了幾十T就已經(jīng)出現(xiàn)了不可寫的情況。大家都知道，在Producer里面可以通過兩種方式對(duì)于數(shù)據(jù)進(jìn)行分區(qū)，通過Hash可能會(huì)造成Hash的傾斜，而使用RoundBobin的方式也可能導(dǎo)致磁盤占用不均。對(duì)于用戶而言，其可能看到的情況是用戶明明購買了很多的磁盤，磁盤也沒有被占滿，但是Producer卻已經(jīng)不可寫了。而關(guān)于磁盤運(yùn)維的細(xì)節(jié)問題，消息隊(duì)列Kafka就已經(jīng)幫助用戶解決掉了。

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

數(shù)據(jù)丟失

其實(shí)，對(duì)于用戶而言，最苦惱的就是數(shù)據(jù)丟失問題。Kafka為用戶提供了三種數(shù)據(jù)存儲(chǔ)策略，第一種可以認(rèn)為是OneWay方式，第二種相當(dāng)于將一個(gè)備份的數(shù)據(jù)落盤，最后一種相當(dāng)于將所有備份數(shù)據(jù)落盤才能成功。對(duì)于這三種方式的選擇過程，其實(shí)就是可用性與性能之間的博弈。在網(wǎng)絡(luò)負(fù)載很高或者磁盤很難寫入的情況下，就可能造成磁盤寫入失敗。同時(shí)，Kafka的數(shù)據(jù)最開始是存儲(chǔ)在PageCache上面的，并且會(huì)定時(shí)地刷到磁盤上，但是并不是每條消息發(fā)送成功都會(huì)存儲(chǔ)在磁盤上的。如果出現(xiàn)斷電或者機(jī)器故障的情況，存儲(chǔ)在內(nèi)存中的數(shù)據(jù)就會(huì)丟失。此外，還有一種情況就是當(dāng)單批數(shù)據(jù)量超過限制也會(huì)丟失數(shù)據(jù)。而使用消息隊(duì)列Kafka，用戶就不需要去做這些數(shù)據(jù)上面的選型的博弈和考慮，因?yàn)橹灰㈥?duì)列Kafka發(fā)送數(shù)據(jù)成功，那么這些數(shù)據(jù)就會(huì)被持久化，保證了數(shù)據(jù)不會(huì)丟失。因?yàn)橄㈥?duì)列Kafka做了這些優(yōu)化，數(shù)據(jù)的可靠性就能夠達(dá)到8個(gè)9(即99.999999%)

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

消息隊(duì)列Kafka的優(yōu)勢(shì)

上述與大家分享的就是消息隊(duì)列Kafka的優(yōu)勢(shì)，再來總結(jié)一下。消息隊(duì)列Kafka是完全兼容Apache Kafka的，Apache Kafka所能夠用到的整個(gè)生態(tài)的產(chǎn)品，比如上端的Flume等產(chǎn)品和下端的Spark、Storm、Flink以及ES等，對(duì)于消息隊(duì)列Kafka而言也是完全兼容的。其次，消息隊(duì)列Kafka所提供的是全托管的服務(wù)，也就是說無論集群中出現(xiàn)的是磁盤問題、網(wǎng)絡(luò)問題也好，無論是Kafka本身的還是其所依賴的產(chǎn)品所出現(xiàn)的任何問題，都是有專業(yè)團(tuán)隊(duì)來解決的。對(duì)于用戶而言，所能夠看到的是產(chǎn)品99.9%的可用性，并且能夠?yàn)橛脩魩矸浅７€(wěn)定的狀態(tài)，而底層的技術(shù)細(xì)節(jié)則是由阿里云專業(yè)的團(tuán)隊(duì)來處理的。對(duì)于高可用以及高可靠這部分而言，其與全托管是存在強(qiáng)關(guān)聯(lián)的。對(duì)于數(shù)據(jù)的可靠性而言，都是每一個(gè)產(chǎn)品所最為重視的，因?yàn)楫?dāng)發(fā)生了數(shù)據(jù)的丟失，就可能使得整個(gè)的業(yè)務(wù)邏輯出現(xiàn)錯(cuò)誤，進(jìn)而引發(fā)一些重大的故障。而阿里云所承諾的是當(dāng)用戶使用消息隊(duì)列Kafka發(fā)送消息，只要返回所發(fā)送的消息是成功的，那么這個(gè)數(shù)據(jù)的可靠性就能夠達(dá)到8個(gè)9，這一點(diǎn)也是用戶所無需擔(dān)心的。同時(shí)，阿里云消息隊(duì)列為用戶提供了非常實(shí)用的業(yè)務(wù)報(bào)表以及靈活全面的業(yè)務(wù)監(jiān)控體系，并且業(yè)務(wù)的監(jiān)控和報(bào)表是基于用戶業(yè)務(wù)維度的，包括整個(gè)集群的磁盤水位、Topic以及Consumer Group在內(nèi)的所有的用戶所關(guān)心的業(yè)務(wù)相關(guān)指標(biāo)，這些內(nèi)容都會(huì)沉淀在消息隊(duì)列Kafka的控制臺(tái)里面，用戶直接登錄控制臺(tái)就能夠看到整體業(yè)務(wù)的運(yùn)行情況。最后一點(diǎn)，運(yùn)行在消息隊(duì)列Kafka上的數(shù)據(jù)是非常安全的，通過VPC網(wǎng)絡(luò)的隔離、鑒權(quán)、加密以及黑白名單這一系列的保障能夠保證用戶的數(shù)據(jù)是非常安全的，同時(shí)消息隊(duì)列Kafka所具有的一個(gè)巨大優(yōu)勢(shì)就是其購買的每一個(gè)實(shí)例都是用戶購買所獨(dú)享的，用戶之間不會(huì)因?yàn)橄嗷ビ绊憣?dǎo)致整個(gè)系統(tǒng)出現(xiàn)不穩(wěn)定的情況。

場(chǎng)景

以上為大家介紹了消息隊(duì)列Kafka的優(yōu)勢(shì)，接下來為大家分享其所適用的場(chǎng)景。其實(shí)，可以認(rèn)為消息隊(duì)列Kafka與開源的Apache Kafka所適用的場(chǎng)景是一樣的，不同之處在于消息隊(duì)列Kafka具有更高的可靠性以及可用性，同時(shí)不需要用戶自己進(jìn)行運(yùn)維。

構(gòu)建日志分析平臺(tái)

淘寶、天貓平臺(tái)等公司每天都會(huì)產(chǎn)生大量的日志。運(yùn)營(yíng)、運(yùn)維團(tuán)隊(duì)以及一些決策人員需要對(duì)于整個(gè)的日志數(shù)據(jù)進(jìn)行分析與統(tǒng)計(jì)。而Kafka本身的性能是非常高效的，同時(shí)Kafka的特性決定它非常適合作為"日志收集中心"，這是因?yàn)镵afka在采集日志的時(shí)候業(yè)務(wù)是無感知的，其能夠兼容自己的上游，能夠直接地通過配置加密消息。當(dāng)日志數(shù)據(jù)發(fā)送到Kafka集群里面，其實(shí)對(duì)于業(yè)務(wù)而言是完全無侵入的。同時(shí)其在下游又能夠直接地對(duì)接Hadoop/ODPS等離線倉庫存儲(chǔ)和Strom/Spark等實(shí)現(xiàn)實(shí)時(shí)在線分析。在這樣的情況之下，使用Kafka，只需要用戶去關(guān)注整個(gè)流程里面的業(yè)務(wù)邏輯，而無需做更多的開發(fā)就能夠?qū)崿F(xiàn)統(tǒng)計(jì)、分析以及報(bào)表。

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

網(wǎng)站活動(dòng)跟蹤場(chǎng)景

除了實(shí)現(xiàn)數(shù)據(jù)分析形成報(bào)表之外，Kafka還可以實(shí)現(xiàn)網(wǎng)站活動(dòng)跟蹤場(chǎng)景。通過Kafka可以實(shí)時(shí)地收集到網(wǎng)站的活動(dòng)數(shù)據(jù)，比如用戶對(duì)于頁面的瀏覽、搜索以及行為等。消息隊(duì)列Kafka可以通過Topic來對(duì)于業(yè)務(wù)上面不同的數(shù)據(jù)模型進(jìn)行切分的。那么，用戶可以按照注冊(cè)或者登錄以及購買等進(jìn)行切分，對(duì)于下游所需要跟蹤的場(chǎng)景的不同，可以對(duì)接不同的處理系統(tǒng)，比如實(shí)時(shí)處理、實(shí)時(shí)監(jiān)控以及離線處理，Kafka在這個(gè)場(chǎng)景里面是非常便捷易用的。

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

數(shù)據(jù)在流動(dòng)中產(chǎn)生價(jià)值

前面兩個(gè)例子是將消息隊(duì)列Kafka在整個(gè)解決方案里面承擔(dān)的是數(shù)據(jù)輸入流的角色，而Kafka卻不僅僅可以充當(dāng)數(shù)據(jù)的輸入流，還可以做流計(jì)算處理，比如股市走向分析、氣象數(shù)據(jù)測(cè)控、網(wǎng)站用戶行為分析等領(lǐng)域，由于在這些領(lǐng)域中數(shù)據(jù)產(chǎn)生快、實(shí)時(shí)性強(qiáng)、數(shù)據(jù)量大，所以很難統(tǒng)一采集并入庫存儲(chǔ)后再做處理，這便導(dǎo)致傳統(tǒng)的數(shù)據(jù)處理架構(gòu)不能滿足需求。而Kafka Stream以及Storm/Samza/Spark等流計(jì)算引擎的出現(xiàn)，可以根據(jù)業(yè)務(wù)需求對(duì)數(shù)據(jù)進(jìn)行計(jì)算分析，最終把結(jié)果保存或者分發(fā)給需要的組件。

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

多路轉(zhuǎn)發(fā)

大家經(jīng)常會(huì)遇到的場(chǎng)景就是對(duì)于不同的業(yè)務(wù)維度而言，需要不同的計(jì)算方式，比如對(duì)于對(duì)賬系統(tǒng)而言，可能需要實(shí)時(shí)的流處理方式；對(duì)于統(tǒng)計(jì)分析而言，可以使用批計(jì)算方式。而使用Kafka能夠?qū)崿F(xiàn)多路轉(zhuǎn)發(fā)，上游生產(chǎn)一份數(shù)據(jù)，多個(gè)下游節(jié)點(diǎn)都能夠獲取這份數(shù)據(jù)并做出相應(yīng)的處理，因此Kafka可以完成數(shù)據(jù)多路轉(zhuǎn)發(fā)的功能。

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

關(guān)于消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么問題的解答就分享到這里了，希望以上內(nèi)容可以對(duì)大家有一定的幫助，如果你還有很多疑惑沒有解開，可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識(shí)。

網(wǎng)頁名稱：消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么
文章網(wǎng)址：http://weahome.cn/article/pdccjg.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

消息隊(duì)列服務(wù)Kafka的痛點(diǎn)、優(yōu)勢(shì)以及適用場(chǎng)景是什么

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管