這篇文章主要為大家分析了如何分析Apache TubeMQ數(shù)據(jù)可靠性的相關(guān)知識點,內(nèi)容詳細易懂,操作細節(jié)合理,具有一定參考價值。如果感興趣的話,不妨跟著跟隨小編一起來看看,下面跟著小編一起深入學(xué)習(xí)“如何分析Apache TubeMQ數(shù)據(jù)可靠性”的知識吧。
創(chuàng)新互聯(lián)專注于余江網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供余江營銷型網(wǎng)站建設(shè),余江網(wǎng)站制作、余江網(wǎng)頁設(shè)計、余江網(wǎng)站官網(wǎng)定制、微信小程序開發(fā)服務(wù),打造余江網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供余江網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。
我們在Apache TubeMQ的適用場景有介紹,TubeMQ適用于極端情況下容忍少量數(shù)據(jù)丟失的業(yè)務(wù)場景,那么TubeMQ到底在什么情況下可能會出現(xiàn)數(shù)據(jù)丟失?為什么要這么設(shè)計?同類MQ在這方面是怎么做的?這篇文檔計劃解答這幾個問題。
Apache TubeMQ系統(tǒng)數(shù)據(jù)存儲采用的是單節(jié)點多磁盤RAID10的副本方案進行存儲,數(shù)據(jù)只在如下場景存在可能丟失情況:
機器斷電,已回復(fù)成功但還沒有被消費且處在內(nèi)存中的數(shù)據(jù)會丟;機器上線后,已存儲在磁盤上的數(shù)據(jù)不受影響;
RAID10 hold不住的磁盤異常,已返回成功但還沒有被消費的數(shù)據(jù)會受影響;磁盤修復(fù)后,已存儲但沒有恢復(fù)回來的數(shù)據(jù)會丟失;
RAID10 能hold住的日常壞盤,壞盤Broker節(jié)點的生產(chǎn)和消費不受影響;
這個問題也是交流最多的一個話題,大家最直觀的感受是:機器很容易掛,TubeMQ只有單節(jié)點,數(shù)據(jù)的可靠性是不高的。這里個人的觀點還是如其他場合介紹里一直表達的:用數(shù)據(jù)可靠性指標來反應(yīng)系統(tǒng)的數(shù)據(jù)可靠性其實是不太合適,因為它只是反映了系統(tǒng)數(shù)據(jù)可靠性的果,對如何解決數(shù)據(jù)可靠性其實沒有太直接的關(guān)系;從介紹的數(shù)據(jù)可能存在丟的場景介紹我們可以看到,生產(chǎn)環(huán)境的機房情況、服務(wù)器硬件情況,以及業(yè)務(wù)能否即時消費完數(shù)據(jù)等直接影響到系統(tǒng)的數(shù)據(jù)可靠性,是這些內(nèi)容故障導(dǎo)致了系統(tǒng)數(shù)據(jù)可靠性的高或者低,如果沒有上述這些問題,TubeMQ系統(tǒng)的數(shù)據(jù)可靠性其實就是100%,所以,我們應(yīng)該通過對應(yīng)環(huán)境導(dǎo)致數(shù)據(jù)可能丟失的故障率指標來評估、分析系統(tǒng)的數(shù)據(jù)可靠性,個人覺得這個是根本。
按照2019年我們線上環(huán)境的故障數(shù)據(jù)統(tǒng)計,TubeMQ集群在我們環(huán)境,全年導(dǎo)致數(shù)據(jù)可能丟失的故障率大概是2.67%:整個TubeMQ集群1500臺機器,日均有35萬億條的數(shù)據(jù)接入量前提下,全年大概有40臺左右的服務(wù)器出現(xiàn)過機器ping異常,以及RAID10 hold不住的磁盤組損壞異常。個人覺得我們環(huán)境的故障率指標還可以再降低,因為TubeMQ集群里用的機器多是重點業(yè)務(wù)用了幾年后淘汰下來的二手機器設(shè)備。
降成本:大家都知道,要達到完全100%的數(shù)據(jù)可靠性是非常耗費成本的,一個MQ管道要做成類似太空飛船設(shè)計樣構(gòu)造多套獨立節(jié)點的冗余數(shù)據(jù)備份,來保證數(shù)據(jù)不丟;而從我們的分析來看,通過MQ傳遞的業(yè)務(wù)數(shù)據(jù),90%左右的數(shù)據(jù)是可以容許極端情況下丟失少量數(shù)據(jù)的,有10%左右的數(shù)據(jù)是要求一條都不能丟,比如交易流水,涉及到錢相關(guān)的日志數(shù)據(jù)等;如果我們將這10%的高可靠數(shù)據(jù)單獨拎出來處理的話,我們就可以節(jié)約大量的成本,基于這個思路,TubeMQ負責完成要求高性能、極端情況下容許數(shù)據(jù)少量丟失的數(shù)據(jù)服務(wù)。
如上圖示,除了方案上的考量外,我們在TubeMQ的存儲方案設(shè)計上也是做了仔細的斟酌:我們按照Topic維度進行了數(shù)據(jù)和索引的組件;我們在文件之上再疊加了一層內(nèi)存存儲作為磁盤文件存儲的延申。但我們又沒有因為業(yè)務(wù)容忍少量丟失而完全的無所顧忌,比如:我們數(shù)據(jù)生產(chǎn)采用的是QoS1方案;我們的數(shù)據(jù)存儲是有強制的緩存刷盤(按條、按時間、按size)控制的刷盤控制;我們的磁盤故障是有服務(wù)端基于運營策略的Broker節(jié)點自動只讀或者下線管控(ServiceStatusHolder);生產(chǎn)端針對Broker節(jié)點的服務(wù)質(zhì)量也是有自動異常節(jié)點感知和算法屏蔽,等等等等,以此來達到高性能同時盡可能的提高數(shù)據(jù)的可靠性,降低數(shù)據(jù)丟失的可能。
能降多少成本?拿外部多個使用Kafka的廠商已經(jīng)公開的運營數(shù)據(jù)來看,1萬億日均接入量,Kafka大概需要200 ~ 300臺萬兆機,按照2019年的運營數(shù)據(jù),TubeMQ大概40 ~ 50臺萬兆機;這里還包含一些可以區(qū)分的特殊情況,比如獨立集群、特定業(yè)務(wù)份數(shù)的不同等,但機器的成本指標數(shù)據(jù)的比值應(yīng)該是相差不大的。如果把這些數(shù)據(jù)指標換算成錢的話,這個節(jié)約的成本僅服務(wù)器成本都可以以億單位來計算。
也有人會說,是不是我拿Kafka的單副本進行業(yè)務(wù)服務(wù),就可以達到TubeMQ一樣的成本效果了?我想表達的是,如果可以的話,我們就不會耗費這么長的時間和資源去改進TubeMQ,直接使用Kafka單副本方案了,在我們開源初期做過一份全面的單Broker的性能壓測對比總結(jié)報告tubemq_perf_test_vs_Kafka,大家可以在上面找到對應(yīng)的具體差異。
這里想表達的是,實際上,TubeMQ系統(tǒng)本身的數(shù)據(jù)可靠性其實并不低。這里大家有沒有想過,各個MQ,在多副本方案下,系統(tǒng)數(shù)據(jù)可靠性又有多高呢?
Kafka:以我個人分析的觀點,在高性能場景下Kafka的多副本方案也只是盡力而為的保證數(shù)據(jù)多副本存儲不丟。
Kafka副本機制通過一個AR集合以及ISR集合來識別和區(qū)分副本份數(shù)以及在線同步副本數(shù),通過replica.lag.time.max.ms參數(shù)記錄各個副本最近同步的時間來判定各個Follower是否仍與Leader處于同步在線;在0.9X版本之前Kafka還有另外一個已經(jīng)去掉的replica.lag.max.messages參數(shù),F(xiàn)ollower副本滯后Leader副本的消息數(shù),結(jié)合起來判定失效副本。線上運行時Kafka又通過ISR的個數(shù)及請求的副本應(yīng)答個數(shù)保證數(shù)據(jù)多個節(jié)點存儲:服務(wù)器端通過min.insync.replicas來確保ISR里最少處于同步狀態(tài)的副本個數(shù),客戶端可以指定請求的Ack個數(shù)(0:不應(yīng)答,1:Leader存儲即OK,-1:所有ISR節(jié)點都應(yīng)答)結(jié)合起來確保數(shù)據(jù)可以被多個副本所接收。
從這個機制的設(shè)計我們可以很清晰的看到,即使是Kafka的設(shè)計者,也是很清楚數(shù)據(jù)很有可能沒有從Leader同步到各個Follower,存在復(fù)制不及時的情況,所以將ISR識別由(滯后條數(shù),同步時間)改為了(同步時間),因為滯后量太大影響到了ISR副本數(shù)的判定。而這個ISR的副本數(shù)又影響到了對應(yīng)Topic的寫入,如果Topic的ISR個數(shù)為0,原生Kafka是無法寫入消息的;為此Kafka又增加了一個unclean.leader.election.enable參數(shù),允許未處于同步狀態(tài)的Topic副本可以選為Leader對外服務(wù),做盡力而為的服務(wù)。
從如上分析,在大數(shù)據(jù)場景下Kafka的這種副本機制,可以滿足回溯消費業(yè)務(wù)需要,主副本所在機器故障后,已經(jīng)同步到副本的數(shù)據(jù)可以被回溯業(yè)務(wù)消費到,但是,由于上述問題存在數(shù)據(jù)丟的問題,對于要求回溯并保證數(shù)據(jù)不丟的場景無法滿足;同時,這種方案資源消耗大利用率非常的低,按照2副本的配置,資源增加了至少1倍、網(wǎng)絡(luò)帶寬下降1/2,同時為了避免2副本形成ISR為0的情況,使用方很有可能配置3副本,從而資源增加更多而資源利用率則更低,用如此高的成本維系的卻是一個不可靠的數(shù)據(jù)服務(wù),方案并不廉價有效;最后,Kafka在分區(qū)無副本存活時阻塞生產(chǎn)流量直接掉0,這對大流量環(huán)境的業(yè)務(wù)個人覺得是無法接受的,而即使采用配置3副本模式,因為3副本?;钍莿討B(tài)的,極端情況下仍然存在生產(chǎn)受阻問題。
Pulsar:以我個人的分析觀點,可以保證數(shù)據(jù)不丟,但大數(shù)據(jù)場景下是有影響的。
Pulsar采用了類似Raft協(xié)議模式,多數(shù)副本寫成功即返回成功,并且是采用的服務(wù)器主動Push請求到各個Bookeeper副本節(jié)點的模式。這種實時的多副本同步方案可以滿足絕大多數(shù)的高可靠業(yè)務(wù)需要,用戶的眼睛是雪亮的,我想近期的Pulsar火熱,也是與它滿足了市場上這方面業(yè)務(wù)需求有關(guān)系。不過,如果把它放置在大數(shù)據(jù)場景下,上千的Topic上萬的Partition時,這種多副本方案就需要耗費大量的機器資源。所以,我們TEG數(shù)據(jù)平臺部對于高可靠的數(shù)據(jù),使用的是Pulsar對內(nèi)進行服務(wù);同時我們也將我們對Pulsar的改進捐獻給社區(qū)。
TubeMQ:就如其適用場景介紹,TubeMQ就是為了滿足在容忍極端情況下允許數(shù)據(jù)少量丟失的業(yè)務(wù)數(shù)據(jù)上報管道需求,結(jié)合業(yè)務(wù)成本、數(shù)據(jù)可靠性的要求走了一條不一樣的自研路,針對致命異常在系統(tǒng)可靠性上也達到了不一樣的效果:
只要Topic分配的Broker集合里還有任意一臺Broker存活,該Topic的對外服務(wù)都可用;
基于第1點,只要集群里所有的Topic都還有任意一臺Broker存活,整個集群的Topic對外服務(wù)都是可用;
即使管控節(jié)點Master全部掛掉,集群里新增的生產(chǎn)、消費會受影響,但已注冊了的生產(chǎn)、消費不受影響,仍可繼續(xù)生產(chǎn)和消費;
TubeMQ基于有損服務(wù)的前提下采用盡可能保證數(shù)據(jù)不丟、服務(wù)不受阻的思路進行設(shè)計,力求方案簡單維護簡便:TubeMQ的設(shè)計里,分區(qū)故障并不影響Topic的整體對外服務(wù),只要Topic有一個分區(qū)存活,整體的對外服務(wù)就不會受阻;TubeMQ的數(shù)據(jù)時延P99可以做到毫秒級,這樣保證了業(yè)務(wù)可以盡可能快的消費完數(shù)據(jù),做到盡可能不丟;TubeMQ獨有的數(shù)據(jù)存儲方案設(shè)計性能要比Kafka的TPS至少高出50%以上(有些機型上還是翻倍的效果),同時借助存儲方案的不同,單機容納的Topic數(shù)和分區(qū)數(shù)更多,進而可以使得集群規(guī)模更大,減少維護成本。這些不一樣的考慮和實現(xiàn)結(jié)合起來從而使得TubeMQ做到低成本,高性能,高穩(wěn)定性基礎(chǔ)。
關(guān)于“如何分析Apache TubeMQ數(shù)據(jù)可靠性”就介紹到這了,更多相關(guān)內(nèi)容可以搜索創(chuàng)新互聯(lián)以前的文章,希望能夠幫助大家答疑解惑,請多多支持創(chuàng)新互聯(lián)網(wǎng)站!