Flume整體架構(gòu)是怎么樣的

這篇文章主要為大家展示了“Flume整體架構(gòu)是怎么樣的”，內(nèi)容簡而易懂，條理清晰，希望能夠幫助大家解決疑惑，下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“Flume整體架構(gòu)是怎么樣的”這篇文章吧。

創(chuàng)新互聯(lián)公司長期為成百上千家客戶提供的網(wǎng)站建設(shè)服務(wù)，團隊從業(yè)經(jīng)驗10年，關(guān)注不同地域、不同群體，并針對不同對象提供差異化的產(chǎn)品和服務(wù)；打造開放共贏平臺，與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為景縣企業(yè)提供專業(yè)的做網(wǎng)站、成都網(wǎng)站設(shè)計，景縣網(wǎng)站改版等技術(shù)服務(wù)。擁有10余年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。

1、Flume介紹

Flume是cloudera公司開源的一款分布式、可靠地進行大量日志數(shù)據(jù)采集、聚合和并轉(zhuǎn)移到存儲中；通過事務(wù)機制提供了可靠的消息傳輸支持，自帶負載均衡機制來支撐水平擴展；并且提供了一些默認組件供直接使用。

Flume目前常見的應(yīng)用場景：日志--->Flume--->實時計算（如Kafka+Storm）、日志--->Flume--->離線計算（如HDFS、HBase）、日志--->Flume--->ElasticSearch。

2、整體架構(gòu)

Flume主要分為三個組件：Source、Channel、Sink；數(shù)據(jù)流如下圖所示：

Flume整體架構(gòu)是怎么樣的

1、Source負責(zé)日志流入，比如從文件、網(wǎng)絡(luò)、Kafka等數(shù)據(jù)源流入數(shù)據(jù)，數(shù)據(jù)流入的方式有兩種輪訓(xùn)拉取和事件驅(qū)動；

2、Channel負責(zé)數(shù)據(jù)聚合/暫存，比如暫存到內(nèi)存、本地文件、數(shù)據(jù)庫、Kafka等，日志數(shù)據(jù)不會在管道停留很長時間，很快會被Sink消費掉；

3、Sink負責(zé)數(shù)據(jù)轉(zhuǎn)移到存儲，比如從Channel拿到日志后直接存儲到HDFS、HBase、Kafka、ElasticSearch等，然后再有如Hadoop、Storm、ElasticSearch之類的進行數(shù)據(jù)分析或查詢。

一個Agent會同時存在這三個組件，Source和Sink都是異步執(zhí)行的，相互之間不會影響。

假設(shè)我們有采集并索引Nginx訪問日志，我們可以按照如下方式部署：

Flume整體架構(gòu)是怎么樣的

1、Source采集的日志會傳入ChannelProcessor組件，其首先通過Interceptor進行日志過濾，如果接觸過Servlet的話這個概念是類似的，可以參考《Servlet3.1規(guī)范翻譯——過濾器》；過濾器可以過濾掉日志，也可以修改日志內(nèi)容；

2、過濾完成后接下來會交給ChannelSelector進行處理，默認提供了兩種選擇器：復(fù)制或多路復(fù)用選擇器；復(fù)制即把一個日志復(fù)制到多個Channel；而多路復(fù)用會根據(jù)配置的選擇器條件，把符合條件的路由到相應(yīng)的Channel；在寫多個Channel時可能存在存在失敗的情況，對于失敗的處理有兩種：稍后重試或者忽略。重試一般采用指數(shù)級時間進行重試。

我們之前說過Source生產(chǎn)日志給Channel、Sink從Channel消費日志；它倆完全是異步的，因此Sink只需要監(jiān)聽自己關(guān)系的Channel變化即可。

到此我們可以對Source日志進行過濾/修改，把一個消息復(fù)制/路由到多個Channel，對于Sink的話也應(yīng)該存在寫失敗的情況，F(xiàn)lume默認提供了如下策略：

Flume整體架構(gòu)是怎么樣的

Failover策略是給多個Sink定義優(yōu)先級，假設(shè)其中一個失敗了，則路由到下一個優(yōu)先級的Sink；Sink只要拋出一次異常就會被認為是失敗了，則從存活Sink中移除，然后指數(shù)級時間等待重試，默認是等待1s開始重試，最大等待重試時間是30s。

Flume也提供了負載均衡策略：

Flume整體架構(gòu)是怎么樣的
1、首先是日志采集層，該層的Agent和應(yīng)用部署在同一臺機器上，負責(zé)采集如Nginx訪問日志；然后通過RPC將日志流入到收集/聚合層；在這一層應(yīng)該快速的采集到日志然后流入到收集/聚合層；

2、收集/聚合層進行日志的收集或聚合，并且可以進行容錯處理，如故障轉(zhuǎn)移或負載均衡，以提升可靠性；另外可以在該層開啟文件Channel，做數(shù)據(jù)緩沖區(qū)；

3、收集/聚合層對數(shù)據(jù)進行過濾或修改然后進行存儲或處理；比如存儲到HDFS，或者流入Kafka然后通過Storm對數(shù)據(jù)進行實時處理。

以上是“Flume整體架構(gòu)是怎么樣的”這篇文章的所有內(nèi)容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內(nèi)容對大家有所幫助，如果還想學(xué)習(xí)更多知識，歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道！

網(wǎng)頁題目：Flume整體架構(gòu)是怎么樣的
網(wǎng)站網(wǎng)址：http://weahome.cn/article/podicc.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

Flume整體架構(gòu)是怎么樣的

1、Flume介紹

2、整體架構(gòu)

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

Flume整體架構(gòu)是怎么樣的

1、Flume介紹

2、整體架構(gòu)

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管

2、整體架構(gòu)