真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

在線日志分析項(xiàng)目解讀

1，日志的采集

創(chuàng)新互聯(lián)專注于諸暨網(wǎng)站建設(shè)服務(wù)及定制，我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。熱誠(chéng)為您提供諸暨營(yíng)銷型網(wǎng)站建設(shè)，諸暨網(wǎng)站制作、諸暨網(wǎng)頁(yè)設(shè)計(jì)、諸暨網(wǎng)站官網(wǎng)定制、成都微信小程序服務(wù)，打造諸暨網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供諸暨網(wǎng)站排名全網(wǎng)營(yíng)銷落地服務(wù)。

在線日志分析項(xiàng)目解讀

從flume agent 上的數(shù)據(jù)一般分到兩條線上一條是kafka 集群，后期可以用流式處理（spark streaming 或storm 等等）一條是到hdfs，后期可以用hive處理，

業(yè)界叫l(wèi)ambda架構(gòu) architecture (一般公司的推薦系統(tǒng)，就是用這種架構(gòu))

flume-ng agent 采集收集日志后，聚合在一個(gè)節(jié)點(diǎn)上（也可以不聚合）

為什么要聚合？為什么不直接寫到kafka集群？

假如公司規(guī)模比較大，有無(wú)數(shù)個(gè)flume節(jié)點(diǎn),這么多都連kafka，會(huì)增加復(fù)雜度，有個(gè)聚合節(jié)點(diǎn)（會(huì)是多個(gè)節(jié)點(diǎn)組成，防止單節(jié)點(diǎn)掛了），還可以對(duì)日志格式統(tǒng)一處理，篩選不要的數(shù)據(jù)

在線日志分析項(xiàng)目解讀