流程圖解析
創(chuàng)新互聯(lián)專業(yè)為企業(yè)提供羅江網(wǎng)站建設(shè)、羅江做網(wǎng)站、羅江網(wǎng)站設(shè)計、羅江網(wǎng)站制作等企業(yè)網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計與制作、羅江企業(yè)網(wǎng)站模板建站服務(wù),10年羅江做網(wǎng)站經(jīng)驗,不只是建網(wǎng)站,更提供有價值的思路和整體網(wǎng)絡(luò)服務(wù)。
典型的BI系統(tǒng)體流程如下:
由于是處理海量數(shù)據(jù),流程中各環(huán)節(jié)所使用的技術(shù)則跟傳統(tǒng)BI完全不同,后續(xù)課程都會一一講解:
1) 數(shù)據(jù)采集:定制開發(fā)采集程序,或使用開源框架FLUME
2) 數(shù)據(jù)預(yù)處理:定制開發(fā)mapreduce程序運行于Hadoop集群
3) 數(shù)據(jù)倉庫技術(shù):基于hadoop之上的Hive
4) 數(shù)據(jù)導出:基于hadoop的sqoop數(shù)據(jù)導入導出工具
5) 數(shù)據(jù)可視化:定制開發(fā)web程序或使用kettle等產(chǎn)品
6) 整個過程的流程調(diào)度:hadoop生態(tài)圈中的oozie工具或其他類似開源產(chǎn)品
項目技術(shù)架構(gòu)圖