這篇文章主要介紹大數(shù)據(jù)Lambda架構(gòu)概念及應(yīng)用的示例分析,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
目前創(chuàng)新互聯(lián)已為1000+的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)站空間、網(wǎng)站托管維護、企業(yè)網(wǎng)站設(shè)計、東麗網(wǎng)站維護等服務(wù),公司將堅持客戶導向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
大數(shù)據(jù)Lambda架構(gòu)概念及應(yīng)用
大數(shù)據(jù)平臺中包括批量計算的Batch Layer和實時計算的Speed Layer,通過在一套平臺中將批計算和流計算整合在一起。
例如使用HadoopMapReduce、Spark進行批量數(shù)據(jù)的處理,使用ApacheStorm、Spark Streaming 進行實時數(shù)據(jù)的處理。
這種架構(gòu)在一定程度上解決了不同計算類型的問題,但是帶來的問題是框架太多,會導致平臺復雜度過高、運維成功高等。
Lambda架構(gòu)的主要思想就是將大數(shù)據(jù)系統(tǒng)構(gòu)建為多個層次,如下圖所示:
我們來梳理一下他們是如何分工協(xié)助的:
首先new data作為整個數(shù)據(jù)系統(tǒng)的數(shù)據(jù)源頭,Batch Layer作為數(shù)據(jù)的批處理層次對原始數(shù)據(jù)進行加工與處理,并且將處理的數(shù)據(jù)結(jié)果的Batch View輸入到Serving Layer。(這里對應(yīng)的是全量數(shù)據(jù))
Speed Layer對于實時增加的數(shù)據(jù)進行處理,生成對增量數(shù)據(jù)計算結(jié)果的Real-time View。(這里對應(yīng)的是增量數(shù)據(jù))
最終用戶查詢是通過Batch View與Real-time View相結(jié)合的形式將最終結(jié)果呈現(xiàn)出來。
基于Lambda架構(gòu),一旦數(shù)據(jù)通過Batch layer進入到Serving layer,在Real-time view中的相應(yīng)結(jié)果就不再需要了。
以上是“大數(shù)據(jù)Lambda架構(gòu)概念及應(yīng)用的示例分析”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!