摘要: 隨著大數(shù)據(jù)技術(shù)的發(fā)展,實(shí)時流計算、機(jī)器學(xué)習(xí)、圖計算等領(lǐng)域成為較熱的研究方向,而Spark作為大數(shù)據(jù)處理的“利器”有著較為成熟的生態(tài)圈,能夠一站式解決類似場景的問題。那你知道Spark生態(tài)系統(tǒng)有哪些組件嗎?下面讓我們跟著本文一同了解下這些不可或缺的組件。本文選自《圖解Spark:核心技術(shù)與案例實(shí)戰(zhàn)》
為覃塘等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計制作服務(wù),及覃塘網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為成都做網(wǎng)站、網(wǎng)站制作、成都外貿(mào)網(wǎng)站建設(shè)、覃塘網(wǎng)站設(shè)計,以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會得到認(rèn)可,從而選擇與我們長期合作。這樣,我們也可以走得更遠(yuǎn)!
Spark 生態(tài)系統(tǒng)以Spark Core 為核心,能夠讀取傳統(tǒng)文件(如文本文件)、HDFS、Amazon S3、Alluxio 和NOSQL 等數(shù)據(jù)源,利用Standalone、YARN 和Mesos 等資源調(diào)度管理,完成應(yīng)用程序分析與處理。這些應(yīng)用程序來自Spark 的不同組件,如Spark Shell 或Spark Submit 交互式批處理方式、Spark Streaming 的實(shí)時流處理應(yīng)用、Spark SQL 的即席查詢、采樣近似查詢引擎BlinkDB 的權(quán)衡查詢、MLbase/MLlib 的機(jī)器學(xué)習(xí)、GraphX 的圖處理和SparkR 的數(shù)學(xué)計算等,如下圖所示,正是這個生態(tài)系統(tǒng)實(shí)現(xiàn)了“One Stack to Rule Them All”目標(biāo)。