真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

Hadoop設(shè)計概念是什么-創(chuàng)新互聯(lián)

本篇內(nèi)容主要講解“Hadoop設(shè)計概念是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Hadoop設(shè)計概念是什么”吧!

創(chuàng)新互聯(lián)建站專注于陽泉網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供陽泉營銷型網(wǎng)站建設(shè),陽泉網(wǎng)站制作、陽泉網(wǎng)頁設(shè)計、陽泉網(wǎng)站官網(wǎng)定制、小程序制作服務(wù),打造陽泉網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供陽泉網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。

一、Hadoop簡介

Apache Hadoop是目前最流行的軟件框架,可使用簡單的高級編程模型實現(xiàn)大型數(shù)據(jù)集的分布式存儲和處理。Hadoop是Apache Software Foundation的一個開源項目,可以安裝在服務(wù)器集群上,以便這些服務(wù)器可以通信并協(xié)同工作來存儲和處理大型數(shù)據(jù)集。Hadoop近年來因其有效處理大數(shù)據(jù)的能力而變得非常成功。它允許公司將所有數(shù)據(jù)存儲在一個系統(tǒng)中,并對這些數(shù)據(jù)進行分析,否則傳統(tǒng)解決方案不可能或非常昂貴。

圍繞Hadoop構(gòu)建的許多配套工具提供了各種各樣的處理技術(shù)。與輔助系統(tǒng)和實用程序的集成非常出色,使Hadoop的實際工作更輕松,更高效。這些工具共同構(gòu)成了Hadoop生態(tài)系統(tǒng)。

大家可以將Hadoop視為大數(shù)據(jù)操作系統(tǒng),從而可以在所有龐大的數(shù)據(jù)集上運行不同類型的工作負載。其范圍從離線批處理到機器學習再到實時流處理。

二、Hadoop設(shè)計概念

為了解決處理和存儲大型數(shù)據(jù)集的挑戰(zhàn),Hadoop是根據(jù)以下核心特征構(gòu)建的:

1、分布 - 存儲和處理不是構(gòu)建一臺大型超級計算機,而是分布在一組通信和協(xié)同工作的小型機器上。

2、橫向可擴展性 - 只需添加新計算機即可輕松擴展Hadoop集群。每臺新機器都會按比例增加Hadoop集群的總存儲和處理能力。

3、容錯 - 即使少數(shù)硬件或軟件組件無法正常工作,Hadoop仍可繼續(xù)運行。

4、成本優(yōu)化 - Hadoop不需要昂貴的高端服務(wù)器,無需商業(yè)許可即可正常工作。

5、編程抽象 - Hadoop負責處理與分布式計算相關(guān)的所有混亂細節(jié)。借助高級API,用戶可以專注于實現(xiàn)解決現(xiàn)實問題的業(yè)務(wù)邏輯。

6、數(shù)據(jù)位置 - Hadoop不會將大型數(shù)據(jù)集移動到運行應(yīng)用程序的位置,而是運行數(shù)據(jù)已經(jīng)存在的應(yīng)用程序。

三、Hadoop組件

Hadoop分為兩個核心組件:HDFS分布式文件系統(tǒng);YARN集群資源管理技術(shù)。

1、HDFS:

HDFS是一個Hadoop分布式文件系統(tǒng)。它可以在您需要的任意數(shù)量的服務(wù)器上運行 - HDFS可以輕松擴展到數(shù)千個節(jié)點和數(shù)PB的數(shù)據(jù)。HDFS設(shè)置越大,某些磁盤,服務(wù)器或網(wǎng)絡(luò)交換機出現(xiàn)故障的概率就越大。HDFS通過在多個服務(wù)器上復(fù)制數(shù)據(jù)來幸免于這些類型的故障。HDFS自動檢測給定組件是否已發(fā)生故障,并采取對用戶透明發(fā)生的必要恢復(fù)操作。

HDFS設(shè)計用于存儲數(shù)百兆字節(jié)或千兆字節(jié)的大型文件,并為它們提供高吞吐量的流數(shù)據(jù)訪問。最后但同樣重要的是,HDFS支持一次寫入多次讀取模型。對于這個用例,HDFS就像一個魅力。但是,如果您需要存儲大量具有隨機讀寫訪問權(quán)限的小文件,那么其他系統(tǒng)(如RDBMS和Apache HBase)可以做得更好。

2、YARN:
YARN(Yet Another Resource Negotiator)負責管理Hadoop集群上的資源,并支持運行處理存儲在HDFS上的數(shù)據(jù)的各種分布式應(yīng)用程序。與HDFS類似,YARN遵循主從設(shè)計,ResourceManager進程充當主節(jié)點,多個NodeManager充當工作者。他們有以下責任:

(1)ResourceManager

跟蹤實時NodeManagers以及群集中每臺服務(wù)器上的可用計算資源量。為應(yīng)用程序分配可用資源。監(jiān)視Hadoop集群上所有應(yīng)用程序的執(zhí)行情況。

(2)節(jié)點管理器

管理Hadoop集群中單個節(jié)點上的計算資源(RAM和CPU)。運行各種應(yīng)用程序的任務(wù),并強制它們在指定的計算資源的限制范圍內(nèi)。

YARN以資源容器的形式將集群資源分配給各種應(yīng)用程序,資源容器表示RAM量和CPU核心數(shù)量的組合。

Hadoop = HDFS + YARN

在同一群集上運行的HDFS和YARN守護程序為我們提供了一個用于存儲和處理大型數(shù)據(jù)集的強大平臺。

到此,相信大家對“Hadoop設(shè)計概念是什么”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計公司網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學習!

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。


標題名稱:Hadoop設(shè)計概念是什么-創(chuàng)新互聯(lián)
地址分享:http://weahome.cn/article/dscspo.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部