這篇文章給大家分享的是有關HDFS設計基礎與目標是什么的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
創(chuàng)新互聯公司電話聯系:13518219792,為您提供成都網站建設網頁設計及定制高端網站建設服務,創(chuàng)新互聯公司網頁制作領域10余年,包括成都圍欄護欄等多個方面擁有豐富的網站營銷經驗,選擇創(chuàng)新互聯公司,為企業(yè)錦上添花!
設計基礎:
(1)由于硬件錯誤是常態(tài)。因此需要冗余。
(2)流式數據訪問,即數據批量讀取,而非隨機讀取。hadoop擅長做的是數據分析而不是事務處理。
(3)大規(guī)模數據集
(4)簡單一致性模型。為了降低系統(tǒng)復雜度,對文件采取一次性寫多次讀的邏輯設計,即是文件一經寫入,關閉后,就再也不能修改。
(5)程序采用“數據就近”原則分配節(jié)點執(zhí)行。
體系結構:
hdfs采用主從結構,Namenode屬于主端,Datanode屬于從端。
Namenode:
1) 管理文件系統(tǒng)的命名空間。
2) 記錄每個文件數據塊在Datanode上的位置和副本信息。
3) 協調客戶端對文件的訪問。
4) 記錄命名空間內的改動或者空間本身屬性的改動。
5) Namenode使用事務日志記錄HDFS元數據的變化。使用映像文件存儲文件系統(tǒng)的命名空間,包括文件映射、文件屬性等。
從社會學的角度看,Namenode是HDFS的管理者,發(fā)揮管理、協調、操控的作用。
Datanode:
1) 負責所在物理節(jié)點的存儲管理。
2) 一次寫入,多次讀取,不能修改。
3) 文件由數據庫組成,一般情況下,數據塊的大小為64MB。
4) 數據盡量散布到各個節(jié)點。
從社會學的角度看,Datanode是HDFS的工作者,發(fā)揮著按照Namenode的命令干活,并且把干活的進展和問題反饋到Namenode的作用。
SecondaryNameNode:
1) HA的一個解決方案。但不支持熱備。配置即可。
2) 執(zhí)行過程:從NameNode上下載元數據信息(fsimage,edits),然后把二者合并,生成新的fsimage,在本地保存,并將其推送到NameNode,同時重置NameNode的edits.
3) 默認在安裝在NameNode節(jié)點上,但這樣...不安全!
可靠性:
(1)冗余副本策略
(2)機架策略
(3)心跳機制
(4)安全模式
(5)校驗和
(6)回收站
(7)元數據保護
(8)快照機制
感謝各位的閱讀!關于“HDFS設計基礎與目標是什么”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!