hadoop2.0集群的搭建方法

這篇文章主要講解了“hadoop2.0集群的搭建方法”，文中的講解內容簡單清晰，易于學習與理解，下面請大家跟著小編的思路慢慢深入，一起來研究和學習“hadoop2.0集群的搭建方法”吧！

成都創(chuàng)新互聯是一家集網站建設,丹陽企業(yè)網站建設,丹陽品牌網站建設,網站定制,丹陽網站建設報價,網絡營銷,網絡優(yōu)化,丹陽網站推廣為一體的創(chuàng)新建站企業(yè)，幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力?？沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯網需求。同時我們時刻保持專業(yè)、時尚、前沿，時刻以成就客戶成長自我，堅持不斷學習、思考、沉淀、凈化自己，讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網站。

hadoop2.2.0集群搭建

PS：apache提供的hadoop-2.2.0的安裝包是在32位操作系統(tǒng)編譯的，

因為hadoop依賴一些C++的本地庫，所以如果在64位的操作上安裝

hadoop-2.2.0就需要重新在64操作系統(tǒng)上重新編譯

1.準備工作:(參考偽分布式搭建)

1.1修改Linux主機名

1.2修改IP

1.3修改主機名和IP的映射關系

1.4關閉防火墻

1.5ssh免登陸

1.6.安裝JDK，配置環(huán)境變量等

2.集群規(guī)劃：

hadoop2.0集群的搭建方法

PS：

在hadoop2.0中通常由兩個NameNode組成，一個處于active狀態(tài)，

另一個處于standby狀態(tài)。Active NameNode對外提供服務，

而Standby NameNode則不對外提供服務，僅同步active namenode

的狀態(tài)，以便能夠在它失敗時快速進行切換。

hadoop2.0官方提供了兩種HDFS HA的解決方案，一種是NFS，

另一種是QJM。這里我們使用簡單的QJM。在該方案中，

主備NameNode之間通過一組JournalNode同步元數據信息，

一條數據只要成功寫入多數JournalNode即認為寫入成功。

通常配置奇數個JournalNode

這里還配置了一個zookeeper集群，用于ZKFC

（DFSZKFailoverController）故障轉移，當Active NameNode掛

掉了，會自動切換Standby NameNode為standby狀態(tài)

3.安裝步驟：

3.1.安裝配置zooekeeper集群

3.1.1解壓

tar -zxvf zookeeper-3.4.5.tar.gz -C /cloud/

3.1.2修改配置

cd /cloud/zookeeper-3.4.5/conf/

cp zoo_sample.cfg zoo.cfg

vim zoo.cfg

修改：dataDir=/cloud/zookeeper-3.4.5/tmp

在最后添加：

server.1=hadoop01:2888:3888

server.2=hadoop02:2888:3888

server.3=hadoop03:2888:3888

保存退出

然后創(chuàng)建一個tmp文件夾

mkdir /cloud/zookeeper-3.4.5/tmp

再創(chuàng)建一個空文件

touch /cloud/zookeeper-3.4.5/tmp/myid

最后向該文件寫入ID

echo 1 > /cloud/zookeeper-3.4.5/tmp/myid

3.1.3將配置好的zookeeper拷貝到其他節(jié)點(首先分別在hadoop02、

hadoop03根目錄下創(chuàng)建一個cloud目錄：mkdir /cloud)

scp -r /cloud/zookeeper-3.4.5/ hadoop02:/cloud/

scp -r /cloud/zookeeper-3.4.5/ hadoop03:/cloud/

注意：修改hadoop02、hadoop03對應

/cloud/zookeeper-3.4.5/tmp/myid內容

hadoop02：

echo 2 > /cloud/zookeeper-3.4.5/tmp/myid

hadoop03：

echo 3 > /cloud/zookeeper-3.4.5/tmp/myid

3.2.安裝配置hadoop集群

3.2.1解壓

tar -zxvf hadoop-2.2.0.tar.gz -C /cloud/

3.2.2配置HDFS（hadoop2.0所有的配置文件都在

$HADOOP_HOME/etc/hadoop目錄下）

將hadoop添加到環(huán)境變量中

vim /etc/profile

export JAVA_HOME=/usr/java/jdk1.6.0_45

export HADOOP_HOME=/cloud/hadoop-2.2.0

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

cd /cloud/hadoop-2.2.0/etc/hadoop

3.2.2.1修改hadoo-env.sh

export JAVA_HOME=/usr/java/jdk1.6.0_45

3,2.2.2修改core-site.xml

fs.defaultFS

hdfs://ns1

hadoop.tmp.dir

/cloud/hadoop-2.2.0/tmp

ha.zookeeper.quorum

hadoop01:2181,hadoop02:2181,hadoop03:2181

3,2.2.3修改hdfs-site.xml

dfs.nameservices

ns1

dfs.ha.namenodes.ns1

nn1,nn2

dfs.namenode.rpc-address.ns1.nn1

hadoop01:9000

dfs.namenode.http-address.ns1.nn1

hadoop01:50070

dfs.namenode.rpc-address.ns1.nn2

hadoop02:9000

dfs.namenode.http-address.ns1.nn2

hadoop02:50070

dfs.namenode.shared.edits.dir

qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/ns1

dfs.journalnode.edits.dir

/cloud/hadoop-2.2.0/journal

dfs.ha.automatic-failover.enabled

true

dfs.client.failover.proxy.provider.ns1

org.apache.hadoop.hdfs.server.namenode.ha.

ConfiguredFailoverProxyProvider

dfs.ha.fencing.methods

sshfence

dfs.ha.fencing.ssh.private-key-files

/root/.ssh/id_rsa

3.2.2.4修改slaves

hadoop01

hadoop02

hadoop03

3.2.3配置YARN

3.2.3.1修改yarn-site.xml

yarn.resourcemanager.hostname

hadoop01

yarn.nodemanager.aux-services

mapreduce_shuffle

3.2.3.2修改mapred-site.xml

mapreduce.framework.name

yarn

3.2.4將配置好的hadoop拷貝到其他節(jié)點

scp -r /cloud/hadoop-2.2.0/ hadoo02:/cloud/

scp -r /cloud/hadoop-2.2.0/ hadoo03:/cloud/

3.2.5啟動zookeeper集群

（分別在hadoop01、hadoop02、hadoop03上啟動zk）

cd /cloud/zookeeper-3.4.5/bin/

./zkServer.sh start

查看狀態(tài)：

./zkServer.sh status

（一個leader，兩個follower）

3.2.6啟動journalnode（在hadoop01上啟動所有journalnode）

cd /cloud/hadoop-2.2.0

sbin/hadoop-daemons.sh start journalnode

(運行jps命令檢驗，多了JournalNode進程)

3.2.7格式化HDFS

在hadoop01上執(zhí)行命令:

hadoop namenode -format

格式化后會在根據core-site.xml中的hadoop.tmp.dir

配置生成個文件，這里我配置的是/cloud/hadoop-2.2.0/tmp，

然后將/cloud/hadoop-2.2.0/tmp拷貝到hadoop02的

/cloud/hadoop-2.2.0/下。

scp -r tmp/ hadoop02:/cloud/hadoop-2.2.0/

3.2.8格式化ZK(在hadoop01上執(zhí)行即可)

hdfs zkfc -formatZK

3.2.9啟動HDFS(在hadoop01上執(zhí)行)

sbin/start-dfs.sh

3.3.10啟動YARN(在hadoop01上執(zhí)行)

sbin/start-yarn.sh

到此，hadoop2.2.0配置完畢，可以統(tǒng)計瀏覽器訪問:

http://192.168.1.201:50070

NameNode 'hadoop01:9000' (active)

http://192.168.1.202:50070

NameNode 'hadoop02:9000' (standby)

驗證HDFS HA

首先向hdfs上傳一個文件

hadoop fs -put /etc/profile /profile

hadoop fs -ls /

然后再kill掉active的NameNode

kill -9

通過瀏覽器訪問：http://192.168.1.202:50070

NameNode 'hadoop02:9000' (active)

這個時候hadoop02上的NameNode變成了active

在執(zhí)行命令：

hadoop fs -ls /

-rw-r--r-- 3 root supergroup 1926 2014-02-06 15:36 /profile

剛才上傳的文件依然存在?。?！

手動啟動那個掛掉的NameNode

sbin/hadoop-daemon.sh start namenode

通過瀏覽器訪問：http://192.168.1.201:50070

NameNode 'hadoop01:9000' (standby)

驗證YARN：

運行一下hadoop提供的demo中的WordCount程序：

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce

-examples-2.2.0.jar wordcount /profile /out

OK，大功告成！?。?/p>

感謝各位的閱讀，以上就是“hadoop2.0集群的搭建方法”的內容了，經過本文的學習后，相信大家對hadoop2.0集群的搭建方法這一問題有了更深刻的體會，具體使用情況還需要大家實踐驗證。這里是創(chuàng)新互聯，小編將為大家推送更多相關知識點的文章，歡迎關注！

網頁題目：hadoop2.0集群的搭建方法
當前地址：http://weahome.cn/article/ijpgig.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

hadoop2.0集群的搭建方法

其他資訊

網站制作

企業(yè)服務

網站建設

服務器托管