真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

Hadoop單服務(wù)下偽分布式集群如何搭建

這篇文章主要介紹“Hadoop單服務(wù)下偽分布式集群如何搭建”,在日常操作中,相信很多人在Hadoop單服務(wù)下偽分布式集群如何搭建問題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”Hadoop單服務(wù)下偽分布式集群如何搭建”的疑惑有所幫助!接下來,請(qǐng)跟著小編一起來學(xué)習(xí)吧!

創(chuàng)新互聯(lián)專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于成都做網(wǎng)站、網(wǎng)站建設(shè)、牧野網(wǎng)絡(luò)推廣、小程序制作、牧野網(wǎng)絡(luò)營(yíng)銷、牧野企業(yè)策劃、牧野品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運(yùn)營(yíng)等,從售前售中售后,我們都將竭誠(chéng)為您服務(wù),您的肯定,是我們最大的嘉獎(jiǎng);創(chuàng)新互聯(lián)為所有大學(xué)生創(chuàng)業(yè)者提供牧野建站搭建服務(wù),24小時(shí)服務(wù)熱線:18980820575,官方網(wǎng)址:www.cdcxhl.com

一、基礎(chǔ)環(huán)境

1、環(huán)境版本

環(huán)境:centos7
hadoop版本:2.7.2
jdk版本:1.8

2、Hadoop目錄結(jié)構(gòu)

  • bin目錄:存放對(duì)Hadoop的HDFS,YARN服務(wù)進(jìn)行操作的腳本

  • etc目錄:Hadoop的相關(guān)配置文件目錄

  • lib目錄:存放Hadoop的本地庫,提供數(shù)據(jù)壓縮解壓縮能力

  • sbin目錄:存放啟動(dòng)或停止Hadoop相關(guān)服務(wù)的腳本

  • share目錄:存放Hadoop的依賴jar包、文檔、和相關(guān)案例

3、配置加載

vim /etc/profile
# 添加環(huán)境
export JAVA_HOME=/opt/jdk1.8
export PATH=$PATH:$JAVA_HOME/bin
export HADOOP_HOME=/opt/hadoop2.7
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

# 退出刷新配置
source /etc/profile

二、偽集群配置

以下配置文件所在路徑:/opt/hadoop2.7/etc/hadoop,這里是Linux環(huán)境,腳本配置sh格式。

1、配置hadoop-env

root# vim hadoop-env.sh
# 修改前
export JAVA_HOME=
# 修改后
export JAVA_HOME=/opt/jdk1.8

2、配置core-site

文件結(jié)構(gòu)概覽




NameNode的地址


    fs.defaultFS
    hdfs://127.0.0.1:9000

數(shù)據(jù)存放目錄:Hadoop運(yùn)行時(shí)產(chǎn)生文件的存儲(chǔ)目錄。


    hadoop.tmp.dir
    /opt/hadoop2.7/data/tmp

3、配置hdfs-site

文件結(jié)構(gòu)和上述一樣,配置hdfs副本個(gè)數(shù),這里偽環(huán)境,配置1個(gè)即可。


    dfs.replication
    1

4、配置yarn-env

export JAVA_HOME=/opt/jdk1.8

5、配置yarn-site

指定YARN的ResourceManager的地址


    yarn.resourcemanager.hostname
    192.168.72.132

指定map產(chǎn)生的中間結(jié)果傳遞給reduce采用的機(jī)制是shuffle


    yarn.nodemanager.aux-services
    mapreduce_shuffle

6、配置mapred-env

export JAVA_HOME=/opt/jdk1.8

7、配置mapred-site

將mapred-site.xml.template重新命名為mapred-site.xml。

指定MapReduce程序資源調(diào)在度集群上運(yùn)行。如果不指定為yarn,那么MapReduce程序就只會(huì)在本地運(yùn)行而非在整個(gè)集群中運(yùn)行。


    mapreduce.framework.name
    yarn

三、環(huán)境啟動(dòng)測(cè)試

1、測(cè)試文件系統(tǒng)

Hdfs相關(guān)

格式化NameNode

第一次啟動(dòng)時(shí)執(zhí)行該操作。

[hadoop2.7]# bin/hdfs namenode -format

格式化NameNode,會(huì)產(chǎn)生新的clusterID,導(dǎo)致NameNode和DataNode的集群id不一致,集群找不到已往數(shù)據(jù)。所以,格式NameNode時(shí),一定要停止相關(guān)進(jìn)程,刪除data數(shù)據(jù)和log日志,然后再格式化NameNode。clusterID在如下目錄中的VERSION文件里,可自行查看對(duì)比。

/opt/hadoop2.7/data/tmp/dfs/name/current
/opt/hadoop2.7/data/tmp/dfs/data/current

啟動(dòng)NameNode

[hadoop2.7]# sbin/hadoop-daemon.sh start namenode

啟動(dòng)DataNode

[hadoop2.7]# sbin/hadoop-daemon.sh start datanode

jps查看狀態(tài)

[root@localhost hadoop2.7]# jps
2450 Jps
2276 NameNode
2379 DataNode

Web界面查看

需要Linux關(guān)閉防火墻和相關(guān)安全增強(qiáng)控制(這里很重要)。

IP地址:50070

Hadoop單服務(wù)下偽分布式集群如何搭建

Yarn相關(guān)

啟動(dòng)ResourceManager

[hadoop2.7]# sbin/yarn-daemon.sh start resourcemanager

啟動(dòng)NodeManager

[hadoop2.7]# sbin/yarn-daemon.sh start nodemanager

Web界面查看

IP地址:8088/cluster

Hadoop單服務(wù)下偽分布式集群如何搭建

MapReduce相關(guān)

文件操作測(cè)試

創(chuàng)建一個(gè)測(cè)試文件目錄

[root@localhost inputfile]# pwd
/opt/inputfile
[root@localhost inputfile]# echo "hello word hadoop" > word.txt

HDFS文件系統(tǒng)上創(chuàng)建文件夾

[hadoop2.7] bin/hdfs dfs -mkdir -p /opt/upfile/input

上傳文件

[hadoop2.7]# bin/hdfs dfs -put /opt/inputfile/word.txt /opt/upfile/input

查看文件

[hadoop2.7]# bin/hdfs dfs -ls /opt/upfile/input

2、Web端查看文件

Hadoop單服務(wù)下偽分布式集群如何搭建

執(zhí)行文件分析

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /opt/upfile/input /opt/upfile/output

查看分析結(jié)果

bin/hdfs dfs -cat /opt/upfile/output/*

結(jié)果:每個(gè)單詞各自出現(xiàn)一次。

刪除分析結(jié)果

bin/hdfs dfs -rm -r /opt/upfile/output

四、歷史服務(wù)器

MapReduce的JobHistoryServer,這是一個(gè)獨(dú)立的服務(wù),可通過 web UI 展示歷史作業(yè)日志。

1、修改mapred-site



mapreduce.jobhistory.address
192.168.72.132:10020




    mapreduce.jobhistory.webapp.address
    192.168.72.132:19888

2、啟動(dòng)服務(wù)

[hadoop2.7]# sbin/mr-jobhistory-daemon.sh start historyserver

3、Web端查看

IP地址:19888

Hadoop單服務(wù)下偽分布式集群如何搭建

4、配置日志的聚集

日志聚集概念:應(yīng)用服務(wù)運(yùn)行完成以后,將運(yùn)行日志信息上傳到HDFS系統(tǒng)上。方便的查看到程序運(yùn)行詳情,方便開發(fā)調(diào)試。

開啟日志聚集功能之后,需要重新啟動(dòng)NodeManager 、ResourceManager和HistoryManager。

關(guān)閉上述服務(wù)

[hadoop2.7]# sbin/yarn-daemon.sh stop resourcemanager
[hadoop2.7]# sbin/yarn-daemon.sh stop nodemanager
[hadoop2.7]# sbin/mr-jobhistory-daemon.sh stop historyserver

修改yarn-site



yarn.log-aggregation-enable
true




yarn.log-aggregation.retain-seconds
604800

修改完之后再次啟動(dòng)上述服務(wù)器。再次執(zhí)行文件分析任務(wù)。

查看Web端

Hadoop單服務(wù)下偽分布式集群如何搭建

Hadoop單服務(wù)下偽分布式集群如何搭建

到此,關(guān)于“Hadoop單服務(wù)下偽分布式集群如何搭建”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!


分享名稱:Hadoop單服務(wù)下偽分布式集群如何搭建
當(dāng)前地址:http://weahome.cn/article/jspcje.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部