Maven 翻譯為”專家”、”內(nèi)行”,是 Apache 下的一個(gè)純 Java 開(kāi)發(fā)的開(kāi)源項(xiàng)目?;陧?xiàng)目對(duì)象模型(Project Object Model 縮寫(xiě):POM)概念,Maven利用一個(gè)中央信息片斷能管理一個(gè)項(xiàng)目的構(gòu)建、報(bào)告和文檔等步驟。Maven 是一個(gè)項(xiàng)目管理工具,可以對(duì) Java 項(xiàng)目進(jìn)行構(gòu)建、依賴管理。
成都創(chuàng)新互聯(lián)公司是一家專業(yè)提供聞喜企業(yè)網(wǎng)站建設(shè),專注與網(wǎng)站設(shè)計(jì)、成都網(wǎng)站制作、html5、小程序制作等業(yè)務(wù)。10年已為聞喜眾多企業(yè)、政府機(jī)構(gòu)等服務(wù)。創(chuàng)新互聯(lián)專業(yè)網(wǎng)絡(luò)公司優(yōu)惠進(jìn)行中。
在開(kāi)發(fā)一些大型項(xiàng)目的時(shí)候,需要用到各種各樣的開(kāi)源包jar,為了方便管理及加載jar,使用maven開(kāi)發(fā)項(xiàng)目可以節(jié)省大量時(shí)間且方便項(xiàng)目移動(dòng)至新的開(kāi)發(fā)環(huán)境。
開(kāi)發(fā)環(huán)境
Maven安裝
我使用的這個(gè)版本的Eclipse已經(jīng)自帶了Maven插件,不需要在自行安裝,因此我也沒(méi)有實(shí)際操作,本文就不介紹如何配置。
至于怎么知道自己使用的Eclipse是否自帶有Maven,可以在Eclipse->Preference->Maven->Installations查看是否有Maven及版本號(hào)。或者直接新建項(xiàng)目查看是否有Maven選項(xiàng)。
構(gòu)建Hadoop環(huán)境
創(chuàng)建Maven項(xiàng)目
打開(kāi)Eclipse,F(xiàn)ile->new->project,選擇Maven,然后下一步next
選擇Creat a simple project,然后下一步next
輸入Group id和artifact id。然后finish。
groupid和artifactId被統(tǒng)稱為“坐標(biāo)”是為了保證項(xiàng)目唯一性而提出的,如果你要把你項(xiàng)目弄到maven本地倉(cāng)庫(kù)去,你想要找到你的項(xiàng)目就必須根據(jù)這兩個(gè)id去查找。
groupId一般分為多個(gè)段,這里我只說(shuō)兩段,第一段為域,第二段為公司名稱。域又分為org、com、cn等等許多,其中org為非營(yíng)利組織,com為商業(yè)組織。舉個(gè)apache公司的tomcat項(xiàng)目例子:這個(gè)項(xiàng)目的groupId是org.apache,它的域是org(因?yàn)閠omcat是非營(yíng)利項(xiàng)目),公司名稱是apache,artigactId是tomcat。
比如我創(chuàng)建一個(gè)項(xiàng)目,我一般會(huì)將groupId設(shè)置為cn.snowin,cn表示域?yàn)橹袊?guó),snowin是我個(gè)人姓名縮寫(xiě),artifactId設(shè)置為testProj,表示你這個(gè)項(xiàng)目的名稱是testProj,依照這個(gè)設(shè)置,你的包結(jié)構(gòu)最后是cn.snowin.testProj打頭。(引自 鏈接 )
完成上述步驟后,就可以在Project Explorer中看到剛剛創(chuàng)建的Maven項(xiàng)目。
增加Hadoop依賴
我使用的Hadoop 2.7版本,以下是我的POM配置文件
4.0.0 practice.hadoop simple-examples 0.0.1-SNAPSHOT jar simple-examples http://maven.apache.org UTF-8 junit junit 4.12 test org.apache.hadoop hadoop-common 2.7.0 org.apache.hadoop hadoop-hdfs 2.7.0 org.apache.hadoop hadoop-client 2.7.0 org.apache.mrunit mrunit 1.1.0 hadoop2 test org.apache.hadoop hadoop-mapreduce-client-core 2.7.0 org.apache.hadoop hadoop-yarn-api 2.7.0 org.apache.hadoop hadoop-auth 2.7.0 org.apache.hadoop hadoop-minicluster 2.7.0 test org.apache.hadoop hadoop-mapreduce-client-jobclient 2.7.0 provided
在Project Explorer中右鍵該項(xiàng)目,選擇build project,Maven就會(huì)根據(jù)POM.xml配置文件下載所需要的jar包。
稍等一段時(shí)間后,就可以看到Maven Dependencies中已經(jīng)下載好的jar包。
hadoop配置文件
運(yùn)行 MapReduce 程序前,務(wù)必將 /usr/local/Cellar/hadoop/2.7.0/libexec/etc/hadoop
中將有修改過(guò)的配置文件(如偽分布式需要core-site.xml 和 hdfs-site.xml),以及l(fā)og4j.properties復(fù)制到 src/main/resources/
MapReduce實(shí)例—WordCount
在 src/main/java/
路徑下,創(chuàng)建java文件,代碼如下
import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; import org.apache.hadoop.util.GenericOptionsParser; public class WordCount { public static class TokenizerMapper extends Mapper
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持創(chuàng)新互聯(lián)。