這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)碛嘘P(guān)MapReduce相關(guān)參數(shù)有哪些,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對(duì)這個(gè)行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名注冊(cè)、網(wǎng)絡(luò)空間、營銷軟件、網(wǎng)站建設(shè)、濱海網(wǎng)站維護(hù)、網(wǎng)站推廣。
MapReduce相關(guān)配置參數(shù)分為兩部分,分別是JobHistory Server和應(yīng)用程序參數(shù),Job History可運(yùn)行在一個(gè)獨(dú)立節(jié)點(diǎn)上,而應(yīng)用程序參數(shù)則可存放在mapred-site.xml中作為默認(rèn)參數(shù),也可以在提交應(yīng)用程序時(shí)單獨(dú)指定,注 意,如果用戶指定了參數(shù),將覆蓋掉默認(rèn)參數(shù)。
以下這些參數(shù)全部在mapred-site.xml中設(shè)置。
1. MapReduce JobHistory相關(guān)配置參數(shù)
在JobHistory所在節(jié)點(diǎn)的mapred-site.xml中配置。
(1) mapreduce.jobhistory.address
參數(shù)解釋:MapReduce JobHistory Server地址。
默認(rèn)值: 0.0.0.0:10020
(2) mapreduce.jobhistory.webapp.address
參數(shù)解釋:MapReduce JobHistory Server Web UI地址。
默認(rèn)值: 0.0.0.0:19888
(3) mapreduce.jobhistory.intermediate-done-dir
參數(shù)解釋:MapReduce作業(yè)產(chǎn)生的日志存放位置。
默認(rèn)值: /mr-history/tmp
(4) mapreduce.jobhistory.done-dir
參數(shù)解釋:MR JobHistory Server管理的日志的存放位置。
默認(rèn)值: /mr-history/done
可在客戶端的mapred-site.xml中配置,作為MapReduce作業(yè)的缺省配置參數(shù)。也可以在作業(yè)提交時(shí),個(gè)性化指定這些參數(shù)。
參數(shù)名稱 | 缺省值 | 說明 |
mapreduce.job.name | 作業(yè)名稱 | |
mapreduce.job.priority | NORMAL | 作業(yè)優(yōu)先級(jí) |
yarn.app.mapreduce.am.resource.mb | 1536 | MR ApplicationMaster占用的內(nèi)存量 |
yarn.app.mapreduce.am.resource.cpu-vcores | 1 | MR ApplicationMaster占用的虛擬CPU個(gè)數(shù) |
mapreduce.am.max-attempts | 2 | MR ApplicationMaster***失敗嘗試次數(shù) |
mapreduce.map.memory.mb | 1024 | 每個(gè)Map Task需要的內(nèi)存量 |
mapreduce.map.cpu.vcores | 1 | 每個(gè)Map Task需要的虛擬CPU個(gè)數(shù) |
mapreduce.map.maxattempts | 4 | Map Task***失敗嘗試次數(shù) |
mapreduce.reduce.memory.mb | 1024 | 每個(gè)Reduce Task需要的內(nèi)存量 |
mapreduce.reduce.cpu.vcores | 1 | 每個(gè)Reduce Task需要的虛擬CPU個(gè)數(shù) |
mapreduce.reduce.maxattempts | 4 | Reduce Task***失敗嘗試次數(shù) |
mapreduce.map.speculative | false | 是否對(duì)Map Task啟用推測執(zhí)行機(jī)制 |
mapreduce.reduce.speculative | false | 是否對(duì)Reduce Task啟用推測執(zhí)行機(jī)制 |
mapreduce.job.queuename | default | 作業(yè)提交到的隊(duì)列 |
mapreduce.task.io.sort.mb | 100 | 任務(wù)內(nèi)部排序緩沖區(qū)大小 |
mapreduce.map.sort.spill.percent | 0.8 | Map階段溢寫文件的閾值(排序緩沖區(qū)大小的百分比) |
mapreduce.reduce.shuffle.parallelcopies | 5 | Reduce Task啟動(dòng)的并發(fā)拷貝數(shù)據(jù)的線程數(shù)目 |
注意,MRv2重新命名了MRv1中的所有配置參數(shù),但兼容MRv1中的舊參數(shù),只不過會(huì)打印一條警告日志提示用戶參數(shù)過期。MapReduce新 舊參數(shù)對(duì)照表可參考Java類org.apache.hadoop.mapreduce.util.ConfigUtil,舉例如下:
過期參數(shù)名 | 新參數(shù)名 |
mapred.job.name | mapreduce.job.name |
mapred.job.priority | mapreduce.job.priority |
mapred.job.queue.name | mapreduce.job.queuename |
mapred.map.tasks.speculative.execution | mapreduce.map.speculative |
mapred.reduce.tasks.speculative.execution | mapreduce.reduce.speculative |
io.sort.factor | mapreduce.task.io.sort.factor |
io.sort.mb | mapreduce.task.io.sort.mb |
上述就是小編為大家分享的MapReduce相關(guān)參數(shù)有哪些了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。