Hive常用命令及設置
創(chuàng)新互聯(lián)是一家集網(wǎng)站建設,紅花崗企業(yè)網(wǎng)站建設,紅花崗品牌網(wǎng)站建設,網(wǎng)站定制,紅花崗網(wǎng)站建設報價,網(wǎng)絡營銷,網(wǎng)絡優(yōu)化,紅花崗網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。
alter table ad_app.app_accounting_daily add columns (return_cost bigint) cascade;
數(shù)據(jù)傾斜
set hive.map.aggr=true;
set hive.groupby.skewindata=true;
set mapreduce.job.queuename = root.data.adonline;
set mapred.reduce.tasks=8192;
set mapreduce.job.priority=VERY_HIGH;
Set hive.groupby.mapaggr.checkinterval = 100000
set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;
set mapred.map.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;
set hive.exec.compress.intermediate=true;
set mapred.compress.map.output=true;
set mapred.max.split.size=256000000; -- 決定每個map處理的最大的文件大小,單位為B
set mapred.min.split.size.per.node=1; -- 節(jié)點中可以處理的最小的文件大小
set mapred.min.split.size.per.rack=1;
控制map數(shù)量
set mapred.max.split.size=128000000;
set mapred.min.split.size.per.node=64000000;
set mapred.min.split.size.per.rack=64000000;
set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;
設置reducer最大個數(shù)
set hive.exec.reducers.max=8192;
控制map reduce內(nèi)存
set mapreduce.map.memory.mb=4096;
set mapreduce.reduce.memory.mb=4096;
set mapreduce.reduce.java.opts=-Xmx3800M;
set mapred.child.map.java.opts=-Xmx3800M;
set mapreduce.map.java.opts=-Xmx3800M;
ALTER TABLE table_name ADD IF NOT EXISTS PARTITION (dt='20130101') LOCATION '/user/hadoop/warehouse/table_name/dt=20130101'; //一次添加一個分區(qū)