這篇文章將為大家詳細(xì)講解有關(guān)怎樣實(shí)現(xiàn)PIG中COGROUP中的空值驗(yàn)證,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對(duì)相關(guān)知識(shí)有一定的了解。
創(chuàng)新互聯(lián)是專業(yè)的浦江網(wǎng)站建設(shè)公司,浦江接單;提供成都網(wǎng)站制作、網(wǎng)站設(shè)計(jì)、外貿(mào)網(wǎng)站建設(shè),網(wǎng)頁(yè)設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行浦江網(wǎng)站開發(fā)網(wǎng)頁(yè)制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛(ài)的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來(lái)合作!
環(huán)境: 0.10.0
COGROUP : 2+個(gè)關(guān)系中做分組
最近做一個(gè)PIG類的項(xiàng)目,重新看了下PIG,順便做總結(jié)。看到COGROUP時(shí)感覺(jué)有些問(wèn)題
官方:http://pig.apache.org/docs/r0.8.1/piglatin_ref2.html
A = load 'student' as (name:chararray, age:int, gpa:float); B = load 'student' as (name:chararray, age:int, gpa:float); dump B; (joe,18,2.5) (sam,,3.0) (bob,,3.5) X = cogroup A by age, B by age; dump X; (18,{(joe,18,2.5)},{(joe,18,2.5)}) (,{(sam,,3.0),(bob,,3.5)},{}) (,{},{(sam,,3.0),(bob,,3.5)})
很難理解的是為什么age是空的會(huì)有2條數(shù)據(jù)?參考其他博客看下COGROUP的用法,發(fā)現(xiàn)不是這樣。
編碼無(wú)悔博客:http://www.codelast.com/?p=3621
后來(lái)自己造了一批數(shù)據(jù)來(lái)嘗試沒(méi)有空值和有空值的COGROUP.
CA: (jack,32,run) (liza,22,eat) (tom,20,mouse) CB: (jack,32,run) (jerry,10,steal) (tom,20,mouse) COGROUP: (tom,{(tom,20,mouse)},{(tom,20,mouse)}) (jack,{(jack,32,run)},{(jack,32,run)}) (liza,{(liza,22,eat)},{}) (jerry,{},{(jerry,10,steal)})
加一個(gè)有空值的字段。
CA: (jack,32,run) (liza,22,eat) (,20,mouse) CB: (jack,32,run) (jerry,10,steal) (,20,mouse) COGROUP: (jack,{(jack,32,run)},{(jack,32,run)}) (liza,{(liza,22,eat)},{}) (jerry,{},{(jerry,10,steal)}) (,{(,20,mouse)},{}) (,{},{(,20,mouse)})
分別加M和N個(gè)空值字段,數(shù)據(jù)量不會(huì)出現(xiàn)M*N個(gè)空值吧?不是2個(gè)就是個(gè)大坑,會(huì)放大數(shù)據(jù)量。
CA: (jack,32,run) (liza,22,eat) (,200,mouse) (,201,mouse) (,202,mouse) (,203,mouse) (,204,mouse) CB: (jack,32,run) (jerry,10,steal) (,301,mouse) (,302,mouse) (,303,mouse) (,304,mouse) (,305,mouse) (,306,mouse) (,307,mouse) COGROUP: (jack,{(jack,32,run)},{(jack,32,run)}) (liza,{(liza,22,eat)},{}) (jerry,{},{(jerry,10,steal)}) (,{(,200,mouse),(,201,mouse),(,202,mouse),(,203,mouse),(,204,mouse)},{}) (,{},{(,301,mouse),(,302,mouse),(,303,mouse),(,304,mouse),(,305,mouse),(,306,mouse),(,307,mouse)})
關(guān)于怎樣實(shí)現(xiàn)PIG中COGROUP中的空值驗(yàn)證就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。