這篇文章將為大家詳細(xì)講解有關(guān)如何進(jìn)行R語(yǔ)言中的缺失值分析,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對(duì)相關(guān)知識(shí)有一定的了解。
成都創(chuàng)新互聯(lián)2013年至今,先為尼勒克等服務(wù)建站,尼勒克等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢(xún)服務(wù)。為尼勒克企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問(wèn)題。
mice函數(shù)中的md.pattern()函數(shù)可生成一個(gè)以矩陣貨數(shù)據(jù)框形式展示缺失值模式的表格,將函數(shù)運(yùn)用到sleep數(shù)據(jù)集中:
> library(mice)
> data(sleep,package="VIM")
> md.pattern(sleep)
BodyWgt BrainWgt Pred Exp Danger Sleep Span Gest Dream NonD 運(yùn)行結(jié)果可知,0表示變量列中有缺失值,1表示變量列中缺失值,第一行表示無(wú)缺失值,第二行表示除了span之外無(wú)缺失值,第一列表示各個(gè)缺失值模式實(shí)例個(gè)數(shù),最后一列表示各模式中有缺失值的變量個(gè)數(shù)。可看到,sleep數(shù)據(jù)集有42例沒(méi)有缺失值,僅2個(gè)實(shí)例缺失span,9個(gè)實(shí)例同時(shí)缺失NanD和Dream,數(shù)據(jù)集總共包含42x0+2x1+.....1x3=38個(gè)缺失值
aggr()函數(shù)不僅僅繪制每個(gè)變量的缺失值數(shù),而且繪制每個(gè)變量組合的缺失值數(shù),代碼:
>library(VIM)
> aggr(sleep,prop=FALSE,numbers=TRUE)
運(yùn)行結(jié)果:
左邊的圖可知缺失值數(shù)量,NonD有最大的缺失值數(shù)14個(gè),右邊的圖顯示有2個(gè)哺乳動(dòng)物缺失NonD、Dream、Sleep評(píng)分。42個(gè)動(dòng)物沒(méi)有缺失值。
> aggr(sleep, prop = TRUE, numbers = TRUE)#生成相同圖形,但是用比例取代計(jì)數(shù), numbers = FALSE默認(rèn)時(shí)刪去數(shù)值型標(biāo)簽。
> matrixplot(sleep)
運(yùn)行結(jié)果如下:
數(shù)值型的數(shù)量被轉(zhuǎn)換到[0,1]區(qū)間,利用灰度表示,顏色淺表示數(shù)值小,深色表示數(shù)值大,紅色表示缺失值。
>marginplot(sleep[c("Gest","Dream")],pch=c(20),col=c("darkgray","red","blue"))#做夢(mèng)時(shí)間和哺乳動(dòng)物妊娠時(shí)間的關(guān)系,pch和col是繪制圖形的符號(hào)和顏色
運(yùn)行結(jié)果如下:圖形的主體是Gest和Dream(兩個(gè)變量數(shù)據(jù)都完整)的散點(diǎn)圖。左邊的箱線圖展示的是 (深灰色 )與不包括 ( 紅色 )Gest 的Dream變量分布。注意,在灰度圖上紅色是更深的陰影。 四個(gè)紅點(diǎn)代表缺失了Gest得分的Dream值。在底部邊界上,可以看到,妊娠期和做夢(mèng)時(shí)長(zhǎng)呈現(xiàn)負(fù)相關(guān),缺失妊娠期數(shù)據(jù)時(shí)動(dòng)物的做夢(mèng)時(shí)長(zhǎng)一般更長(zhǎng)。兩個(gè)變量均有缺失值的觀測(cè)個(gè)數(shù)在兩邊界交叉處 (左下角 )藍(lán)色標(biāo)出。
關(guān)于如何進(jìn)行R語(yǔ)言中的缺失值分析就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。