本篇文章給大家分享的是有關(guān)如何分析大數(shù)據(jù)中數(shù)據(jù)的對(duì)象類型及文件的讀入輸出,小編覺(jué)得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說(shuō),跟著小編一起來(lái)看看吧。
永豐網(wǎng)站制作公司哪家好,找創(chuàng)新互聯(lián)!從網(wǎng)頁(yè)設(shè)計(jì)、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、成都響應(yīng)式網(wǎng)站建設(shè)公司等網(wǎng)站項(xiàng)目制作,到程序開發(fā),運(yùn)營(yíng)維護(hù)。創(chuàng)新互聯(lián)從2013年成立到現(xiàn)在10年的時(shí)間,我們擁有了豐富的建站經(jīng)驗(yàn)和運(yùn)維經(jīng)驗(yàn),來(lái)保證我們的工作的順利進(jìn)行。專注于網(wǎng)站建設(shè)就選創(chuàng)新互聯(lián)。
一、對(duì)象類型:
包括標(biāo)量、向量、矩陣、數(shù)組、數(shù)據(jù)框和列表。
1)向量(vector):用于存儲(chǔ)數(shù)值型、字符型或邏輯型數(shù)據(jù)的一維數(shù)組。函數(shù)c()用來(lái)創(chuàng)建向量:
示例如下:
a <- c(1:10) b <- c("A","B") d <- c(TRUE,FALSE)
注:?jiǎn)蝹€(gè)向量中的數(shù)據(jù)必須擁有相同的類型或模式(數(shù)值型、字符型或邏輯型)。
2)矩陣:二維數(shù)組,每個(gè)元素都擁有相同的模式(數(shù)值型、字符型或邏輯型)。函數(shù)matrix創(chuàng)建矩陣:
myymatrix <- matrix(vector, nrow=number_of_rows, ncol=number_of_columns,byrow=logical_value, dimnames=list(char_vector_rownames, char_vector_colnames))
其中:vector包含了矩陣的元素, nrow和ncol用以指定行和列的維數(shù), dimnames包含了可選的、以字符型向量表示的行名和列名。默認(rèn)情況按列填充。
示例如下:
mymatrix <- matrix(1:4, nrow=2, ncol=2, byrow=FALSE,dimnames=list(c("R1","R2"),c("C1","C2"))) C1 C2R1 1 3R2 2 4
3)數(shù)組(array):與矩陣類似,維度可以大于2。array函數(shù)創(chuàng)建:
myarray <- array(vector, dimensions, dimnames)
其中:vector包含了數(shù)組中的數(shù)據(jù),dimensions是一個(gè)數(shù)值型向量,給出了各個(gè)維度下標(biāo)的最大值,而dimnames是可選的、各維度名稱標(biāo)簽的列表
示例如下:
myarray <- array(1:24, c(2, 3, 4), dimnames=list(c("A1", "A2"), c("B1", "B2", "B3"), c("C1", "C2", "C3", "C4")))
4)數(shù)據(jù)框(data.frame):不同的列可以包含不同模式(數(shù)值型、字符型等)的數(shù)據(jù),很重要!data.frame()創(chuàng)建:
mydata <- data.frame(col1, col2, col3,…)
其中的列向量col1, col2, col3,… 可為任何類型(如字符型、數(shù)值型或邏輯型)。每一列的名稱可由函數(shù)names指定
示例如下:
patientID <- c(1, 2, 3, 4)
age <- c(25, 34, 28, 52)
diabetes <- c("Type1", "Type2", "Type1", "Type1")
status <- c("Poor", "Improved", "Excellent", "Poor")
patientdata <- data.frame(patientID, age, diabetes, status)
patientID age diabetes status
1 1 25 Type1 Poor
2 2 34 Type2 Improved
3 3 28 Type1 Excellent
4 4 52 Type1 Poor
是不是和EXCEL內(nèi)容很像,所以重要?。?/p>
5)因子(factor):類別(名義型)變量和有序類別(有序型)變量在R中稱為因子(factor),繪圖時(shí)候重要。
6)列表(list)是R的數(shù)據(jù)類型中最為復(fù)雜的一種。一般來(lái)說(shuō),列表就是一些對(duì)象(或成分,component)的有序集合。列表允許你整合若干(可能無(wú)關(guān)的)對(duì)象到單個(gè)對(duì)象名下。函數(shù)list()創(chuàng)建:
mylist <- list(object1, object2, …)
示例如下:
g <- "My First List"h <- c(25, 26, 18, 39)j <- matrix(1:10, nrow=5)k <- c("one", "two", "three")mylist <- list(title=g, ages=h, j, k)
二、數(shù)據(jù)下標(biāo)
注:第一個(gè)元素下標(biāo)從1開始!
1)向量:a[2];d[1]
2)矩陣:使用下標(biāo)和方括號(hào)來(lái)選擇矩陣中的行、 列或元素。X[i,]指矩陣X中的第i 行,X[,j]指第j 列, X[i, j]指第i 行第j 個(gè)元素。選擇多行或多列時(shí),下標(biāo)i 和j 可為數(shù)值型向量。
3)數(shù)組:從數(shù)組中選取元素的方式與矩陣相同
4)數(shù)據(jù)框:可以使用前述(如矩陣中的)下標(biāo)記號(hào),亦可直接指定列名。
patientdata$age && patientdata[,2] 一樣的結(jié)果
另:在每個(gè)變量名前都鍵入一次patientdata$麻煩,可以走一些捷徑。聯(lián)合使用函數(shù)attach()和detach()或單獨(dú)使用函數(shù)with()來(lái)簡(jiǎn)化代碼;
示例如下:
attach(mtcars) #函數(shù)attach()可將數(shù)據(jù)框添加到R的搜索路徑中
summary(mpg) #檢查搜索路徑中的數(shù)據(jù)框,以定位到這個(gè)變量
plot(mpg, disp)
detach(mtcars) #函數(shù)detach()將數(shù)據(jù)框從搜索路徑中移除
with(mtcars, {
nokeepstats <- summary(mpg)
keepstats <<- summary(mpg) #使用特殊賦值符<<-替代標(biāo)準(zhǔn)賦值符(<-)即可,它可將對(duì)象保存到with()之外的全局環(huán)境中。
})
#查看nokeepstats 和 keepstats 的區(qū)別:
nokeepstats
Error: object 'nokeepstats' not found
keepstats
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
5)列表:雙重方括號(hào)中指明代表某個(gè)成分的數(shù)字或名稱來(lái)訪問(wèn)列表中的元素。
mylist[[2]]和mylist[["ages"]]均指那個(gè)含有四個(gè)元素的向量mylist[[2]][1] 25 26 18 39mylist[["ages"]][1] 25 26 18 39
三、數(shù)據(jù)讀入與寫入:
1)使用read.table()從帶分隔符的文本文件中導(dǎo)入數(shù)據(jù)。
mydataframe <- read.table(file, header=logical_value,sep="delimiter", row.names="name")
注1:help(read.table):更多詳情
注2:stringsAsFactors=FALSE,可禁止將字符型變量將轉(zhuǎn)換為因子。
2)使用read.csv()導(dǎo)入csv(excel)數(shù)據(jù)。
3)write.table , write.csv 輸出R結(jié)果到文件中.
以上就是如何分析大數(shù)據(jù)中數(shù)據(jù)的對(duì)象類型及文件的讀入輸出,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見到或用到的。希望你能通過(guò)這篇文章學(xué)到更多知識(shí)。更多詳情敬請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。