真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

R語言讀取大數(shù)據(jù)

普通情況下使用scan讀取數(shù)據(jù)

成都創(chuàng)新互聯(lián)專注于臨洮網(wǎng)站建設服務及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供臨洮營銷型網(wǎng)站建設,臨洮網(wǎng)站制作、臨洮網(wǎng)頁設計、臨洮網(wǎng)站官網(wǎng)定制、小程序制作服務,打造臨洮網(wǎng)絡公司原創(chuàng)品牌,更為您提供臨洮網(wǎng)站排名全網(wǎng)營銷落地服務。

x <- scan("D:\\test.txt")

按列讀入,指定數(shù)據(jù)類型

x <- scan("test2dat.txt", what=list("",0,0))  #讀取三列數(shù)據(jù),第一列是字符,第二和第三列是數(shù)值
#以下寫法也可以
x2 <- scan("test2dat.txt", list(name="", num1=0,num2=0)) # 每個list都有個名字,分別為name,num1,num2

可以指定讀取的行數(shù),以下為讀取以逗號分割的csv文件的讀取方法

mydata <- read.table("test_nrow.txt.txt",sep=",", header=TRUE,nrow=5)  #讀取除了表頭之外的5行數(shù)據(jù)

參考: http://www.biostat.jhsph.edu/~rpeng/docs/R-large-tables.html

tab5rows <- read.table("datatable.txt", header = TRUE, nrows = 5)
classes <- sapply(tab5rows, class)
tabAll <- read.table("datatable.txt", header = TRUE, colClasses = classes)

也可以用data.table 讀取大數(shù)據(jù)

install.packages("data.table")
library(data.table)
mydata <- fread("test.table.txt")    #讀取文件時會顯示 Read **.*% of ***** rows, 讀取完畢會有提示
#查看文件的前6行
head(mydata)

參考:http://www.r-bloggers.com/reading-large-data-tables-in-r/

也可以使用ff包

setwd("D:/data test")
library(ff)
ffdf1 <- read.table.ffdf(file = "test.ido", header = TRUE,  sep = "|")

參考: http://stackoverflow.com/questions/11782084/reading-in-large-text-files-in-r

http://www.bytemining.com/wp-content/uploads/2010/08/r_hpc_II.pdf

使用Python打開大數(shù)據(jù)的話,采用mmap

參考: http://stackoverflow.com/questions/11159077/python-load-2gb-of-text-file-to-memory

http://davetang.org/muse/2013/09/03/handling-big-data-in-r/


網(wǎng)站欄目:R語言讀取大數(shù)據(jù)
轉載注明:http://weahome.cn/article/ggsode.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部