原文鏈接:http://www.datastudy.cc/to/17
創(chuàng)新互聯(lián)建站客戶idc服務中心,提供服務器托管、成都服務器、成都主機托管、成都雙線服務器等業(yè)務的一站式服務。通過各地的服務中心,我們向成都用戶提供優(yōu)質廉價的產品以及開放、透明、穩(wěn)定、高性價比的服務,資深網絡工程師在機房提供7*24小時標準級技術保障。很多時候,我們拿到的數據,都是匯總的一份數據,例如我們示例中的數據,已經把所有倉庫的數據都匯總起來了。
但是我們在統(tǒng)計建模的時候,如果想要把他們拆分開來進行處理,那么如何進行分層處理呢?其實非常簡單,我們使用split函數即可。
split(x, f, drop = FALSE, ...)
下面我們來看分層處理的案例:
數據請從百度盤下載:
鏈接: http://pan.baidu.com/s/1kFxoy 密碼: tnbf
data <- read.csv("D:\\data\\20150922\\data.csv", fileEncoding="UTF8", stringsAsFactors=FALSE)
datas <- split(data, data$倉庫)
result <- c();
for(d in datas) {
#這里執(zhí)行我們需要的建模,
#我這里演示就用了個計算平均數
m <- mean(d$進價);
#把建模后的模型加入到結果數組中
result <- append(result, m)
}
result
以上就是分層處理的最基本模型,包括分層抽取數據,以及將處理后的結果組裝成為一個向量返回。
另外有需要云服務器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。