這篇文章給大家分享的是有關(guān)Python怎么實(shí)現(xiàn)訓(xùn)練集、測(cè)試集隨機(jī)劃分的內(nèi)容。小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過(guò)來(lái)看看吧。
創(chuàng)新互聯(lián)公司是一家專(zhuān)注于成都做網(wǎng)站、成都網(wǎng)站建設(shè)與策劃設(shè)計(jì),源匯網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)公司做網(wǎng)站,專(zhuān)注于網(wǎng)站建設(shè)10多年,網(wǎng)設(shè)計(jì)領(lǐng)域的專(zhuān)業(yè)建站公司;建站業(yè)務(wù)涵蓋:源匯等地區(qū)。源匯做網(wǎng)站價(jià)格咨詢:028-86922220python的五大特點(diǎn):1.簡(jiǎn)單易學(xué),開(kāi)發(fā)程序時(shí),專(zhuān)注的是解決問(wèn)題,而不是搞明白語(yǔ)言本身。2.面向?qū)ο?,與其他主要的語(yǔ)言如C++和Java相比, Python以一種非常強(qiáng)大又簡(jiǎn)單的方式實(shí)現(xiàn)面向?qū)ο缶幊獭?.可移植性,Python程序無(wú)需修改就可以在各種平臺(tái)上運(yùn)行。4.解釋性,Python語(yǔ)言寫(xiě)的程序不需要編譯成二進(jìn)制代碼,可以直接從源代碼運(yùn)行程序。5.開(kāi)源,Python是 FLOSS(自由/開(kāi)放源碼軟件)之一。
隨機(jī)從列表中取出元素:
import random dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]] trainDataSet = random.sample(dataSet, 3)
以下函數(shù),使用于我最近的一個(gè)機(jī)器學(xué)習(xí)的項(xiàng)目,將數(shù)據(jù)集數(shù)據(jù)按照比例隨機(jī)劃分成訓(xùn)練集數(shù)據(jù)和測(cè)試集數(shù)據(jù):
import csv import random def getDataSet(proportion): """ :exception 獲取訓(xùn)練集和測(cè)試集(將數(shù)據(jù)按比例隨機(jī)劃分) :parameter proportion - 測(cè)試集/數(shù)據(jù)集 :return trainDataSet - 訓(xùn)練集 testDataSet - 測(cè)試集 author 肖政宇 modify 2019年5月10日 """ dataSet = open('數(shù)據(jù)集.csv') dataSetReader = csv.reader(dataSet) """ :exception 將數(shù)據(jù)保存到數(shù)組 """ dataSet = [] next(dataSetReader, 'none') # 跳過(guò)表頭 data = next(dataSetReader, 'none') while (data != 'none'): dataSet.append(data) data = next(dataSetReader, 'none') """ :exception 按照比例隨機(jī)劃分出訓(xùn)練集和測(cè)試集 """ dataNumber = dataSet.__len__() # 數(shù)據(jù)集數(shù)據(jù)條數(shù) testNumber = int(dataNumber * proportion) # 測(cè)試集數(shù)據(jù)條數(shù) testDataSet = [] # 測(cè)試數(shù)據(jù)集 trainDataSet = [] # 訓(xùn)練數(shù)據(jù)集 testDataSet = random.sample(dataSet, testNumber) # 測(cè)試集 for testData in testDataSet: # 將已經(jīng)選定的測(cè)試集數(shù)據(jù)從數(shù)據(jù)集中刪除 dataSet.remove(testData) trainDataSet = dataSet # 訓(xùn)練集 return trainDataSet, testDataSet
感謝各位的閱讀!關(guān)于“Python怎么實(shí)現(xiàn)訓(xùn)練集、測(cè)試集隨機(jī)劃分”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專(zhuān)為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。