這篇文章主要介紹pytorch如何使用單個(gè)GPU與多個(gè)GPU進(jìn)行訓(xùn)練與測試,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!
成都創(chuàng)新互聯(lián) - 成都二樞機(jī)房,四川服務(wù)器租用,成都服務(wù)器租用,四川網(wǎng)通托管,綿陽服務(wù)器托管,德陽服務(wù)器托管,遂寧服務(wù)器托管,綿陽服務(wù)器托管,四川云主機(jī),成都云主機(jī),西南云主機(jī),成都二樞機(jī)房,西南服務(wù)器托管,四川/成都大帶寬,服務(wù)器機(jī)柜,四川老牌IDC服務(wù)商如下所示:
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")#第一行代碼 model.to(device)#第二行代碼
首先是上面兩行代碼放在讀取數(shù)據(jù)之前。
mytensor = my_tensor.to(device)#第三行代碼
然后是第三行代碼。這句代碼的意思是將所有最開始讀取數(shù)據(jù)時(shí)的tersor變量copy一份到device所指定的GPU上去,之后的運(yùn)算都在GPU上進(jìn)行。需要注意的是這句話并不像前面的兩行代碼一樣只需要寫一遍,第三行代碼需要寫的次數(shù)就等于需要保存到GPU上的tensor變量個(gè)數(shù);一般情況下這些tensor變量都是最開始讀取數(shù)據(jù)時(shí)的tensor變量,后面所衍生的變量自然也都在GPU之上。
以上是使用單個(gè)GPU的情況。當(dāng)你擁有多個(gè)GPU時(shí),要想使用多個(gè)GPU進(jìn)行訓(xùn)練和測試,需要在第一二行代碼之間插上下面這樣一個(gè)判斷語句,其余的寫法也都是一樣的。
if torch.cuda.device_count() > 1: model = nn.DataParallel(model)
使用多個(gè)GPU的原理就是通過上面這句代碼將model在每個(gè)GPU上分別保存一份,然后對model的輸入tensor進(jìn)行自動(dòng)的分割,每個(gè)GPU計(jì)算tensor的一部分,這樣就能實(shí)現(xiàn)計(jì)算量的平均分配。在每個(gè)model計(jì)算完成之后,DataParallel將這些結(jié)果進(jìn)行收集和融合,之后再將結(jié)果返回。
以上是“pytorch如何使用單個(gè)GPU與多個(gè)GPU進(jìn)行訓(xùn)練與測試”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計(jì)公司行業(yè)資訊頻道!
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。