國外技術(shù)大牛為AI瓶頸提供突破性的想法

機(jī)器學(xué)習(xí)的進(jìn)步，無人駕駛汽車背后的人工智能形式以及許多其他高科技應(yīng)用已經(jīng)引領(lǐng)了計(jì)算的新時(shí)代，這是以數(shù)據(jù)為中心的時(shí)代，并迫使工程師們重新考慮計(jì)算架構(gòu)的各個(gè)方面在過去的75年中，這些技術(shù)幾乎沒有受到挑戰(zhàn)。

云巖網(wǎng)站制作公司哪家好，找創(chuàng)新互聯(lián)！從網(wǎng)頁設(shè)計(jì)、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、自適應(yīng)網(wǎng)站建設(shè)等網(wǎng)站項(xiàng)目制作，到程序開發(fā)，運(yùn)營維護(hù)。創(chuàng)新互聯(lián)從2013年成立到現(xiàn)在10年的時(shí)間，我們擁有了豐富的建站經(jīng)驗(yàn)和運(yùn)維經(jīng)驗(yàn)，來保證我們的工作的順利進(jìn)行。專注于網(wǎng)站建設(shè)就選創(chuàng)新互聯(lián)。

“問題在于，對(duì)于當(dāng)今機(jī)器學(xué)習(xí)最先進(jìn)的大規(guī)模深度神經(jīng)網(wǎng)絡(luò)而言，運(yùn)行整個(gè)系統(tǒng)所需的90％以上的電力都消耗在存儲(chǔ)器和處理器之間的數(shù)據(jù)移動(dòng)中”，電氣與計(jì)算機(jī)工程學(xué)助理教授林穎妍說。

Lin和合作者提出了兩種互補(bǔ)的方法來優(yōu)化以數(shù)據(jù)為中心的處理，這兩種方法都在6月3日的國際計(jì)算機(jī)體系結(jié)構(gòu)研討會(huì)（ISCA）上進(jìn)行了介紹，這是有關(guān)計(jì)算機(jī)體系結(jié)構(gòu)新思想和研究的主要會(huì)議之一。

以數(shù)據(jù)為中心的體系結(jié)構(gòu)的驅(qū)動(dòng)與一個(gè)稱為von Neumann瓶頸的問題有關(guān)，這種效率低下的原因是自數(shù)學(xué)家約翰馮諾伊曼于1945年發(fā)明內(nèi)存以來，計(jì)算結(jié)構(gòu)中內(nèi)存和處理的分離一直占主導(dǎo)地位。從程序和數(shù)據(jù)來看，馮諾依曼架構(gòu)使單臺(tái)計(jì)算機(jī)具有難以置信的通用性。根據(jù)從內(nèi)存中加載的存儲(chǔ)程序，可以使用計(jì)算機(jī)進(jìn)行視頻通話，準(zhǔn)備電子表格或模擬火星上的天氣。

但是將內(nèi)存與處理分開也意味著即使簡單的操作（如加2加2）也需要計(jì)算機(jī)的處理器多次訪問內(nèi)存。深度神經(jīng)網(wǎng)絡(luò)中的大量操作使該存儲(chǔ)瓶頸變得更糟，深度神經(jīng)網(wǎng)絡(luò)是通過“研究”大量先前示例來學(xué)習(xí)做出人性化決策的系統(tǒng)。網(wǎng)絡(luò)越大，它可以完成的任務(wù)就越困難，并且顯示的網(wǎng)絡(luò)示例越多，它的執(zhí)行效果就越好。深度神經(jīng)網(wǎng)絡(luò)培訓(xùn)可能需要專門的處理器庫，這些處理器需要全天候運(yùn)行一周以上。在智能手機(jī)上基于學(xué)習(xí)到的網(wǎng)絡(luò)執(zhí)行任務(wù)（稱為推理）可以在不到一個(gè)小時(shí)的時(shí)間內(nèi)耗盡電池電量。

賴斯的高效和智能計(jì)算（EIC）實(shí)驗(yàn)室主任Lin說：“眾所周知，在機(jī)器學(xué)習(xí)時(shí)代，以數(shù)據(jù)為中心的算法，我們需要?jiǎng)?chuàng)新的以數(shù)據(jù)為中心的硬件架構(gòu)。“但是，機(jī)器學(xué)習(xí)的硬件架構(gòu)是什么？

“沒有一個(gè)萬能的答案，因?yàn)椴煌膽?yīng)用需要機(jī)器學(xué)習(xí)算法，這些算法在算法結(jié)構(gòu)和復(fù)雜性方面可能有很大差異，同時(shí)具有不同的任務(wù)準(zhǔn)確性和資源消耗，例如能源成本，延遲和吞吐量- -權(quán)衡要求，”她說。“許多研究人員正在為此進(jìn)行研究，而英特爾，IBM和Google等大公司都有自己的設(shè)計(jì)。”

Lin小組在ISCA 2020上的演講之一提供了TIMELY的結(jié)果，TIMELY是她和她的學(xué)生為“內(nèi)存中處理”（PIM）開發(fā)的一種創(chuàng)新體系結(jié)構(gòu)，這種非馮諾依曼方法將處理引入內(nèi)存陣列。一種有前途的PIM平臺(tái)是“電阻式隨機(jī)存取存儲(chǔ)器”（ReRAM），這是一種類似于閃存的非易失性存儲(chǔ)器。雖然提出了其他ReRAM PIM加速器架構(gòu)，但Lin表示，在10多個(gè)深度神經(jīng)網(wǎng)絡(luò)模型上進(jìn)行的實(shí)驗(yàn)發(fā)現(xiàn)，TIMELY的能源效率高18倍，并且交付的計(jì)算密度是最有競(jìng)爭(zhēng)力的最新技術(shù)的30倍以上ReRAM PIM加速器。

TIMELY代表“時(shí)域，內(nèi)存中執(zhí)行，LocalitY”，通過消除導(dǎo)致效率低下的主要因素來實(shí)現(xiàn)其性能，這種效率低下是由于頻繁訪問主存儲(chǔ)器以處理中間輸入和輸出以及本地與主存儲(chǔ)器之間的接口而引起的?；貞?。

在主存儲(chǔ)器中，數(shù)據(jù)以數(shù)字方式存儲(chǔ)，但是當(dāng)將其帶入本地存儲(chǔ)器以進(jìn)行內(nèi)存中處理時(shí)，必須將其轉(zhuǎn)換為模擬量。在現(xiàn)在的ReRAM PIM加速器中，結(jié)果值從模擬轉(zhuǎn)換為數(shù)字，然后發(fā)送回主存儲(chǔ)器。如果將它們從主存儲(chǔ)器調(diào)用到本地ReRAM以進(jìn)行后續(xù)操作，它們將再次轉(zhuǎn)換為模擬信號(hào)，依此類推。

通過使用本地存儲(chǔ)器內(nèi)的模擬格式緩沖區(qū)，及時(shí)避免了不必要的訪問主存儲(chǔ)器和接口數(shù)據(jù)轉(zhuǎn)換的開銷。這樣，TIMELY幾乎可以將所需的數(shù)據(jù)保留在本地存儲(chǔ)陣列中，從而大大提高了效率。

該小組在ISCA 2020上提出的第二個(gè)建議是SmartExchange，該設(shè)計(jì)結(jié)合了算法和加速器硬件創(chuàng)新以節(jié)省能源。

“訪問主內(nèi)存（DRAM）的能量要比執(zhí)行計(jì)算多200倍，因此SmartExchange的關(guān)鍵思想是在算法中強(qiáng)制執(zhí)行結(jié)構(gòu)，使我們可以將成本較高的內(nèi)存換成很多，成本更低的計(jì)算，”林說。

她補(bǔ)充說：“例如，我們的算法有1000個(gè)參數(shù)。” “在傳統(tǒng)方法中，我們將所有1,000個(gè)存儲(chǔ)在DRAM中，并根據(jù)計(jì)算需要進(jìn)行訪問。通過SmartExchange，我們搜索以找到這1,000個(gè)中的某些結(jié)構(gòu)。然后，我們只需要存儲(chǔ)10個(gè)，因?yàn)槿绻覀冎浪鼈冎g的關(guān)系， 10和其余的990，我們可以計(jì)算990中的任何一個(gè)，而不必從DRAM調(diào)用它們。

她說：“我們將這10個(gè)稱為“基本”子集，其想法是將它們存儲(chǔ)在靠近處理器的本地位置，以避免或大幅度減少為訪問DRAM支付的費(fèi)用。

研究人員使用SmartExchange算法及其自定義的硬件加速器對(duì)七個(gè)基準(zhǔn)深度神經(jīng)網(wǎng)絡(luò)模型和三個(gè)基準(zhǔn)數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn)。他們發(fā)現(xiàn)，與最新的深度神經(jīng)網(wǎng)絡(luò)加速器相比，該組合將等待時(shí)間減少了多達(dá)19倍。

該研究得到了美國國家科學(xué)基金會(huì)和美國國立衛(wèi)生研究院的支持。

分享名稱：國外技術(shù)大牛為AI瓶頸提供突破性的想法
URL分享：http://weahome.cn/article/chopgh.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

國外技術(shù)大牛為AI瓶頸提供突破性的想法

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管