半導(dǎo)體芯片行業(yè),突然就,刷屏了……
創(chuàng)新互聯(lián)公司專注于岳池網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠(chéng)為您提供岳池營(yíng)銷型網(wǎng)站建設(shè),岳池網(wǎng)站制作、岳池網(wǎng)頁(yè)設(shè)計(jì)、岳池網(wǎng)站官網(wǎng)定制、微信小程序開發(fā)服務(wù),打造岳池網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供岳池網(wǎng)站排名全網(wǎng)營(yíng)銷落地服務(wù)。
川普舉全美國(guó)之力給華為抬咖,這波騷操作著實(shí)令人目瞪狗呆。
不過(guò),在雙方吵著“抱走我家芯片不約”“專注自家、獨(dú)自美麗”的時(shí)候,或許我們可以將目光放在技術(shù)本身,來(lái)聊聊那些必需而重要的芯片產(chǎn)業(yè)布局。
首當(dāng)其沖的,當(dāng)屬同樣“備胎轉(zhuǎn)正”的異構(gòu)計(jì)算了。
我們知道,長(zhǎng)久以來(lái)半導(dǎo)體產(chǎn)業(yè)一般會(huì)專注在幾種芯片上。無(wú)論X86、ARM、RISC,一個(gè)CPU里面的計(jì)算單元都是同樣的架構(gòu)。而所謂異構(gòu),就是將CPU、DSP、GPU、ASIC、FPGA等不同制程架構(gòu)、不同指令集、不同功能的計(jì)算單元,組合起來(lái)形成一個(gè)混合的計(jì)算系統(tǒng)。
異構(gòu)計(jì)算技術(shù)在上世紀(jì)80年代就已經(jīng)誕生的,但這兩年才開始在產(chǎn)業(yè)中顯露鋒芒,并快速取代通用CPU,站上了行業(yè)“C位”。
比如英特爾最新推出的AI平臺(tái),就包含了CPU、GPU、DSP、NNP、FPGA等一系列不同的處理核心。英偉達(dá)的機(jī)器人平臺(tái)Jetson Xavier也包含了6種處理器,GPU/CPU/NPU/NVDLA等/一個(gè)都不能少。
眾多云計(jì)算服務(wù)廠商也相繼升級(jí)了異構(gòu)計(jì)算解決方案。比如上周華為剛剛發(fā)布的數(shù)據(jù)庫(kù)GaussDB產(chǎn)品,就運(yùn)用了X86、ARM、GPU、NPU等多樣算力來(lái)執(zhí)行計(jì)算。
智能手機(jī)SoC也開始在傳統(tǒng)的CPU/GPU/ISP/基帶芯片之外,加入了加速DSP、圖形處理單元NPU等。
那么問(wèn)題來(lái)了,在超級(jí)計(jì)算領(lǐng)域取代了同構(gòu)計(jì)算,成為芯片大廠們爭(zhēng)奪的對(duì)象,異構(gòu)計(jì)算到底憑什么?半導(dǎo)體行業(yè)集體擁抱異構(gòu)計(jì)算的背后,又埋藏著那些老問(wèn)題和新機(jī)遇呢?
WHY:異構(gòu)計(jì)算上位史
先來(lái)解答一個(gè)問(wèn)題,為什么CPU用的好好的,大家突然集體打起了異構(gòu)計(jì)算的主意?
最直接的原因,是計(jì)算密集型領(lǐng)域的快速崛起,面對(duì)計(jì)算需求的爆炸式增長(zhǎng),讓單一芯片越來(lái)越力不從心了。
近幾年,半導(dǎo)體技術(shù)在縱向提速上已經(jīng)達(dá)到了物理極限,處理器性能再也無(wú)法按照摩爾定律(每18個(gè)月就能翻倍)再創(chuàng)輝煌。
英特爾在2016年將研發(fā)周期從兩年延長(zhǎng)到了三年。而受到CPU并行計(jì)算能力的限制,超級(jí)計(jì)算機(jī)常常要并聯(lián)上萬(wàn)顆處理器來(lái)進(jìn)行工作。
另一個(gè)關(guān)鍵影響是,人工智能在計(jì)算場(chǎng)景中越來(lái)越受到重視。尤其是移動(dòng)終端設(shè)備中,AI正在以多種模式出現(xiàn)在應(yīng)用中。除了打電話發(fā)短信等基礎(chǔ)通訊通能之外,還需要處理圖片、娛樂(lè)游戲、高清攝像頭等各種各樣的信息,提供個(gè)性化智能推送、預(yù)測(cè)等服務(wù),這些計(jì)算的需求已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了傳統(tǒng)CPU處理器的能力所及。
對(duì)此,GPU芯片廠商N(yùn)VIDIA直接在2017年提出了半導(dǎo)體產(chǎn)業(yè)的新口號(hào)“摩爾定律已死,人工智能萬(wàn)歲!”(Moore’s Law is dead, long live AI.)。
當(dāng)單一芯片無(wú)法滿足高性能計(jì)算的算力需求,于是,異構(gòu)計(jì)算被時(shí)代選中了……
簡(jiǎn)單總結(jié)一下異構(gòu)計(jì)算“多兵種協(xié)同”的核心優(yōu)勢(shì):
首先最重要的,就是提高了處理效率。
異構(gòu)計(jì)算能夠充分發(fā)揮CPU/GPU在通用計(jì)算上的靈活性,及時(shí)響應(yīng)數(shù)據(jù)處理需求,搭配上FPGA/ASIC等特殊能力,來(lái)充分發(fā)揮協(xié)處理器的效能,根據(jù)特定需求合理地分配計(jì)算資源。
這樣做的好處顯而易見(jiàn),在處理速度和功耗之間找到平衡,達(dá)到高效又省電的效果。
舉個(gè)例子,在智能手機(jī)AI芯片“兩強(qiáng)”高通和麒麟,前者的SoC里面就包括了加速3D的GPU、處理照片的ISP、處理通信的基帶芯片、加速向量計(jì)算的DSP等。麒麟980最新的異構(gòu)計(jì)算架構(gòu),也基于CPU、GPU、NPU、ISP、DDR進(jìn)行了全系統(tǒng)融合優(yōu)化,尋求更強(qiáng)的性能和續(xù)航。
異構(gòu)計(jì)算的另一個(gè)優(yōu)勢(shì),則是成本利好。
由于目前神經(jīng)網(wǎng)絡(luò)算法和與之對(duì)應(yīng)的計(jì)算架構(gòu)層出不窮,如果每逢“上新必剁手”,采用不斷更新ASIC架構(gòu)的方式,最終下沉到用戶和企業(yè)身上,就會(huì)導(dǎo)致使用成本和替換成本過(guò)高。
因此,最好的解決辦法就是將多種計(jì)算架構(gòu)融合在一起,大家集體做功,生命周期就長(zhǎng)的多了,在產(chǎn)業(yè)落地上具有更大的優(yōu)勢(shì)。
除了對(duì)硬件性能和產(chǎn)業(yè)應(yīng)用的強(qiáng)勢(shì)提升,異構(gòu)計(jì)算還有一個(gè)更深層次的價(jià)值,就是在單個(gè)國(guó)產(chǎn)同構(gòu)芯片水平暫時(shí)落后于國(guó)際水平的情況下,極有可能成為中國(guó)芯片彎道超車的歷史機(jī)遇。
HOW:異構(gòu)到底怎么構(gòu)?
既然異構(gòu)計(jì)算無(wú)論是從國(guó)家戰(zhàn)略層面還是個(gè)人應(yīng)用上都無(wú)比重要,那么,將不同類型的芯片放在一起,到底該怎么構(gòu)呢?
體現(xiàn)在硬件上,目前主要集中發(fā)展兩種模式:一種是芯片級(jí)(SoC)異構(gòu)計(jì)算,比如英特爾的KabyLake-G平臺(tái),就是將英特爾處理器與AMD Radeon RX Vega M GPU進(jìn)行異構(gòu)。華為去年推出的Kirin 970,就是在CPU和GPU的的基礎(chǔ)上,集成了專門為深度學(xué)習(xí)定制的NPU,來(lái)進(jìn)行推理等高密度計(jì)算。
另一種則是英特爾提出的超異構(gòu)計(jì)算。通過(guò)EMIB、Foveros等封裝技術(shù),將經(jīng)過(guò)性能驗(yàn)證的小芯片裝配到一個(gè)封裝模塊之中。
去年,英特爾就公布了一塊集成了英特爾10nm IceLake CPU和22nm Atom小核心的異構(gòu)主板芯片LakeField。 將高負(fù)載和低負(fù)載兩種處理核心集成在一起,在尺寸上又比簡(jiǎn)單粗暴的板卡式集成小很多。
從硬件解決方案上看,異構(gòu)計(jì)算就是各個(gè)處理核心之間的排列組合嘛,好像和搭積木的技術(shù)難度差不多。不過(guò),想要搭建一個(gè)理想的協(xié)處理器,里面還是有不少竅門的。
作為前提,就要要了解各個(gè)處理器的具體能力,然后根據(jù)為性能、功耗、價(jià)格、效能等, 做出獨(dú)家 產(chǎn)品 。
通常情況下,異構(gòu)計(jì)算會(huì)選擇CPU、GPU、FPGA、ASIC來(lái)進(jìn)行排列組合。他們分別有什么優(yōu)勢(shì)呢?
穩(wěn)定多能便宜大碗的CPU,就是計(jì)算一塊磚,哪有需要往哪搬,是所有異構(gòu)方案中都不能舍棄的。
那么,選誰(shuí)跟它組cp就成了差異化的關(guān)鍵。
其中,GPU能夠執(zhí)行高度線程化的多進(jìn)程并發(fā)任務(wù),在需要復(fù)雜控制的大規(guī)模任務(wù)中,可以助CPU一臂之力。比如性能強(qiáng)勁的個(gè)人電腦,GPU就是不可或缺的存在。
FPGA中文名叫做“現(xiàn)場(chǎng)可編程門級(jí)列陣”,顧名思義,就是可以重新編程布線資源,因此,可以用來(lái)實(shí)現(xiàn)一些自定義的特殊硬件功能。而且,它的計(jì)算效率要比前兩個(gè)同伴都高,很適合處理AI算法,很快成為CPU的左膀右臂。
還有一個(gè)性能強(qiáng)勁但不太愛(ài)拋頭露面的選手,那就是“特殊訂制集成電路”ASIC。它的編程方式是直接在物理硬件(門電路)上搭建電路,由于不需要取指令和譯碼,每個(gè)時(shí)間單位都能專注于數(shù)據(jù)處理和傳輸,因此是所有協(xié)處理器中性能最高的一個(gè), 功耗卻是最小的。不過(guò),由于需要底層硬件編程,它的定制也昂貴而漫長(zhǎng),屬于江湖傳說(shuō)型的存在。
目前,異構(gòu)計(jì)算的江湖主要有三個(gè)分支,分別是CPU+GPU,適用于大多數(shù)通用計(jì)算,是目前異構(gòu)計(jì)算使用最多的組合陣容;
CPU+FPGA,價(jià)格較高,大多是企業(yè)用戶(如華為、百度、IBM等)用來(lái)進(jìn)行深度學(xué)習(xí)加速;
CPU+ASIC,應(yīng)用較少,適合一些市場(chǎng)大、投資回報(bào)清晰、有一定開發(fā)周期的領(lǐng)域,比如消費(fèi)電子。
隨著技術(shù)的迭代,未來(lái)我們還很有可能看到CPU+GPU+FPGA之類的多芯片協(xié)同場(chǎng)景。比如華為剛剛發(fā)布的Atlas平臺(tái),就能針對(duì)多個(gè)GPU/FPGA之間的拓?fù)浣Y(jié)構(gòu)進(jìn)行動(dòng)態(tài)編排,進(jìn)一步提升系統(tǒng)的整體性能。
不得不說(shuō),異構(gòu)計(jì)算打開這扇新世界的大門,正在為超級(jí)計(jì)算帶來(lái)充沛的想象力,整個(gè)計(jì)算行業(yè)生態(tài)無(wú)不積極地參與其中。
不過(guò),想要將異構(gòu)計(jì)算下沉到龐大的產(chǎn)業(yè)體系里,事情并沒(méi)有我們想象的那么容易。
WHEN:異構(gòu)計(jì)算的崛起,不只靠技術(shù)
前面我們介紹了異構(gòu)計(jì)算的前世今生。但如果問(wèn)一句,何時(shí)能看到異構(gòu)計(jì)算帶來(lái)的實(shí)際效果,答案可能不會(huì)讓人驚喜。原因也很簡(jiǎn)單,異構(gòu)計(jì)算的崛起,靠的不只是技術(shù),更重要的是來(lái)自應(yīng)用端的積極準(zhǔn)備。
但是,在“計(jì)算之光”的盛譽(yù)之下,異構(gòu)計(jì)算無(wú)論是采購(gòu)、部署、使用門檻都很高。這就導(dǎo)致其應(yīng)用中面臨不少挑戰(zhàn):
比如在成本上,如果不能實(shí)現(xiàn)規(guī)?;少?gòu),異構(gòu)計(jì)算芯片的采購(gòu)成本都很高。智能手機(jī)廠商還可以憑借規(guī)?;瘍?yōu)勢(shì)進(jìn)行議價(jià),而一般的企業(yè)用戶和個(gè)人開發(fā)者,單量小的話采購(gòu)價(jià)格特別高,尤其是FPGA、AISC等定制類板卡,距離大范圍應(yīng)用還很遙遠(yuǎn)。
另外,異構(gòu)計(jì)算的芯片交付周期也很長(zhǎng)。作為人工智能的大腦,全球GPU一直處于供應(yīng)短缺的狀態(tài),英偉達(dá)對(duì)每家公司每天購(gòu)買的芯片數(shù)量進(jìn)行了限購(gòu)措施。而FPGA 和 ASIC這樣可編程的芯片,由于編程標(biāo)準(zhǔn)未確立、定制時(shí)間等原因, 企業(yè)從硬件架構(gòu)設(shè)計(jì)、下單、交付往往需要幾個(gè)月的時(shí)間。
這樣導(dǎo)致的結(jié)果就是,數(shù)量和產(chǎn)品都是固定的,一方面可能造成算力資源與實(shí)際應(yīng)用之間的不匹配,還可能由于新的GPU/FPGA架構(gòu)上線,而不得不持續(xù)追加預(yù)算。導(dǎo)致企業(yè)的升級(jí)成本居高不下,自然心存疑慮。
即使上述所有問(wèn)題都搞定了,一把手爽快打錢,芯片順利到貨,硬件成功部署,也很有可能出現(xiàn)另一種情況,就是線下的GPU/FPGA和線上的服務(wù)無(wú)法打通,造成資源浪費(fèi)和數(shù)據(jù)孤島問(wèn)題。
好氣哦,不自己搞了行不行,直接將云服務(wù)商的異構(gòu)計(jì)算拿過(guò)來(lái)用就好?
悲傷地告訴你,坑也很多。因?yàn)镚PU、FPGA這些超高性能的器件在經(jīng)過(guò)云端虛擬化之后,性能損失非常嚴(yán)重,都會(huì)出現(xiàn)相應(yīng)的下降。而不同廠商的硬件優(yōu)化能力和解決方案千差萬(wàn)別,如何選擇合適的平臺(tái)又成了問(wèn)題。
如此看來(lái),異構(gòu)計(jì)算的出現(xiàn)和下沉,簡(jiǎn)直就是一個(gè)“掃雷”游戲?;蛟S等到有實(shí)力的廠商們將這些暗處的障礙一一掃除,異構(gòu)計(jì)算帶給數(shù)字世界的真正價(jià)值才會(huì)浮現(xiàn)出來(lái)。
而中國(guó)芯片企業(yè)直接用異構(gòu)計(jì)算向老牌巨頭發(fā)起挑戰(zhàn)的時(shí)候,產(chǎn)業(yè)迭變過(guò)程中的種種變數(shù)與可能性,將比技術(shù)本身還要精彩。