GPGPU似乎是最近幾年才流行起來的,外行人聽著感覺是比GPU還要厲害的東西。事實上,GPGPU是英文General-Purpose computing on Graphics Processing Units的縮寫,中文譯為通用圖形處理器,可以理解為是GPU的一個分支。
從歷史的角度來看,GPU的產(chǎn)生是為了解決游戲中圖形渲染效率的問題,但是隨著圖形芯片技術(shù)的不斷迭代,GPU的處理功能和計算能力不斷提升。2001年,得益于shader的出現(xiàn),GPU在圖形流水線中引入了可編程性,從此GPU能做的事情不再局限于圖形數(shù)據(jù)的處理,而將觸角延伸至其他計算密集的領(lǐng)域,開啟了GPGPU時代。
跳過GPU
本土廠商為何選擇自研GPGPU?
有人說,沒了圖形渲染的GPGPU不過是一款專用的ASIC,真的是這樣嗎?在2021年中國集成電路設(shè)計創(chuàng)新大會上,筆者也對該問題進行了提問。沐曦集成的CEO陳維良是這樣回復(fù)的,“ASIC的設(shè)計是偏離通用GPU架構(gòu)的,其軟件適配靈活性將面臨很大的挑戰(zhàn),產(chǎn)品的應(yīng)用生命周期也比GPGPU短?!边@意味著GPGPU和ASIC從底層架構(gòu)上就能區(qū)別是兩種技術(shù),各自服務(wù)于相應(yīng)的應(yīng)用場景,并不能混為一談。
圖源 | 沐曦集成官網(wǎng)
至于“跳過GPU,直接選擇GPGPU新戰(zhàn)場”的原因,陳維良表示,“全球GPU市場已經(jīng)形成半壟斷局面,再加上圖形渲染是一個存量市場,正面交鋒實屬不易,選擇增量市場的計算型GPU,也就是我們說的GPGPU,也許是明智之舉。”
事實上,跳過GPU的說法本身就不是很準(zhǔn)確。從GPU體系架構(gòu)的角度來看,我們可以把GPGPU分為三大家族。
傳統(tǒng)GPU
主導(dǎo)者包括英偉達和AMD/ATI,這類架構(gòu)有一個顯著的特性,那就是包含大量結(jié)構(gòu)簡單的處理核心構(gòu)成的陣列。它會以高度并行化的方式批量處理數(shù)據(jù),這些帶有向量特征的處理陣列是由傳統(tǒng)GPU中的多條并行的渲染管線發(fā)展而來。此外,這類GPGPU中仍或多或少地存在一些專用于圖像處理的部件,如紋理Cache、幀緩沖等。但是,隨著通用計算的需求日益顯著,GPGPU正越來越專注于通用計算能力,而漸漸弱化其作為顯卡的功能。
傳統(tǒng)多核CPU
典型代表是以CPU著稱的Intel,它的架構(gòu)理念是對傳統(tǒng)CPU核心進行裁剪,從而得到相對輕量級的處理核心,構(gòu)成其計算部件。這樣做的優(yōu)點是可以兼容部分傳統(tǒng)CPU的指令集,它的缺點是相對于上述GPGPU中的細粒度處理單元,這類處理核心仍然比較復(fù)雜,因此核心的集成度遠不及第一家族的GPGPU。
GPU和CPU聯(lián)姻產(chǎn)物
融合了GPU和CPU的架構(gòu)特色,典型的代表是AMD的APU產(chǎn)品系列。這類架構(gòu)的做法是將GPGPU中的處理陣列直接作為CPU的加速部件集成到同一顆芯片內(nèi)。這樣做帶來了兩大好處:
CPU核心的融入增強了GPGPU的標(biāo)量處理能力,更適合通用計算的要求;
融合的結(jié)構(gòu)可緩解GPGPU和CPU之間的通信帶寬受限問題。
此外,英偉達作為一家美籍華人創(chuàng)立的公司,其實并沒有把太多的研發(fā)工作投在中國,所以從人才組成的角度,我國做GPGPU的創(chuàng)業(yè)者大部分來自AMD、Imagination和Intel,其中AMD占主導(dǎo)。事實上,這些本土公司在做GPGPU時,他們的研發(fā)人員之前都經(jīng)歷過GPU相關(guān)技術(shù)的研發(fā),因此從技術(shù)的角度來說,并沒有跳過GPU,而站在市場的角度,面對數(shù)據(jù)爆發(fā)時代的到來,自研GPGPU是順應(yīng)市場自然選擇的結(jié)果。
頭部站隊初步形成
國產(chǎn)GPGPU正醞釀一場“大落地”
根據(jù)不完全統(tǒng)計,中國大陸大約有7家相對主流的GPGPU公司,它們分別是天數(shù)智芯、登臨科技、壁仞科技、摩爾線程、珠海芯動力、沐曦集成和紅山微電子。
為什么說頭部戰(zhàn)隊已經(jīng)基本形成呢?因為GPGPU的技術(shù)開發(fā)難度是很高的。“通常業(yè)內(nèi)一款高端芯片的前端和后端設(shè)計要耗時1~3年,設(shè)計完成后的流片環(huán)節(jié),需要3~6個月,還會有流片失敗一切重來的風(fēng)險。即使成功流片,仍然還需要經(jīng)過3~12個月的產(chǎn)品測試調(diào)優(yōu),才能最終開啟量產(chǎn)?!?天數(shù)智芯董事長兼CEO刁石京如是說。
舉個例子,強如intel,從1997年開始布局,通過收購C&T,入股Real3D后,在1998年推出了第一款獨立GPU i740后就少有成果,直到2007年眼紅英偉達的GPGPU市場,開始重啟GPU計劃,推出產(chǎn)品Larrabee,可惜性能價格都沒有競爭力,再到2020年又推出了全新的獨立GPU架構(gòu)Xe,可惜截至目前,Intel仍未推出自己消費級的獨立GPU產(chǎn)品。
由此可知,GPGPU市場準(zhǔn)入門檻是很高的,而目前從大廠出來有這方面技術(shù)積累,又能拉到投資的人基本流動得差不多了。此外,我們知道GPGPU的工藝要用上12nm、7nm甚至5nm技術(shù),除了高端技術(shù)人員的薪資支出以外,流片的成本也非常之高,高投入意味著必須要高產(chǎn)出才能盈利,因此產(chǎn)品落地量產(chǎn)勢在必行。而這些本土的GPGPU廠家大多面向數(shù)據(jù)中心和云端市場,頭部可以配合“拉練”的客戶梯隊也都已經(jīng)形成,后面再擠入困難有些大。
天垓100
圖源 | 天數(shù)智芯官網(wǎng)
結(jié)合上述論點,我們來看一下本土GPGPU廠商的進展情況。
從產(chǎn)品落地的角度來看,目前只有天數(shù)智芯宣布其首款云端7nm GPGPU產(chǎn)品卡——“天垓100”已正式進入量產(chǎn)環(huán)節(jié)(今年10月29日的消息),單芯算力每秒147T@FP16。緊隨其后的是登臨科技、珠海芯動力和壁仞科技。
登臨科技在7月14日宣布其首款GPU+產(chǎn)品已成功回片通過測試,開始客戶送樣;珠海芯動力的聯(lián)合創(chuàng)始人李原在今年7月份透露,其第一款應(yīng)用于邊緣服務(wù)器的芯片R8已經(jīng)流片,采用三星14nm工藝,算力達到32 TOPS,功耗小于14W;壁仞科技在今年的10月8日宣布其首款7nm GPGPU——BR100已正式交付臺積電流片,預(yù)計將于明年面向市場發(fā)布。
接下來是摩爾線程,摩爾線程在11月25日的發(fā)布中只表明其首顆國產(chǎn)全功能GPU研制成功,換句話說流片、測試、聯(lián)調(diào)等等都還是后頭的事兒。
至于另外兩家,沐曦集成和紅山微電子,成立的日期相對較晚,目前應(yīng)該還在初代產(chǎn)品研發(fā)階段。值得一提的是,沐曦集成的研發(fā)隊伍還是很強大的,其創(chuàng)始人陳維良曾任AMD圖形研發(fā)高級總監(jiān),CTO楊建為前AMD Fellow,所以未來躋身前三的機會也很大。
當(dāng)然,前面只是根據(jù)各家企業(yè)產(chǎn)品落地的情況進行了梳理,至于他們所用的產(chǎn)品架構(gòu)、工藝制程、算力、能效比、面向的細分市場以及公司戰(zhàn)略等都不在考慮的范圍內(nèi),要是都考慮進來,可能這個進度又得推翻重來。不過從這些廠商的產(chǎn)品發(fā)布進度來看,目前大家都想當(dāng)“第一”,可以說是正在醞釀一場“趕集式”的大落地。
GPGPU的下游市場在哪里?
廠商的紛紛投入,離不開投資界的推動,更離不開下游市場的需求。
據(jù)公開數(shù)據(jù)顯示,目前中國GPGPU 90%的市場都被以英偉達為代表的外企瓜分,僅2019年,英偉達和AMD兩大美企就在國內(nèi)GPGPU市場賺走了約80億元。半壟斷市場帶來的是高售價,當(dāng)前一塊高端的GPGPU板卡,市場售價高達十幾萬元,相當(dāng)于一輛普通小轎車的價格。與此同時,有專家預(yù)測,到2025年,我國GPGPU芯片板卡的市場規(guī)模將達458億元,年復(fù)合增長率高達32%。由此可見,GPGPU產(chǎn)品國產(chǎn)化勢在必行。
那么有人要問了,國內(nèi)GPGPU的市場需求到底分布在哪些行業(yè)呢?根據(jù)業(yè)內(nèi)人士提供的中國GPGPU出貨量行業(yè)結(jié)構(gòu)信息顯示,2019年接近一半的GPGPU用于互聯(lián)網(wǎng)市場,三分之一左右的GPGPU用于安防和政府市場,十分之一左右的GPGPU用于其他行業(yè)的AI應(yīng)用,接近十分之一的GPGPU用于HPC市場。當(dāng)然這是2019年的數(shù)據(jù),現(xiàn)在的情況可能會有所調(diào)整,比如HPC的比重有所增加等等。
寫在最后
英偉達3000億美元市值、AMD 1000億美元市值,中國的GPGPU市場規(guī)模和賽道都足夠大,也許三五年后,本土也能做出個“小英偉達”、“小AMD”來。所以說,國產(chǎn)GPGPU的下一步考驗的是如何做大?而除了持續(xù)融資提供經(jīng)濟動力外,這些公司所有的競爭力都將聚焦于一點,那就是產(chǎn)品高性能下的性價比,性價比決定出貨量,出貨量代表市場的認可,市場帶來資金活水,從而形成良性循環(huán)。