《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電子元件 > 業(yè)界動態(tài) > 斷供風(fēng)波后,國產(chǎn)GPU補位難在哪?

斷供風(fēng)波后,國產(chǎn)GPU補位難在哪?

2022-10-26
來源:自主可控新鮮事
關(guān)鍵詞: GPU 英偉達 AMD

英偉達AMD的高端通用GPU禁運事件再次揪緊了中國半導(dǎo)體行業(yè)的神經(jīng),國內(nèi)超算、東數(shù)西算、云計算、自動駕駛等行業(yè)已明顯感到“寒意”。但正如硬幣的兩面,這一禁令無疑也為國產(chǎn)GPU廠商創(chuàng)造了新的補位機會。

但從GPU市場來看,仍上演著巨大的“落差”情節(jié)。在集成GPU市場,英特爾、英偉達、AMD三分天下;獨立GPU領(lǐng)域,基本是英偉達和AMD的天下,前者市場份額甚至超出2/3;在GPGPU領(lǐng)域,英偉達更是一騎絕塵。當英特爾、英偉達、AMD通過并購或整合,在GPU+CPU+DPU時代全面布局并掌控話語權(quán)的當下,國內(nèi)GPU廠商仍需奮起直追。 

要在GPU領(lǐng)域形成突圍之勢,國產(chǎn)GPU的性能、生態(tài)、應(yīng)用等均是一環(huán)接一環(huán)的考驗。要在性能層面率先通關(guān),IP的力量不容小覷。在生態(tài)層面,是借助CUDA占位還是自建生態(tài),仍是個兩難的選擇。

風(fēng)起云涌

GPU的重要性從其市場規(guī)??梢娨话?。

在多重因素交織影響下,GPU已然完成華麗“蛻變”,從最早用于2D/3D圖形的計算和處理,到近年來憑借并行處理和通用計算的優(yōu)勢成為數(shù)據(jù)中心、5G、AIoT、自動駕駛領(lǐng)域的關(guān)鍵算力的基礎(chǔ)設(shè)施,GPU市場亦迎來了高速大發(fā)展。

據(jù)Gartner預(yù)測,截至2023年,AIoT、5G應(yīng)用等將快速拉升全球商用GPU市場,規(guī)模有望達到250億美元,包括PC在內(nèi)的民用GPU市場也將提升至150億美元。

在這一風(fēng)雷激蕩的市場,不僅成就了英偉達、AMD等的高歌猛進,也為無數(shù)的新進入者提供了逐鹿的舞臺。受市場需求以及政策、資本的推動,GPU在國內(nèi)受到瘋狂追捧,國內(nèi)GPU初創(chuàng)企業(yè)如雨后春筍冒出,融資紀錄不斷刷出新高,多方出擊,呈現(xiàn)“星星之火,可以燎原”之勢。

要指出的是,GPU隨著技術(shù)的進階以及應(yīng)用的拓展,體系也日益龐雜,按接入類型可分為集成GPU和獨立GPU,以應(yīng)用來區(qū)分則有PC GPU、移動GPU和服務(wù)器GPU三類;按功能劃分,可分為側(cè)重圖形圖像的渲染GPU和側(cè)重通用計算的GPGPU。

國內(nèi)初創(chuàng)GPU公司結(jié)合自己的優(yōu)勢和階段性定位,分別采取了不同的切入路線,有的以GPGPU為重,有的直指渲染GPU,也有先期立足GPGPU而后切入渲染GPU或并行推進的,涉及壁仞、沐曦、登臨、天數(shù)智芯、摩爾線程、勵算、深流微、瀚博、芯瞳、格蘭菲等等。

作為此次禁運事件的主角,英偉達的A100、H100均是數(shù)據(jù)中心加速卡,A100擁有540億晶體管,采用臺積電7nm工藝制程,支持FP16、FP32和FP64浮點運算。而H100作為英偉達最新一代數(shù)據(jù)中心GPU,集成了800億晶體管,最高1.8萬個CUDA核心,采用臺積電定制的4nm工藝,已全面投產(chǎn),合作伙伴50多款基于H100的服務(wù)器將在年底前上市。

雖然國內(nèi)還有一年的緩沖期可以繼續(xù)備貨英偉達的產(chǎn)品(如果可以通過報備和審核),但一年以后很可能還將面臨無法拿到最先進產(chǎn)品的可能,不同應(yīng)用端對此的感受或“冷暖自知”。

應(yīng)用掣肘

“相對于超算、互聯(lián)網(wǎng)等應(yīng)用場景來說,正在飛速發(fā)展的自動駕駛汽車領(lǐng)域才是這次訓(xùn)練卡禁售風(fēng)波的最大受害者?!奔⒆稍冎苯訑嘌?。

因超算中的核心算力還是以CPU為主,且可以用協(xié)處理器來配合核心CPU來進行工作,GPGPU的影響在短期內(nèi)不會對超算應(yīng)用產(chǎn)生太大的影響。

此外,雖然互聯(lián)網(wǎng)應(yīng)用的智能推薦、圖像識別等算法也需要大量訓(xùn)練,但慶幸的是我國互聯(lián)網(wǎng)產(chǎn)業(yè)已經(jīng)經(jīng)歷了蓬勃發(fā)展時期,目前處于穩(wěn)定期,算法迭代和應(yīng)用落地相對比較成熟,目前互聯(lián)網(wǎng)巨頭手中訓(xùn)練資源相對比較平衡,而且各家也都針對自己的業(yè)務(wù)需求特點開始自研訓(xùn)練芯片,英偉達訓(xùn)練卡的禁售看似對互聯(lián)網(wǎng)產(chǎn)業(yè)影響大,但實際情況比想象得要好一些。

相較之下,自動駕駛端體會的“寒意”或更為明顯。

雖然英偉達沒有直接禁售自動駕駛芯片,但自動駕駛算法的訓(xùn)練還是無法繞開云端GPGPU的。國內(nèi)智能汽車或自動駕駛汽車的產(chǎn)品迭代快速,新車發(fā)布周期在縮短,硬件堆疊也在不斷增加,攝像頭視覺傳感器、雷達等硬件模塊的單車配置在快速上升,高級別自動駕駛等級的迭代與滲透也在快速發(fā)展。從而導(dǎo)致自動駕駛算法迭代也要跟上步伐,算法的迭代必然以訓(xùn)練為前提,訓(xùn)練量的增加必定會反饋在對訓(xùn)練卡性能和需求的提升。

更值得注意的是,自動駕駛信息涉及到的數(shù)據(jù),大多涉及保密級較高的內(nèi)容,這部分內(nèi)容大概率是無法依靠租賃云服務(wù)商的訓(xùn)練服務(wù)器來解決的。

IP難關(guān)

國內(nèi)GPU初創(chuàng)企業(yè)而言,長期、持續(xù)的利潤支撐才是GPU跨代發(fā)展的強勁驅(qū)動力,在英偉達、ADM等巨頭構(gòu)筑的高壁壘面前,瞄準目標應(yīng)用大量的驗證及出貨是國產(chǎn)GPU必然要越過的難關(guān)。

而GPU作為高性能高復(fù)雜度的大芯片,想在短期內(nèi)快速推出相關(guān)產(chǎn)品,必然依賴外部IP。而且,近段時間以來,國內(nèi)GPU廠商以接二連三的點亮和商用來探索發(fā)展之道。但除卻生態(tài)、落地挑戰(zhàn)之外,據(jù)一位業(yè)內(nèi)人士分析,國內(nèi)GPU核心基礎(chǔ)技術(shù)的投入還是不太夠,雖然目前研發(fā)GPU的公司很多,但絕大部分是license IP模式,而且同質(zhì)化較為明顯。

提及GPU IP,主要有數(shù)字和模擬兩大IP,每一大IP體系有不同的分類。從模擬IP來看,分為三部分,一是PCIe;二是Memory,涉及DDR5/4、LPDDR5/4等;三是重要的顯示IP,即Displayport和 HDMI。從數(shù)字IP來看,涉及最核心的GPU IP,還有基于RISC-V或Arm的微控制器IP;以及Video編解碼如H.264等IP。要注意的是,在GPGPU層面,核心IP大都為廠商自研,也有廠商采用Imagination等訓(xùn)練或推理的IP,且GPGPU不需顯示IP。

從理論上來說,自研IP越多,GPU的差異化更明顯,但相對而言資金、人員、時間上的成本投入也更高。一家從事GPGPU研發(fā)的企業(yè)代表告知,GPU IP自研需要36-48個月以及200個工程師,而采用外購IP的方式,可以減少12-18個月開發(fā)周期。

微信圖片_20221026094232.jpg

不得不說,因設(shè)計GPU IP的問題非常復(fù)雜,許多最優(yōu)的解決方案已經(jīng)獲得專利保護,使得GPU 核心IP市場成為少數(shù)玩家的陣地。

在PC和服務(wù)器GPU領(lǐng)域,核心的GPU IP廠商主要是Imagination、芯原、格蘭菲;在移動GPU領(lǐng)域,主要有Arm Mali、Imagination PowerVR系列,芯原在前幾年收購美國嵌入式GPU設(shè)計商圖芯之后亦有不少授權(quán)用戶,以及高通的Adreno。高通Adreno從AMD買入,且不對外銷售。作為GPU的老牌巨頭,英偉達、AMD均有自己的強大GPU IP,英特爾也購買了AMD的GPU IP要在獨立GPU市場卷土重來。

整體而言,國內(nèi)GPGPU企業(yè)與國際大廠技術(shù)差距約3年,渲染GPU與國際大廠差距約10年左右。要想彌補這一差距,不止要在生態(tài)層面發(fā)力,提升國內(nèi)核心IP能力顯然是必然要做的功課。

對此業(yè)內(nèi)人士也指出,從GPU IP 供應(yīng)商來看,國內(nèi)本土研發(fā)存在投入不足、競爭力偏弱、市場窄、技術(shù)研發(fā)的后續(xù)力不明朗等問題。國內(nèi)想發(fā)展GPU,是要想辦法讓GPU技術(shù)鏈條各個環(huán)節(jié)上,真金白銀投入技術(shù)研發(fā)的公司生存并慢慢滾動發(fā)展。

值得關(guān)注的是,盡管火熱的Chiplet開啟了 IP的新型復(fù)用模式,也為IP 廠商的經(jīng)營模式帶來全新變革,國內(nèi)GPU IP廠商芯原等也在加速實現(xiàn)以Chiplet形式的IP芯片化。但我們認為,這除對商業(yè)模式帶來挑戰(zhàn)之外,還要解決設(shè)計、die到die接口挑戰(zhàn)、封裝和制造等層面的難關(guān),難以實現(xiàn)彎道超車。

生態(tài)之憂

盡管A100和H100的禁售成為國內(nèi)GPGPU發(fā)展的新催化劑,可以說造就了難得的機會窗口,但要成功“補位”,除了性能差距之外,生態(tài)過關(guān)顯得尤為迫切。 

“很多客戶用英偉達的訓(xùn)練加速卡已用得非常順手了,一方面是其性能優(yōu)異,通用性強,另一方面則是生態(tài),CUDA的運算平臺適合各類模型,客戶基于此可高效訓(xùn)練或改進自己的算法?!奔⒆稍儽硎荆皣鴥?nèi)在芯片設(shè)計上的能力與頭部品牌還存在不小的差距,再考慮到軟件和生態(tài)層面,差距就又會進一步拉大?!?/p>

正如一家GPGPU廠商代表所言,GPGPU的生態(tài)非常復(fù)雜,要求一路打通到應(yīng)用層,提供面向所有應(yīng)用的全面支持,甚至要自主開發(fā)以支持一個新的應(yīng)用領(lǐng)域。

盡管禁運有一年的緩沖期,但一年以后呢?很可能還將面臨無法拿到最先進產(chǎn)品的可能。雖然英偉達也放話說可提供一些相對低端的性能不及A100的產(chǎn)品讓客戶通過堆疊等來實現(xiàn)相應(yīng)的算力,但這仍將大幅影響訓(xùn)練的成本和效率。

因而,雖然國內(nèi)在GPGPU領(lǐng)域?qū)崿F(xiàn)了一些國產(chǎn)替代,但在性能上要達到A100水平,短期內(nèi)還不現(xiàn)實。此外,更大的阻力來自生態(tài),雖然眾多國產(chǎn)GPGPU公司芯片都支持兼容CUDA,但兼容度和兼容水平無法量化,各家的產(chǎn)品水平標準也不統(tǒng)一,這必定會增加算法工程師的使用和學(xué)習(xí)成本。

兼容是捷徑,但不是終點,從長遠來說一定要建立自己的生態(tài)。國內(nèi)GPGPU廠商還應(yīng)風(fēng)物長宜放眼量。

無疑,美對我國芯片行業(yè)的全面圍剿將形成一道新的半導(dǎo)體“鐵幕”,也將不斷加速國產(chǎn)芯片自主化的進程,但要從弱到強,從低端到高端,顯然是一場以數(shù)年為計的長征之路。



更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<

二維碼.png

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。