123,123

断供风波后，国产GPU补位难在哪？

日期： 2022-10-26

來源：自主可控新鲜事

關(guān)鍵詞： GPU 英伟达 AMD

英偉達(dá)和AMD的高端通用GPU禁運(yùn)事件再次揪緊了中國(guó)半導(dǎo)體行業(yè)的神經(jīng)，國(guó)內(nèi)超算、東數(shù)西算、云計(jì)算、自動(dòng)駕駛等行業(yè)已明顯感到“寒意”。但正如硬幣的兩面，這一禁令無疑也為國(guó)產(chǎn)GPU廠商創(chuàng)造了新的補(bǔ)位機(jī)會(huì)。

但從GPU市場(chǎng)來看，仍上演著巨大的“落差”情節(jié)。在集成GPU市場(chǎng)，英特爾、英偉達(dá)、AMD三分天下；獨(dú)立GPU領(lǐng)域，基本是英偉達(dá)和AMD的天下，前者市場(chǎng)份額甚至超出2/3；在GPGPU領(lǐng)域，英偉達(dá)更是一騎絕塵。當(dāng)英特爾、英偉達(dá)、AMD通過并購(gòu)或整合，在GPU+CPU+DPU時(shí)代全面布局并掌控話語(yǔ)權(quán)的當(dāng)下，國(guó)內(nèi)GPU廠商仍需奮起直追。

要在GPU領(lǐng)域形成突圍之勢(shì)，國(guó)產(chǎn)GPU的性能、生態(tài)、應(yīng)用等均是一環(huán)接一環(huán)的考驗(yàn)。要在性能層面率先通關(guān)，IP的力量不容小覷。在生態(tài)層面，是借助CUDA占位還是自建生態(tài)，仍是個(gè)兩難的選擇。

風(fēng)起云涌

GPU的重要性從其市場(chǎng)規(guī)模可見一斑。

在多重因素交織影響下，GPU已然完成華麗“蛻變”，從最早用于2D/3D圖形的計(jì)算和處理，到近年來憑借并行處理和通用計(jì)算的優(yōu)勢(shì)成為數(shù)據(jù)中心、5G、AIoT、自動(dòng)駕駛領(lǐng)域的關(guān)鍵算力的基礎(chǔ)設(shè)施，GPU市場(chǎng)亦迎來了高速大發(fā)展。

據(jù)Gartner預(yù)測(cè)，截至2023年，AIoT、5G應(yīng)用等將快速拉升全球商用GPU市場(chǎng)，規(guī)模有望達(dá)到250億美元，包括PC在內(nèi)的民用GPU市場(chǎng)也將提升至150億美元。

在這一風(fēng)雷激蕩的市場(chǎng)，不僅成就了英偉達(dá)、AMD等的高歌猛進(jìn)，也為無數(shù)的新進(jìn)入者提供了逐鹿的舞臺(tái)。受市場(chǎng)需求以及政策、資本的推動(dòng)，GPU在國(guó)內(nèi)受到瘋狂追捧，國(guó)內(nèi)GPU初創(chuàng)企業(yè)如雨后春筍冒出，融資紀(jì)錄不斷刷出新高，多方出擊，呈現(xiàn)“星星之火，可以燎原”之勢(shì)。

要指出的是，GPU隨著技術(shù)的進(jìn)階以及應(yīng)用的拓展，體系也日益龐雜，按接入類型可分為集成GPU和獨(dú)立GPU，以應(yīng)用來區(qū)分則有PC GPU、移動(dòng)GPU和服務(wù)器GPU三類；按功能劃分，可分為側(cè)重圖形圖像的渲染GPU和側(cè)重通用計(jì)算的GPGPU。

國(guó)內(nèi)初創(chuàng)GPU公司結(jié)合自己的優(yōu)勢(shì)和階段性定位，分別采取了不同的切入路線，有的以GPGPU為重，有的直指渲染GPU，也有先期立足GPGPU而后切入渲染GPU或并行推進(jìn)的，涉及壁仞、沐曦、登臨、天數(shù)智芯、摩爾線程、勵(lì)算、深流微、瀚博、芯瞳、格蘭菲等等。

作為此次禁運(yùn)事件的主角，英偉達(dá)的A100、H100均是數(shù)據(jù)中心加速卡，A100擁有540億晶體管，采用臺(tái)積電7nm工藝制程，支持FP16、FP32和FP64浮點(diǎn)運(yùn)算。而H100作為英偉達(dá)最新一代數(shù)據(jù)中心GPU，集成了800億晶體管，最高1.8萬個(gè)CUDA核心，采用臺(tái)積電定制的4nm工藝，已全面投產(chǎn)，合作伙伴50多款基于H100的服務(wù)器將在年底前上市。

雖然國(guó)內(nèi)還有一年的緩沖期可以繼續(xù)備貨英偉達(dá)的產(chǎn)品（如果可以通過報(bào)備和審核），但一年以后很可能還將面臨無法拿到最先進(jìn)產(chǎn)品的可能，不同應(yīng)用端對(duì)此的感受或“冷暖自知”。

應(yīng)用掣肘

“相對(duì)于超算、互聯(lián)網(wǎng)等應(yīng)用場(chǎng)景來說，正在飛速發(fā)展的自動(dòng)駕駛汽車領(lǐng)域才是這次訓(xùn)練卡禁售風(fēng)波的最大受害者?！奔⒆稍冎苯訑嘌?。

因超算中的核心算力還是以CPU為主，且可以用協(xié)處理器來配合核心CPU來進(jìn)行工作，GPGPU的影響在短期內(nèi)不會(huì)對(duì)超算應(yīng)用產(chǎn)生太大的影響。

此外，雖然互聯(lián)網(wǎng)應(yīng)用的智能推薦、圖像識(shí)別等算法也需要大量訓(xùn)練，但慶幸的是我國(guó)互聯(lián)網(wǎng)產(chǎn)業(yè)已經(jīng)經(jīng)歷了蓬勃發(fā)展時(shí)期，目前處于穩(wěn)定期，算法迭代和應(yīng)用落地相對(duì)比較成熟，目前互聯(lián)網(wǎng)巨頭手中訓(xùn)練資源相對(duì)比較平衡，而且各家也都針對(duì)自己的業(yè)務(wù)需求特點(diǎn)開始自研訓(xùn)練芯片，英偉達(dá)訓(xùn)練卡的禁售看似對(duì)互聯(lián)網(wǎng)產(chǎn)業(yè)影響大，但實(shí)際情況比想象得要好一些。

相較之下，自動(dòng)駕駛端體會(huì)的“寒意”或更為明顯。

雖然英偉達(dá)沒有直接禁售自動(dòng)駕駛芯片，但自動(dòng)駕駛算法的訓(xùn)練還是無法繞開云端GPGPU的。國(guó)內(nèi)智能汽車或自動(dòng)駕駛汽車的產(chǎn)品迭代快速，新車發(fā)布周期在縮短，硬件堆疊也在不斷增加，攝像頭視覺傳感器、雷達(dá)等硬件模塊的單車配置在快速上升，高級(jí)別自動(dòng)駕駛等級(jí)的迭代與滲透也在快速發(fā)展。從而導(dǎo)致自動(dòng)駕駛算法迭代也要跟上步伐，算法的迭代必然以訓(xùn)練為前提，訓(xùn)練量的增加必定會(huì)反饋在對(duì)訓(xùn)練卡性能和需求的提升。

更值得注意的是，自動(dòng)駕駛信息涉及到的數(shù)據(jù)，大多涉及保密級(jí)較高的內(nèi)容，這部分內(nèi)容大概率是無法依靠租賃云服務(wù)商的訓(xùn)練服務(wù)器來解決的。

IP難關(guān)

國(guó)內(nèi)GPU初創(chuàng)企業(yè)而言，長(zhǎng)期、持續(xù)的利潤(rùn)支撐才是GPU跨代發(fā)展的強(qiáng)勁驅(qū)動(dòng)力，在英偉達(dá)、ADM等巨頭構(gòu)筑的高壁壘面前，瞄準(zhǔn)目標(biāo)應(yīng)用大量的驗(yàn)證及出貨是國(guó)產(chǎn)GPU必然要越過的難關(guān)。

而GPU作為高性能高復(fù)雜度的大芯片，想在短期內(nèi)快速推出相關(guān)產(chǎn)品，必然依賴外部IP。而且，近段時(shí)間以來，國(guó)內(nèi)GPU廠商以接二連三的點(diǎn)亮和商用來探索發(fā)展之道。但除卻生態(tài)、落地挑戰(zhàn)之外，據(jù)一位業(yè)內(nèi)人士分析，國(guó)內(nèi)GPU核心基礎(chǔ)技術(shù)的投入還是不太夠，雖然目前研發(fā)GPU的公司很多，但絕大部分是license IP模式，而且同質(zhì)化較為明顯。

提及GPU IP，主要有數(shù)字和模擬兩大IP，每一大IP體系有不同的分類。從模擬IP來看，分為三部分，一是PCIe；二是Memory，涉及DDR5/4、LPDDR5/4等；三是重要的顯示IP，即Displayport和 HDMI。從數(shù)字IP來看，涉及最核心的GPU IP，還有基于RISC-V或Arm的微控制器IP；以及Video編解碼如H.264等IP。要注意的是，在GPGPU層面，核心IP大都為廠商自研，也有廠商采用Imagination等訓(xùn)練或推理的IP，且GPGPU不需顯示IP。

從理論上來說，自研IP越多，GPU的差異化更明顯，但相對(duì)而言資金、人員、時(shí)間上的成本投入也更高。一家從事GPGPU研發(fā)的企業(yè)代表告知，GPU IP自研需要36-48個(gè)月以及200個(gè)工程師，而采用外購(gòu)IP的方式，可以減少12-18個(gè)月開發(fā)周期。

微信圖片_20221026094232.jpg

不得不說，因設(shè)計(jì)GPU IP的問題非常復(fù)雜，許多最優(yōu)的解決方案已經(jīng)獲得專利保護(hù)，使得GPU 核心IP市場(chǎng)成為少數(shù)玩家的陣地。

在PC和服務(wù)器GPU領(lǐng)域，核心的GPU IP廠商主要是Imagination、芯原、格蘭菲；在移動(dòng)GPU領(lǐng)域，主要有Arm Mali、Imagination PowerVR系列，芯原在前幾年收購(gòu)美國(guó)嵌入式GPU設(shè)計(jì)商圖芯之后亦有不少授權(quán)用戶，以及高通的Adreno。高通Adreno從AMD買入，且不對(duì)外銷售。作為GPU的老牌巨頭，英偉達(dá)、AMD均有自己的強(qiáng)大GPU IP，英特爾也購(gòu)買了AMD的GPU IP要在獨(dú)立GPU市場(chǎng)卷土重來。

整體而言，國(guó)內(nèi)GPGPU企業(yè)與國(guó)際大廠技術(shù)差距約3年，渲染GPU與國(guó)際大廠差距約10年左右。要想彌補(bǔ)這一差距，不止要在生態(tài)層面發(fā)力，提升國(guó)內(nèi)核心IP能力顯然是必然要做的功課。

對(duì)此業(yè)內(nèi)人士也指出，從GPU IP 供應(yīng)商來看，國(guó)內(nèi)本土研發(fā)存在投入不足、競(jìng)爭(zhēng)力偏弱、市場(chǎng)窄、技術(shù)研發(fā)的后續(xù)力不明朗等問題。國(guó)內(nèi)想發(fā)展GPU，是要想辦法讓GPU技術(shù)鏈條各個(gè)環(huán)節(jié)上，真金白銀投入技術(shù)研發(fā)的公司生存并慢慢滾動(dòng)發(fā)展。

值得關(guān)注的是，盡管火熱的Chiplet開啟了 IP的新型復(fù)用模式，也為IP 廠商的經(jīng)營(yíng)模式帶來全新變革，國(guó)內(nèi)GPU IP廠商芯原等也在加速實(shí)現(xiàn)以Chiplet形式的IP芯片化。但我們認(rèn)為，這除對(duì)商業(yè)模式帶來挑戰(zhàn)之外，還要解決設(shè)計(jì)、die到die接口挑戰(zhàn)、封裝和制造等層面的難關(guān)，難以實(shí)現(xiàn)彎道超車。

生態(tài)之憂

盡管A100和H100的禁售成為國(guó)內(nèi)GPGPU發(fā)展的新催化劑，可以說造就了難得的機(jī)會(huì)窗口，但要成功“補(bǔ)位”，除了性能差距之外，生態(tài)過關(guān)顯得尤為迫切。

“很多客戶用英偉達(dá)的訓(xùn)練加速卡已用得非常順手了，一方面是其性能優(yōu)異，通用性強(qiáng)，另一方面則是生態(tài)，CUDA的運(yùn)算平臺(tái)適合各類模型，客戶基于此可高效訓(xùn)練或改進(jìn)自己的算法。”集微咨詢表示，“國(guó)內(nèi)在芯片設(shè)計(jì)上的能力與頭部品牌還存在不小的差距，再考慮到軟件和生態(tài)層面，差距就又會(huì)進(jìn)一步拉大?！?/p>

正如一家GPGPU廠商代表所言，GPGPU的生態(tài)非常復(fù)雜，要求一路打通到應(yīng)用層，提供面向所有應(yīng)用的全面支持，甚至要自主開發(fā)以支持一個(gè)新的應(yīng)用領(lǐng)域。

盡管禁運(yùn)有一年的緩沖期，但一年以后呢？很可能還將面臨無法拿到最先進(jìn)產(chǎn)品的可能。雖然英偉達(dá)也放話說可提供一些相對(duì)低端的性能不及A100的產(chǎn)品讓客戶通過堆疊等來實(shí)現(xiàn)相應(yīng)的算力，但這仍將大幅影響訓(xùn)練的成本和效率。

因而，雖然國(guó)內(nèi)在GPGPU領(lǐng)域?qū)崿F(xiàn)了一些國(guó)產(chǎn)替代，但在性能上要達(dá)到A100水平，短期內(nèi)還不現(xiàn)實(shí)。此外，更大的阻力來自生態(tài)，雖然眾多國(guó)產(chǎn)GPGPU公司芯片都支持兼容CUDA，但兼容度和兼容水平無法量化，各家的產(chǎn)品水平標(biāo)準(zhǔn)也不統(tǒng)一，這必定會(huì)增加算法工程師的使用和學(xué)習(xí)成本。

兼容是捷徑，但不是終點(diǎn)，從長(zhǎng)遠(yuǎn)來說一定要建立自己的生態(tài)。國(guó)內(nèi)GPGPU廠商還應(yīng)風(fēng)物長(zhǎng)宜放眼量。

無疑，美對(duì)我國(guó)芯片行業(yè)的全面圍剿將形成一道新的半導(dǎo)體“鐵幕”，也將不斷加速國(guó)產(chǎn)芯片自主化的進(jìn)程，但要從弱到強(qiáng)，從低端到高端，顯然是一場(chǎng)以數(shù)年為計(jì)的長(zhǎng)征之路。

更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請(qǐng)及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

断供风波后，国产GPU补位难在哪？

日期： 2022-10-26

來源：自主可控新鲜事

相關(guān)內(nèi)容