《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 业界动态 > 英伟达澄清LPU新品不会降低HBM市场需求

英伟达澄清LPU新品不会降低HBM市场需求

2026-03-06
來源:财联社
關(guān)鍵詞: 英伟达 AI芯片 HBM Groq SRAM

3月5日消息,隨著韓國股市近3天坐上“過山車”,一些揣測也在股價巨震期間敲打著股民們緊繃的神經(jīng)。

作為背景,上周五美股收盤后有爆料稱,英偉達將在當(dāng)?shù)貢r間3月16日舉行的GTC大會上發(fā)布一款專門用于推理計算的新系統(tǒng),這個新平臺將采用初創(chuàng)公司Groq設(shè)計的芯片。

隨著上周末中東戰(zhàn)火重燃,韓國股市周一休市后,周二、周三均遭遇大跌,三星電子、SK海力士均累計跌近20%。除了中東戰(zhàn)火外,市場里似乎也有一些聲音將內(nèi)存巨頭的大跌歸因于“Groq搶了HBM的飯碗”。

IOXRXP2C1l_1115x581.png

(三星電子、SK海力士周四均強勁反彈,來源:TradingView)

何來憂慮?

作為背景,英偉達去年底豪擲200億美元,獲得芯片初創(chuàng)公司Groq的人才團隊和非獨占專利授權(quán)。這也是英偉達在核心算力芯片產(chǎn)品上首次大規(guī)模引入外部架構(gòu)。

引發(fā)部分三星、海力士股東焦慮的點,正是Groq自研的LPU(語言處理單元)芯片。該芯片的核心特點是在片上集成數(shù)百兆SRAM(訪問速度比HBM快約20倍),通過減少或者完全不調(diào)用外部存儲,實現(xiàn)超低延遲的token輸出。

隨著英偉達發(fā)布會臨近,“Groq是否利空HBM”又被拿來討論:如果推理芯片路線從HBM堆料轉(zhuǎn)向片上SRAM,存儲公司的生意不是被搶走了么?

作為這一猜想的佐證,OpenAI上周五在宣布獲得英偉達300億美元融資時,就專門強調(diào)將從該公司購買大量“專用推理算力”,暗示了這款新型處理器的存在。

黃仁勛也曾表示,將在GTC上發(fā)布“世界前所未見”的全新芯片。市場猜測,如果不是Rubin CPX或下一代Feynman架構(gòu)的GPU旗艦產(chǎn)品,確有可能是以SRAM為核心的LPU。

兩者真的是替代關(guān)系么?

對于這種說法,韓國科技分析師Jukan周四開盤前引用獨立分析機構(gòu)KIS的分析稱,認為SRAM推理芯片的出現(xiàn)將減少HBM使用的想法,反映出對存儲器的理解不足。

分析稱,與DRAM相比,SRAM的單元面積大、密度低。相同容量的SRAM需要DRAM 5到10倍的芯片面積,因此也限制了容量的擴展。正因如此,SRAM歷來被用于對延遲要求極低的緩存或片上緩沖區(qū)應(yīng)用,而不是作為存儲大量數(shù)據(jù)的主存儲器。

因此,與其說取代GPU,這類芯片更多會成為針對特定推理工作的額外選擇,例如需要極低延遲的物理AI邊緣應(yīng)用(機器人和自動駕駛),而不是取代HBM或DRAM。

事實上,英偉達CEO黃仁勛也在1月CES的分析師問答活動上詳細解釋過這件事。

黃仁勛表示,如果把所有東西都放在SRAM里,那么當(dāng)然就不需要HBM內(nèi)存了。但問題是:能夠放進這些SRAM里的模型規(guī)模會小大約100倍。工作負載的形態(tài)一直在變化,有時候會遇到MoE模型,還有多模態(tài)模型等,因此英偉達需要提供普適性的解決方案。

黃仁勛也指出,對于某些特定工作負載來說,SRAM可能會“快得驚人”,因此在預(yù)填充階段和解碼階段可以看到一些好處。

2.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。