3月5日消息,隨著韓國股市近3天坐上“過山車”,一些揣測(cè)也在股價(jià)巨震期間敲打著股民們緊繃的神經(jīng)。
作為背景,上周五美股收盤后有爆料稱,英偉達(dá)將在當(dāng)?shù)貢r(shí)間3月16日舉行的GTC大會(huì)上發(fā)布一款專門用于推理計(jì)算的新系統(tǒng),這個(gè)新平臺(tái)將采用初創(chuàng)公司Groq設(shè)計(jì)的芯片。
隨著上周末中東戰(zhàn)火重燃,韓國股市周一休市后,周二、周三均遭遇大跌,三星電子、SK海力士均累計(jì)跌近20%。除了中東戰(zhàn)火外,市場(chǎng)里似乎也有一些聲音將內(nèi)存巨頭的大跌歸因于“Groq搶了HBM的飯碗”。

(三星電子、SK海力士周四均強(qiáng)勁反彈,來源:TradingView)
何來憂慮?
作為背景,英偉達(dá)去年底豪擲200億美元,獲得芯片初創(chuàng)公司Groq的人才團(tuán)隊(duì)和非獨(dú)占專利授權(quán)。這也是英偉達(dá)在核心算力芯片產(chǎn)品上首次大規(guī)模引入外部架構(gòu)。
引發(fā)部分三星、海力士股東焦慮的點(diǎn),正是Groq自研的LPU(語言處理單元)芯片。該芯片的核心特點(diǎn)是在片上集成數(shù)百兆SRAM(訪問速度比HBM快約20倍),通過減少或者完全不調(diào)用外部存儲(chǔ),實(shí)現(xiàn)超低延遲的token輸出。
隨著英偉達(dá)發(fā)布會(huì)臨近,“Groq是否利空HBM”又被拿來討論:如果推理芯片路線從HBM堆料轉(zhuǎn)向片上SRAM,存儲(chǔ)公司的生意不是被搶走了么?
作為這一猜想的佐證,OpenAI上周五在宣布獲得英偉達(dá)300億美元融資時(shí),就專門強(qiáng)調(diào)將從該公司購買大量“專用推理算力”,暗示了這款新型處理器的存在。
黃仁勛也曾表示,將在GTC上發(fā)布“世界前所未見”的全新芯片。市場(chǎng)猜測(cè),如果不是Rubin CPX或下一代Feynman架構(gòu)的GPU旗艦產(chǎn)品,確有可能是以SRAM為核心的LPU。
兩者真的是替代關(guān)系么?
對(duì)于這種說法,韓國科技分析師Jukan周四開盤前引用獨(dú)立分析機(jī)構(gòu)KIS的分析稱,認(rèn)為SRAM推理芯片的出現(xiàn)將減少HBM使用的想法,反映出對(duì)存儲(chǔ)器的理解不足。
分析稱,與DRAM相比,SRAM的單元面積大、密度低。相同容量的SRAM需要DRAM 5到10倍的芯片面積,因此也限制了容量的擴(kuò)展。正因如此,SRAM歷來被用于對(duì)延遲要求極低的緩存或片上緩沖區(qū)應(yīng)用,而不是作為存儲(chǔ)大量數(shù)據(jù)的主存儲(chǔ)器。
因此,與其說取代GPU,這類芯片更多會(huì)成為針對(duì)特定推理工作的額外選擇,例如需要極低延遲的物理AI邊緣應(yīng)用(機(jī)器人和自動(dòng)駕駛),而不是取代HBM或DRAM。
事實(shí)上,英偉達(dá)CEO黃仁勛也在1月CES的分析師問答活動(dòng)上詳細(xì)解釋過這件事。
黃仁勛表示,如果把所有東西都放在SRAM里,那么當(dāng)然就不需要HBM內(nèi)存了。但問題是:能夠放進(jìn)這些SRAM里的模型規(guī)模會(huì)小大約100倍。工作負(fù)載的形態(tài)一直在變化,有時(shí)候會(huì)遇到MoE模型,還有多模態(tài)模型等,因此英偉達(dá)需要提供普適性的解決方案。
黃仁勛也指出,對(duì)于某些特定工作負(fù)載來說,SRAM可能會(huì)“快得驚人”,因此在預(yù)填充階段和解碼階段可以看到一些好處。

