2 月 27 日消息,科技媒體 Wccftech 昨日(2 月 26 日)發(fā)布博文,報(bào)道稱在 2026 財(cái)年第 4 財(cái)季(截至 2026 年 1 月)財(cái)報(bào)會(huì)議上,英偉達(dá) CEO 黃仁勛透露了收購(gòu) Groq 后的核心整合計(jì)劃。
重要性方面,黃仁勛將此次價(jià)值 200 億美元(IT之家注:現(xiàn)匯率約合 1370.47 億元人民幣)的非授權(quán)收購(gòu),和當(dāng)年收購(gòu) Mellanox 相提并論,暗示 Groq 將在英偉達(dá)的 AI 版圖中發(fā)揮革命性的基礎(chǔ)作用,具體的架構(gòu)整合細(xì)節(jié)將于下月召開(kāi)的 GTC 2026 大會(huì)上公布。
戰(zhàn)略布局方面,黃仁勛強(qiáng)調(diào) Groq 將補(bǔ)齊 AI 推理階段的短板,實(shí)現(xiàn)超低延遲的解碼能力。AI 行業(yè)目前正加速邁向多智能體協(xié)同(Agentic AI)時(shí)代,應(yīng)用層要求極低的延遲和超快的響應(yīng)速度。
英偉達(dá)憑借 Hopper 和 Blackwell 架構(gòu)絕對(duì)主導(dǎo)了 AI 模型訓(xùn)練市場(chǎng),并通過(guò) Rubin CPX 架構(gòu)的注意力加速引擎,覆蓋了推理的“預(yù)填充”(Prefill)階段,但在對(duì)延遲極度敏感的“解碼”(Decode)環(huán)節(jié),公司亟需引入 Groq 的技術(shù)來(lái)確立行業(yè)標(biāo)桿。
技術(shù)實(shí)現(xiàn)方面,英偉達(dá)希望全面釋放 Groq 的硬件潛力。Groq 的語(yǔ)言處理單元(LPU)采用片上 SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器),能夠提供每秒數(shù)十 TB 的內(nèi)部超高帶寬。
這種技術(shù)路線此前已被 Cerebras(WSE-3)和微軟(Maia 300)等巨頭采用。通過(guò)引入 LPU,AI 智能體能夠在短短幾秒內(nèi)完成復(fù)雜的邏輯推理步驟,從而有效打破多智能體相互協(xié)作時(shí)的算力瓶頸。

針對(duì)具體的硬件落地形態(tài),廣發(fā)證券預(yù)測(cè)英偉達(dá)將在 GTC 大會(huì)上推出名為“LPX 機(jī)架”的混合計(jì)算方案。該方案預(yù)計(jì)會(huì)在單個(gè)機(jī)架內(nèi)集成 256 個(gè) LPU 單元。
在數(shù)據(jù)傳輸方面,LPU 之間將采用原生的準(zhǔn)同步芯片間協(xié)議進(jìn)行連接;而 LPU 與 GPU 之間則有望通過(guò) NVLink Fusion 技術(shù)互聯(lián),從而在預(yù)填充階段高效處理來(lái)自 GPU 的海量 KV 緩存卸載。

