2 月 27 日消息,科技媒體 Wccftech 昨日(2 月 26 日)發(fā)布博文,報道稱在 2026 財年第 4 財季(截至 2026 年 1 月)財報會議上,英偉達 CEO 黃仁勛透露了收購 Groq 后的核心整合計劃。
重要性方面,黃仁勛將此次價值 200 億美元(IT之家注:現(xiàn)匯率約合 1370.47 億元人民幣)的非授權(quán)收購,和當年收購 Mellanox 相提并論,暗示 Groq 將在英偉達的 AI 版圖中發(fā)揮革命性的基礎作用,具體的架構(gòu)整合細節(jié)將于下月召開的 GTC 2026 大會上公布。
戰(zhàn)略布局方面,黃仁勛強調(diào) Groq 將補齊 AI 推理階段的短板,實現(xiàn)超低延遲的解碼能力。AI 行業(yè)目前正加速邁向多智能體協(xié)同(Agentic AI)時代,應用層要求極低的延遲和超快的響應速度。
英偉達憑借 Hopper 和 Blackwell 架構(gòu)絕對主導了 AI 模型訓練市場,并通過 Rubin CPX 架構(gòu)的注意力加速引擎,覆蓋了推理的“預填充”(Prefill)階段,但在對延遲極度敏感的“解碼”(Decode)環(huán)節(jié),公司亟需引入 Groq 的技術(shù)來確立行業(yè)標桿。
技術(shù)實現(xiàn)方面,英偉達希望全面釋放 Groq 的硬件潛力。Groq 的語言處理單元(LPU)采用片上 SRAM(靜態(tài)隨機存取存儲器),能夠提供每秒數(shù)十 TB 的內(nèi)部超高帶寬。
這種技術(shù)路線此前已被 Cerebras(WSE-3)和微軟(Maia 300)等巨頭采用。通過引入 LPU,AI 智能體能夠在短短幾秒內(nèi)完成復雜的邏輯推理步驟,從而有效打破多智能體相互協(xié)作時的算力瓶頸。

針對具體的硬件落地形態(tài),廣發(fā)證券預測英偉達將在 GTC 大會上推出名為“LPX 機架”的混合計算方案。該方案預計會在單個機架內(nèi)集成 256 個 LPU 單元。
在數(shù)據(jù)傳輸方面,LPU 之間將采用原生的準同步芯片間協(xié)議進行連接;而 LPU 與 GPU 之間則有望通過 NVLink Fusion 技術(shù)互聯(lián),從而在預填充階段高效處理來自 GPU 的海量 KV 緩存卸載。

