《電子技術(shù)應用》
您所在的位置:首頁 > 人工智能 > 业界动态 > 补齐AI推理拼图 英伟达揭秘Groq LPU整合路线图

补齐AI推理拼图 英伟达揭秘Groq LPU整合路线图

2026-02-27
來源:IT之家
關鍵詞: 英伟达 AI推理 Groq LPU

2 月 27 日消息,科技媒體 Wccftech 昨日(2 月 26 日)發(fā)布博文,報道稱在 2026 財年第 4 財季(截至 2026 年 1 月)財報會議上,英偉達 CEO 黃仁勛透露了收購 Groq 后的核心整合計劃。

重要性方面,黃仁勛將此次價值 200 億美元(IT之家注:現(xiàn)匯率約合 1370.47 億元人民幣)的非授權(quán)收購,和當年收購 Mellanox 相提并論,暗示 Groq 將在英偉達的 AI 版圖中發(fā)揮革命性的基礎作用,具體的架構(gòu)整合細節(jié)將于下月召開的 GTC 2026 大會上公布。

戰(zhàn)略布局方面,黃仁勛強調(diào) Groq 將補齊 AI 推理階段的短板,實現(xiàn)超低延遲的解碼能力。AI 行業(yè)目前正加速邁向多智能體協(xié)同(Agentic AI)時代,應用層要求極低的延遲和超快的響應速度。

英偉達憑借 Hopper 和 Blackwell 架構(gòu)絕對主導了 AI 模型訓練市場,并通過 Rubin CPX 架構(gòu)的注意力加速引擎,覆蓋了推理的“預填充”(Prefill)階段,但在對延遲極度敏感的“解碼”(Decode)環(huán)節(jié),公司亟需引入 Groq 的技術(shù)來確立行業(yè)標桿。

技術(shù)實現(xiàn)方面,英偉達希望全面釋放 Groq 的硬件潛力。Groq 的語言處理單元(LPU)采用片上 SRAM(靜態(tài)隨機存取存儲器),能夠提供每秒數(shù)十 TB 的內(nèi)部超高帶寬。

這種技術(shù)路線此前已被 Cerebras(WSE-3)和微軟(Maia 300)等巨頭采用。通過引入 LPU,AI 智能體能夠在短短幾秒內(nèi)完成復雜的邏輯推理步驟,從而有效打破多智能體相互協(xié)作時的算力瓶頸。

format,f_avif.avif.jpg

針對具體的硬件落地形態(tài),廣發(fā)證券預測英偉達將在 GTC 大會上推出名為“LPX 機架”的混合計算方案。該方案預計會在單個機架內(nèi)集成 256 個 LPU 單元。

在數(shù)據(jù)傳輸方面,LPU 之間將采用原生的準同步芯片間協(xié)議進行連接;而 LPU 與 GPU 之間則有望通過 NVLink Fusion 技術(shù)互聯(lián),從而在預填充階段高效處理來自 GPU 的海量 KV 緩存卸載。

2.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。