《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 业界动态 > 补齐AI推理拼图 英伟达揭秘Groq LPU整合路线图

补齐AI推理拼图 英伟达揭秘Groq LPU整合路线图

2026-02-27
來(lái)源:IT之家
關(guān)鍵詞: 英伟达 AI推理 Groq LPU

2 月 27 日消息,科技媒體 Wccftech 昨日(2 月 26 日)發(fā)布博文,報(bào)道稱在 2026 財(cái)年第 4 財(cái)季(截至 2026 年 1 月)財(cái)報(bào)會(huì)議上,英偉達(dá) CEO 黃仁勛透露了收購(gòu) Groq 后的核心整合計(jì)劃。

重要性方面,黃仁勛將此次價(jià)值 200 億美元(IT之家注:現(xiàn)匯率約合 1370.47 億元人民幣)的非授權(quán)收購(gòu),和當(dāng)年收購(gòu) Mellanox 相提并論,暗示 Groq 將在英偉達(dá)的 AI 版圖中發(fā)揮革命性的基礎(chǔ)作用,具體的架構(gòu)整合細(xì)節(jié)將于下月召開(kāi)的 GTC 2026 大會(huì)上公布。

戰(zhàn)略布局方面,黃仁勛強(qiáng)調(diào) Groq 將補(bǔ)齊 AI 推理階段的短板,實(shí)現(xiàn)超低延遲的解碼能力。AI 行業(yè)目前正加速邁向多智能體協(xié)同(Agentic AI)時(shí)代,應(yīng)用層要求極低的延遲和超快的響應(yīng)速度。

英偉達(dá)憑借 Hopper 和 Blackwell 架構(gòu)絕對(duì)主導(dǎo)了 AI 模型訓(xùn)練市場(chǎng),并通過(guò) Rubin CPX 架構(gòu)的注意力加速引擎,覆蓋了推理的“預(yù)填充”(Prefill)階段,但在對(duì)延遲極度敏感的“解碼”(Decode)環(huán)節(jié),公司亟需引入 Groq 的技術(shù)來(lái)確立行業(yè)標(biāo)桿。

技術(shù)實(shí)現(xiàn)方面,英偉達(dá)希望全面釋放 Groq 的硬件潛力。Groq 的語(yǔ)言處理單元(LPU)采用片上 SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器),能夠提供每秒數(shù)十 TB 的內(nèi)部超高帶寬。

這種技術(shù)路線此前已被 Cerebras(WSE-3)和微軟(Maia 300)等巨頭采用。通過(guò)引入 LPU,AI 智能體能夠在短短幾秒內(nèi)完成復(fù)雜的邏輯推理步驟,從而有效打破多智能體相互協(xié)作時(shí)的算力瓶頸。

format,f_avif.avif.jpg

針對(duì)具體的硬件落地形態(tài),廣發(fā)證券預(yù)測(cè)英偉達(dá)將在 GTC 大會(huì)上推出名為“LPX 機(jī)架”的混合計(jì)算方案。該方案預(yù)計(jì)會(huì)在單個(gè)機(jī)架內(nèi)集成 256 個(gè) LPU 單元。

在數(shù)據(jù)傳輸方面,LPU 之間將采用原生的準(zhǔn)同步芯片間協(xié)議進(jìn)行連接;而 LPU 與 GPU 之間則有望通過(guò) NVLink Fusion 技術(shù)互聯(lián),從而在預(yù)填充階段高效處理來(lái)自 GPU 的海量 KV 緩存卸載。

2.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。