123,123

补齐AI推理拼图英伟达揭秘Groq LPU整合路线图

日期： 2026-02-27

來(lái)源：IT之家

關(guān)鍵詞： 英伟达 AI推理 Groq LPU

2 月 27 日消息，科技媒體 Wccftech 昨日（2 月 26 日）發(fā)布博文，報(bào)道稱在 2026 財(cái)年第 4 財(cái)季（截至 2026 年 1 月）財(cái)報(bào)會(huì)議上，英偉達(dá) CEO 黃仁勛透露了收購(gòu) Groq 后的核心整合計(jì)劃。

重要性方面，黃仁勛將此次價(jià)值 200 億美元（IT之家注：現(xiàn)匯率約合 1370.47 億元人民幣）的非授權(quán)收購(gòu)，和當(dāng)年收購(gòu) Mellanox 相提并論，暗示 Groq 將在英偉達(dá)的 AI 版圖中發(fā)揮革命性的基礎(chǔ)作用，具體的架構(gòu)整合細(xì)節(jié)將于下月召開(kāi)的 GTC 2026 大會(huì)上公布。

戰(zhàn)略布局方面，黃仁勛強(qiáng)調(diào) Groq 將補(bǔ)齊 AI 推理階段的短板，實(shí)現(xiàn)超低延遲的解碼能力。AI 行業(yè)目前正加速邁向多智能體協(xié)同（Agentic AI）時(shí)代，應(yīng)用層要求極低的延遲和超快的響應(yīng)速度。

英偉達(dá)憑借 Hopper 和 Blackwell 架構(gòu)絕對(duì)主導(dǎo)了 AI 模型訓(xùn)練市場(chǎng)，并通過(guò) Rubin CPX 架構(gòu)的注意力加速引擎，覆蓋了推理的“預(yù)填充”（Prefill）階段，但在對(duì)延遲極度敏感的“解碼”（Decode）環(huán)節(jié)，公司亟需引入 Groq 的技術(shù)來(lái)確立行業(yè)標(biāo)桿。

技術(shù)實(shí)現(xiàn)方面，英偉達(dá)希望全面釋放 Groq 的硬件潛力。Groq 的語(yǔ)言處理單元（LPU）采用片上 SRAM（靜態(tài)隨機(jī)存取存儲(chǔ)器），能夠提供每秒數(shù)十 TB 的內(nèi)部超高帶寬。

這種技術(shù)路線此前已被 Cerebras（WSE-3）和微軟（Maia 300）等巨頭采用。通過(guò)引入 LPU，AI 智能體能夠在短短幾秒內(nèi)完成復(fù)雜的邏輯推理步驟，從而有效打破多智能體相互協(xié)作時(shí)的算力瓶頸。

format,f_avif.avif.jpg

針對(duì)具體的硬件落地形態(tài)，廣發(fā)證券預(yù)測(cè)英偉達(dá)將在 GTC 大會(huì)上推出名為“LPX 機(jī)架”的混合計(jì)算方案。該方案預(yù)計(jì)會(huì)在單個(gè)機(jī)架內(nèi)集成 256 個(gè) LPU 單元。

在數(shù)據(jù)傳輸方面，LPU 之間將采用原生的準(zhǔn)同步芯片間協(xié)議進(jìn)行連接；而 LPU 與 GPU 之間則有望通過(guò) NVLink Fusion 技術(shù)互聯(lián)，從而在預(yù)填充階段高效處理來(lái)自 GPU 的海量 KV 緩存卸載。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

补齐AI推理拼图 英伟达揭秘Groq LPU整合路线图

日期： 2026-02-27

來(lái)源：IT之家

相關(guān)內(nèi)容

补齐AI推理拼图英伟达揭秘Groq LPU整合路线图