2月3日,云天勵飛正式舉辦“大算力芯片戰(zhàn)略前瞻會”,首次對外公布未來三年的大算力 AI 推理芯片戰(zhàn)略布局。面對人工智能從“基礎(chǔ)模型構(gòu)建”邁向“規(guī)?;瘧?yīng)用落地”的重要轉(zhuǎn)折點,公司宣布將核心研發(fā)資源集中于攻克大模型落地的“成本壁壘”,致力于通過底層架構(gòu)創(chuàng)新,力爭實現(xiàn)百萬 Tokens 推理成本降低 100 倍以上的目標,推動 AI 從技術(shù)嘗鮮走向普惠生產(chǎn)力。

值得一提的是,雖然目前云天勵飛在A股的市值只有300億元左右,但是鑒于對于未來AI推理市場需求持續(xù)爆發(fā)的看好,以及對于云天勵飛攜全新 GPNPU 技術(shù)路線進入市場空間更大的大算力云端AI推理芯片市場的看好,在會議最后,云天勵飛董事長兼CEO陳寧博士還提出了未來五年內(nèi),公司市值突破萬億元的愿景。
一、 產(chǎn)業(yè)變局:推理競速,從“參數(shù)內(nèi)卷”轉(zhuǎn)向“效能為王”
過去一年,全球算力產(chǎn)業(yè)的風(fēng)向標已發(fā)生顯著偏轉(zhuǎn),重心正加速向推理側(cè)傾斜。谷歌在 2025 年 4 月發(fā)布第七代 TPU “Ironwood”時,明確將其定位為“面向推理時代”的基石,強調(diào)在大規(guī)模推理與能效上的系統(tǒng)化優(yōu)化。
與此同時,圍繞“更低時延、更低成本”的推理芯片與系統(tǒng)能力,產(chǎn)業(yè)整合動作也在加速。2025 年 12 月,英偉達斥資200億美元與推理AI芯片廠商 Groq 達成非獨占許可安排,并吸納其核心工程人才團隊加入,此舉被視為強化推理與實時工作負載能力的關(guān)鍵布局。

這些行業(yè)信號共同指向一個趨勢:推理側(cè)競爭已不再單純是“把模型做得更強”的參數(shù)競賽,而是“讓應(yīng)用跑得更久、更穩(wěn)、更便宜”的效能競賽,單位推理成本與交付效率已成為規(guī)?;涞氐淖畲箝T檻。
二、 架構(gòu)破局:GPNPU 路線重新定義“通用生態(tài)”與“極致能效”
推理時代的勝負手不在單點指標,而在系統(tǒng)級協(xié)同:既要承接主流軟件生態(tài),又要在推理負載下實現(xiàn)更優(yōu)能效與更低時延。
云天勵飛確立了 GPNPU 技術(shù)路線,并提出了“GPNPU = GPGPU + NPU + 3D 堆疊存儲”的核心公式,旨在兼顧通用計算的“通用性”與 NPU 的“高效性”,在工程層面同時解決可遷移、可部署、可持續(xù)降本三大難題。

在通用生態(tài)層面,鑒于 CUDA 仍是全球最成熟、覆蓋最廣的加速計算平臺之一,云天勵飛的 GPNPU 架構(gòu)致力于正視主流生態(tài)的遷移成本問題,能夠?qū)崿F(xiàn)一行代碼完成 CUDA 程序兼容,極大降低了進入生產(chǎn)系統(tǒng)的門檻。
在推理能效層面,NPU 能夠?qū)崿F(xiàn)更高的計算效率和能效比,面對大模型推理這種高度結(jié)構(gòu)化、可被體系化優(yōu)化的負載,專用化設(shè)計帶來的能效優(yōu)勢更容易轉(zhuǎn)化為真實成本優(yōu)勢,這也是國際廠商持續(xù)加碼專用路線的重要原因。
同時,針對行業(yè)公認的“內(nèi)存墻”瓶頸,云天勵飛正深度研發(fā) 3D 堆疊存儲及更前沿的互連技術(shù),以提升帶寬與能效,降低推理時延。
在架構(gòu)工程與產(chǎn)品化路徑上,云天勵飛進一步強調(diào)了兩項可落地的優(yōu)勢。首先是“算力積木”架構(gòu),即通過 Chiplet 擴展與互連思路,將標準計算單元進行模塊化封裝與組合,讓算力像搭積木一樣按需擴展,形成從邊緣到更大規(guī)模推理的彈性產(chǎn)品形態(tài)。
其次是面向推理的系統(tǒng)級優(yōu)化能力,公司拒絕單純的“芯片參數(shù)競賽”,而是主張把“模型怎么跑得更省”沉淀到架構(gòu)里,圍繞真實業(yè)務(wù)負載持續(xù)迭代,逐項擊穿推理鏈路中的成本與時延瓶頸,最終形成可復(fù)制交付的綜合最優(yōu)解。
三、 五大核心要素構(gòu)筑堅實護城河,將打造千卡集群
云天勵飛董事長兼 CEO 陳寧在演講中指出,支撐公司跨越周期的,是長期積累構(gòu)筑的商業(yè)護城河。他將核心競爭力總結(jié)為技術(shù)、產(chǎn)能、生態(tài)、市場、資本五大關(guān)鍵要素。這五大維度的協(xié)同共振,不僅是云天勵飛應(yīng)對行業(yè)激烈競爭的底氣,更為未來三年戰(zhàn)略的穩(wěn)步落地提供了堅實的體系化保障。
針對行業(yè)普遍關(guān)注的供應(yīng)鏈安全問題,云天勵飛高級副總裁、CFO 兼董秘鄧浩然特別強調(diào),公司目前是國內(nèi)屈指可數(shù)手握充足國產(chǎn)產(chǎn)能保障的企業(yè)之一,這一戰(zhàn)略儲備為后續(xù)芯片的大規(guī)模量產(chǎn)與交付提供了極高的確定性。

陳寧還詳細解讀了云天勵飛的“1+4”架構(gòu):“1”指聚焦于AI大算力推理芯片,“4”則是四大事業(yè)部。

作為生態(tài)構(gòu)建者,四大事業(yè)部旨在解決芯片從“研發(fā)生產(chǎn)、優(yōu)化打磨到市場推廣”的核心難題。其中,政企事業(yè)部作為基石,將憑借深厚的行業(yè)經(jīng)驗,將戰(zhàn)略重點轉(zhuǎn)向推理設(shè)備和智算中心的建設(shè)。此外,云天勵飛還計劃打造區(qū)域級“千卡集群”,樹立城市AI算力賦能的新標桿。
四、 藍圖展開:DeepVerse 領(lǐng)銜,全場景算力矩陣精準卡位
面向未來三年的規(guī)劃,云天勵飛CTO李愛軍表示,將不遺余力投入大算力芯片DeepVerse的研發(fā),圍繞推理成本、時延與吞吐的核心矛盾持續(xù)迭代,并按產(chǎn)品節(jié)奏梯度覆蓋市場需求。
路線圖將對標國際主流平臺的代際演進,聚焦長上下文預(yù)填充(Prefill)、低時延解碼(Decode)等關(guān)鍵推理階段的系統(tǒng)優(yōu)化,在真實負載下持續(xù)兌現(xiàn)“更便宜、更穩(wěn)定、更易部署”的交付目標。

根據(jù)云天勵飛公布的未來三年大算力芯片規(guī)劃路線圖來看,云天勵飛的GPNPU將采用PD分離?& AFN分離?&超節(jié)點架構(gòu)設(shè)計,2028年的產(chǎn)品將有望對標英偉達Rubin架構(gòu)。

推理時代的競爭,本質(zhì)是“單位推理成本”的競爭。只有把推理做得足夠便宜、足夠穩(wěn)定、足夠易用,AI 才能從“看得見的能力”走向“用得起的生產(chǎn)力”。
未來,云天勵飛將以 GPNPU 架構(gòu)為核心,大力推進云端大算力強化軟硬協(xié)同與存儲體系攻堅,力爭將百萬 Tokens 推理成本降低 100 倍以上,推動大模型從示范應(yīng)用走向規(guī)?;桓?。
五、第四次工業(yè)革命的反超
業(yè)界普遍認為,2030年AGI將會實現(xiàn),這或?qū)⒊蔀椤暗谒拇喂I(yè)革命”開始的一個標志性里程碑的時間點。
陳寧博士指出:“大家知道我們中國有四大發(fā)明,曾經(jīng)我們的中華文明領(lǐng)先全球一兩千年的時間。但是 300 年前,第一臺蒸汽機打破了這樣的一個格局,讓英國成為了全球第一個日不落帝國;200 年前的第一個燈泡又出現(xiàn)在美國,而美國依托電力時代的革命,通過汽車工業(yè)迎來了快速的一兩百年的經(jīng)濟發(fā)展;100年前,第一臺計算機出現(xiàn)在美國,帶動了信息化的第三次的工業(yè)革命,讓美國真正成為了科技、經(jīng)濟、軍事、文化甚至人類文明的代言人,去制定了世界運行的規(guī)則。今天,我們站在第四次工業(yè)革命的門口,大概率是在 2030 年,我們將會全面進入第四次工業(yè)革命?!?/p>
而AGI的實現(xiàn)離不開大算力AI芯片、優(yōu)秀的人工智能模型、充足的能源供應(yīng)的加持,同樣中國的人工智能產(chǎn)業(yè)能否抓住這樣一個歷史機遇,這些也是最為關(guān)鍵的因素。
“中國在能源、開源模型、應(yīng)用、基礎(chǔ)設(shè)施都可以說在全球遙遙領(lǐng)先,唯獨 AI 的芯片上比較薄弱。但是未來 5 ~ 10年,對于工業(yè)革命最重要的并不是AI訓(xùn)練芯片,而是端邊云的 AI 的推理芯片,這也是為什么我們云天勵飛去 !All in 大算力的 AI 推理芯片,我認為 AI 推理芯片是能否率先進入第四次工業(yè)革命的關(guān)鍵。如果可以,我們就有機會讓中華文明在第四次工業(yè)革命中再度領(lǐng)先全球。而在座的每一位云天人,讓我們同心聚力,破壁前行,把我們的名字刻在 AI 的發(fā)展史上!”陳寧博士充滿期待地說。

