123,123

摩尔线程全功能GPU技术路线图首次全公开

新架构+万卡训练+推理突破

日期： 2025-12-22

來源：C114通信网

關(guān)鍵詞： 摩尔线程 GPU MUSA

摩爾線程首屆MUSA開發(fā)者大會(huì)（簡(jiǎn)稱：MDC 2025）在北京中關(guān)村國際創(chuàng)新中心正式開幕。作為國內(nèi)首個(gè)聚焦全功能GPU的開發(fā)者技術(shù)盛會(huì)，大會(huì)系統(tǒng)展示了摩爾線程以自主MUSA統(tǒng)一架構(gòu)為核心的全棧技術(shù)成果，全面展現(xiàn)公司在高端全功能GPU領(lǐng)域的關(guān)鍵突破與前瞻布局。

本次發(fā)布的核心成果包括：

1、新架構(gòu)“花港”亮相：全功能GPU架構(gòu)“花港”，支持FP4到FP64的全精度計(jì)算，算力密度提升50%，效能提升10倍。未來并將基于該架構(gòu)推出高性能AI訓(xùn)推一體“華山”芯片與專攻高性能圖形渲染的“廬山”芯片。

2、“夸娥萬卡”高效訓(xùn)練：發(fā)布夸娥萬卡智算集群，展示了其支撐萬億參數(shù)模型訓(xùn)練的工程化能力與可靠性，在多項(xiàng)關(guān)鍵精度指標(biāo)上達(dá)到國際主流水平。

3、推理性能實(shí)現(xiàn)跨越：摩爾線程聯(lián)合硅基流動(dòng)，在DeepSeek R1 671B全量模型上實(shí)現(xiàn)性能突破，MTT S5000單卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s，樹立國產(chǎn)推理性能新標(biāo)桿。

4、超節(jié)點(diǎn)架構(gòu)前瞻：分享面向下一代超大規(guī)模智算中心的MTT C256超節(jié)點(diǎn)架構(gòu)，著眼高密硬件架構(gòu)，實(shí)現(xiàn)極致智算性能。

5、全新個(gè)人智算平臺(tái)：正式發(fā)布搭載智能SoC芯片“長(zhǎng)江”的AI算力本MTT AIBOOK，賦能“摩爾學(xué)院”20萬開發(fā)者與學(xué)習(xí)者。

6、圖形進(jìn)化與前沿探索：揭曉硬件級(jí)光線追蹤加速與自研AI生成式渲染技術(shù)，具身智能、科學(xué)智能（AI4S）、AI for 6G等前沿領(lǐng)域的深度布局，進(jìn)一步印證了全功能GPU技術(shù)路線的廣度與面向未來的可擴(kuò)展性。

這一系列成果的發(fā)布，標(biāo)志著摩爾線程已成功構(gòu)建起一套以自主統(tǒng)一架構(gòu)為根基、貫穿“芯-邊-端-云”的完整技術(shù)棧，實(shí)現(xiàn)了從底層硬件到上層應(yīng)用的系統(tǒng)化閉環(huán)。該體系為國產(chǎn)智能計(jì)算生態(tài)的持續(xù)演進(jìn)與產(chǎn)業(yè)融合，提供了堅(jiān)實(shí)、開放且可持續(xù)的平臺(tái)級(jí)支撐。

戰(zhàn)略基石：MUSA統(tǒng)一架構(gòu)的進(jìn)化與開放

MUSA（Meta-computing Unified System Architecture）是摩爾線程自主研發(fā)的元計(jì)算統(tǒng)一計(jì)算架構(gòu)，覆蓋從芯片架構(gòu)、指令集、編程模型到軟件運(yùn)行庫及驅(qū)動(dòng)程序框架等的全棧技術(shù)體系。

MUSA不僅完整定義了從芯片設(shè)計(jì)到軟件生態(tài)的統(tǒng)一技術(shù)標(biāo)準(zhǔn)，更代表了公司堅(jiān)持底層創(chuàng)新、踐行長(zhǎng)期主義的戰(zhàn)略核心，并為全功能GPU奠定了堅(jiān)實(shí)的技術(shù)根基，可高效支持AI計(jì)算、圖形渲染、物理仿真和科學(xué)計(jì)算、超高清視頻編解碼等全場(chǎng)景高性能計(jì)算。

歷經(jīng)五年深度研發(fā)與持續(xù)迭代，MUSA實(shí)現(xiàn)了軟件性能的指數(shù)級(jí)跨越。全新升級(jí)的MUSA 5.0標(biāo)志著架構(gòu)步入成熟新階段，在全棧統(tǒng)一性、極致效能與生態(tài)開放性上取得關(guān)鍵突破。

編程生態(tài)全面升級(jí)：原生MUSA C，深度兼容 TileLang、Triton 等編程語言，為開發(fā)者提供靈活高效的全棧開發(fā)體驗(yàn)。

計(jì)算效能極致優(yōu)化：核心計(jì)算庫muDNN實(shí)現(xiàn)GEMM/FlashAttention效率超98%，通信效率達(dá)97%，編譯器性能提升3倍，并集成高性能算子庫，顯著加速訓(xùn)練與推理全流程。

開源生態(tài)持續(xù)擴(kuò)大：計(jì)劃逐步開源計(jì)算加速庫、通信庫及系統(tǒng)管理框架在內(nèi)的核心組件，向開發(fā)者社區(qū)開放深度優(yōu)化的底層能力。

前沿特性拓展邊界：即將推出兼容跨代GPU指令架構(gòu)的中間語言MTX、面向渲染+AI融合計(jì)算的編程語言muLang、量子計(jì)算融合框架MUSA-Q，以及計(jì)算光刻庫muLitho，持續(xù)拓展全功能GPU的算力邊界。

硬件核心：“花港”新架構(gòu)與技術(shù)路線圖

基于MUSA統(tǒng)一體系，摩爾線程揭曉新一代全功能GPU架構(gòu)“花港”，該架構(gòu)在計(jì)算密度、能效、精度支持、互聯(lián)能力及圖形技術(shù)等方面實(shí)現(xiàn)全面突破，其核心特性包括：

計(jì)算性能顯著提升：基于新一代指令集，算力密度提升50%，能效大幅優(yōu)化；支持從FP4到FP64的全精度端到端計(jì)算，新增MTFP6/MTFP4及混合低精度支持。

異步編程與超大規(guī)模互聯(lián)：集成新一代異步編程模型，優(yōu)化任務(wù)調(diào)度與并行機(jī)制；通過自研MTLink高速互聯(lián)技術(shù)，支持十萬卡以上規(guī)模智算集群擴(kuò)展。

圖形與AI深度融合：內(nèi)置AI生成式渲染架構(gòu)，增強(qiáng)硬件光線追蹤加速引擎，完整支持DirectX 12 Ultimate，實(shí)現(xiàn)圖形渲染與智能計(jì)算的高度協(xié)同。

全棧自研與安全可信：架構(gòu)基于全棧自主研發(fā)，擁有扎實(shí)的專利壁壘（截至2025年6月30日，公司累計(jì)授權(quán)專利514項(xiàng)，其中發(fā)明專利468項(xiàng)），具備全棧自研與自主可控的核心能力。通過四層硬件安全架構(gòu)，提供從芯片到系統(tǒng)的可驗(yàn)證安全守護(hù)。

基于“花港”架構(gòu)，摩爾線程公布了未來將發(fā)布的兩款芯片技術(shù)路線：

“華山”專注AI訓(xùn)推一體與超大規(guī)模智能計(jì)算。集成新一代異步編程與全精度張量計(jì)算單元，支持從FP4至FP64的全精度計(jì)算，為萬卡級(jí)智算集群提供穩(wěn)定高效的算力支撐，是構(gòu)建下一代“AI工廠”的堅(jiān)實(shí)底座。

“廬山”專攻高性能圖形渲染。其圖形性能實(shí)現(xiàn)全面跨越：AI計(jì)算性能提升64倍，幾何處理性能提升16倍，光線追蹤性能提升50倍，并顯著增強(qiáng)紋理填充、原子訪存能力及顯存容量。集成AI生成式渲染、UniTE統(tǒng)一渲染架構(gòu)及全新硬件光追引擎，為3A游戲、高端圖形創(chuàng)作提供強(qiáng)大算力支持。

基礎(chǔ)設(shè)施：夸娥萬卡集群，樹立國產(chǎn)智算效率標(biāo)桿

本次大會(huì)正式發(fā)布了夸娥萬卡智算集群。該集群具備全精度、全功能通用計(jì)算能力，在萬卡規(guī)模下實(shí)現(xiàn)高效穩(wěn)定的AI訓(xùn)練與推理。其核心突破包括：浮點(diǎn)運(yùn)算能力達(dá)到10Exa-Flops，訓(xùn)練算力利用率（MFU）在Dense大模型上達(dá)60%，MOE大模型上達(dá)40%，有效訓(xùn)練時(shí)間占比超過90%，訓(xùn)練線性擴(kuò)展效率達(dá)95%，與國際主流生態(tài)高度兼容，并在多項(xiàng)指標(biāo)上具備顯著能效優(yōu)勢(shì)。

在訓(xùn)練側(cè)，基于原生FP8能力完整復(fù)現(xiàn)頂尖大模型訓(xùn)練流程，并在多項(xiàng)關(guān)鍵精度指標(biāo)上達(dá)到國際主流水平。技術(shù)層面實(shí)現(xiàn)關(guān)鍵優(yōu)化：Flash Attention算力利用率超95%，并突破FP8累加精度等關(guān)鍵技術(shù)瓶頸，充分釋放國產(chǎn)GPU在大模型訓(xùn)練中的性能潛力。

在推理側(cè)，摩爾線程聯(lián)合硅基流動(dòng)，經(jīng)過系統(tǒng)級(jí)工程優(yōu)化與FP8精度加速，在DeepSeek R1 671B全量模型上實(shí)現(xiàn)性能突破：MTT S5000單卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s，樹立國產(chǎn)推理性能新標(biāo)桿。

面向未來，發(fā)布了MTT C256超節(jié)點(diǎn)的架構(gòu)規(guī)劃。該產(chǎn)品采用計(jì)算與交換一體化的高密設(shè)計(jì)，旨在系統(tǒng)性提升萬卡集群的訓(xùn)練效能與推理能力，為下一代超大規(guī)模智算中心構(gòu)建兼具超高密度與極致能效的硬件基石。

邁向物理AI：圖形技術(shù)持續(xù)進(jìn)化，前瞻布局未來計(jì)算

在圖形計(jì)算領(lǐng)域，摩爾線程持續(xù)推動(dòng)國產(chǎn)GPU向兼容性更廣、技術(shù)更深的方向發(fā)展。其產(chǎn)品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流圖形與計(jì)算API，并與國產(chǎn)主流CPU及操作系統(tǒng)完成了全棧適配，持續(xù)擴(kuò)展游戲及專業(yè)應(yīng)用的兼容覆蓋。公司同時(shí)宣布，即將完整支持DirectX 12 Ultimate，進(jìn)一步接軌行業(yè)頂級(jí)圖形標(biāo)準(zhǔn)。

在核心渲染技術(shù)上，摩爾線程率先擁抱“圖形+AI”范式革命，實(shí)現(xiàn)兩項(xiàng)關(guān)鍵突破：

邁入實(shí)時(shí)光追時(shí)代：基于“花港”架構(gòu)的硬件光線追蹤加速引擎，可實(shí)現(xiàn)對(duì)DirectX Raytracing (DXR)的支持，使實(shí)時(shí)、逼真的光影效果在國產(chǎn)GPU上成為可能。

定義AI生成式渲染（AGR）：推出全自研MTAGR 1.0技術(shù)，推動(dòng)渲染技術(shù)范式從“計(jì)算”走向“生成”，為下一代數(shù)字內(nèi)容創(chuàng)作及數(shù)字孿生等場(chǎng)景構(gòu)建國產(chǎn)技術(shù)基座。

面向更廣闊的未來計(jì)算場(chǎng)景，摩爾線程已展開前瞻性布局：

具身智能全棧賦能：發(fā)布了MT Lambda具身智能仿真訓(xùn)練平臺(tái)，深度融合物理、渲染與AI三大引擎，構(gòu)建了開發(fā)、仿真、訓(xùn)練的高效統(tǒng)一環(huán)境。推出基于智能SoC芯片“長(zhǎng)江”、AI模組MTT E300和夸娥智算集群“端云結(jié)合”的MT Robot具身智能解決方案，并宣布將于2026年第一季度開源關(guān)鍵仿真加速組件Mujoco-warp-MUSA，以開放協(xié)作助力機(jī)器人產(chǎn)業(yè)研發(fā)效率提升。

前沿融合計(jì)算探索：MUSA生態(tài)已與合作伙伴在科學(xué)智能（AI for Science）、量子科技、AI for 6G等前沿交叉領(lǐng)域展開探索工作，持續(xù)拓展全功能GPU作為通用算力底座的技術(shù)邊界與應(yīng)用價(jià)值。

生態(tài)加速：全面賦能開發(fā)者，發(fā)布個(gè)人AI算力平臺(tái)

生態(tài)建設(shè)是GPU行業(yè)的核心壁壘與價(jià)值所在，摩爾線程構(gòu)建了從硬件工具、算力支撐到人才培養(yǎng)的賦能體系。

深化人才培養(yǎng)，建設(shè)MUSA生態(tài)樞紐：以摩爾學(xué)院為平臺(tái)，摩爾線程已構(gòu)建起產(chǎn)教融合的開發(fā)者成長(zhǎng)體系，該平臺(tái)匯聚近20萬名開發(fā)者與學(xué)習(xí)者，并通過“國產(chǎn)計(jì)算生態(tài)與AI教育共建行動(dòng)”將前沿技術(shù)與產(chǎn)業(yè)實(shí)踐帶入全國 200多所高校，吸引超10萬名學(xué)子參與。本次大會(huì)宣布建設(shè)MUSA生態(tài)中心，同時(shí)發(fā)布MUSA開發(fā)者計(jì)劃，旨在為從AI學(xué)習(xí)探索到科研創(chuàng)新的各階段創(chuàng)新者，提供算力支持與技術(shù)賦能。

發(fā)布AI算力本，提供“開箱即用”的開發(fā)體驗(yàn)：作為連接開發(fā)者與MUSA生態(tài)的核心入口，MTT AIBOOK搭載自研“長(zhǎng)江”智能SoC，提供高達(dá)50TOPS的端側(cè)AI算力，首次實(shí)現(xiàn)從芯片、驅(qū)動(dòng)到開發(fā)環(huán)境的全棧整合，不僅實(shí)現(xiàn)了專業(yè)AI開發(fā)的“開箱即用”，更創(chuàng)新地打破Linux開發(fā)、Windows辦公與Android應(yīng)用之間場(chǎng)景壁壘，將強(qiáng)大的AI能力轉(zhuǎn)化為人人可及的生產(chǎn)力，賦能開發(fā)者在AI時(shí)代成為“超級(jí)個(gè)體”。

大會(huì)同時(shí)預(yù)告了基于“長(zhǎng)江”SoC打造的迷你型計(jì)算設(shè)備MTT AICube，進(jìn)一步豐富端側(cè)計(jì)算產(chǎn)品形態(tài)。

結(jié)語：構(gòu)筑自主基座，共赴智能未來

MDC 2025展示了從統(tǒng)一架構(gòu)到核心芯片，從超大規(guī)?；A(chǔ)設(shè)施到開發(fā)者終端的技術(shù)全景，這不僅是一次全功能GPU技術(shù)路線的系統(tǒng)呈現(xiàn)，更是摩爾線程對(duì)自主計(jì)算未來的堅(jiān)定承諾。

展望未來，摩爾線程將以MUSA為核心，堅(jiān)持開放生態(tài)，與全球開發(fā)者及伙伴攜手，共同構(gòu)建下一代的智能計(jì)算體系，賦能千行百業(yè)，邁向智能新紀(jì)元。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請(qǐng)及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

摩尔线程全功能GPU技术路线图首次全公开

日期： 2025-12-22

來源：C114通信网

相關(guān)內(nèi)容