2 月 10 日消息,摩爾線程于 2026 年 1 月 30 日宣布開源 TileLang-MUSA 項目,實現(xiàn)對 TileLang 編程語言的完整支持。今日再次重復(fù)發(fā)布公告。
據(jù)介紹,該項目已在摩爾線程多代全功能 GPU 上完成驗證,旨在通過高層抽象與編譯器優(yōu)化降低開發(fā)門檻,為國產(chǎn)算力平臺提供高效的人工智能與高性能計算開發(fā)工具。
TileLang 是基于張量分塊抽象的高性能 AI 算子編程語言,采用聲明式語法與類 Python 前端,使開發(fā)者能夠以近似數(shù)學(xué)公式的形式描述計算意圖。該語言具備三大核心特性:通過高級抽象降低開發(fā)門檻,實現(xiàn)跨平臺 " 一次編寫、多架構(gòu)運行 " 能力,并由編譯器自動完成循環(huán)優(yōu)化、內(nèi)存調(diào)度等復(fù)雜操作。該技術(shù)已應(yīng)用于 DeepSeek-V3 等大型模型研發(fā),并在科學(xué)計算、硬件開發(fā)等領(lǐng)域發(fā)揮作用。
本次開源的 TileLang-MUSA 項目專注于釋放國產(chǎn) GPU 性能潛力,已在 MTT S5000、MTT S4000 等訓(xùn)推一體智算卡完成驗證。項目實現(xiàn) TileLang 高層語義與摩爾線程 MUSA 架構(gòu)的深度映射,支持自動調(diào)用張量核心指令、多級數(shù)據(jù)搬運優(yōu)化及 Warp 級并行處理。目前原生算子單元測試覆蓋率超過 80%,提供穩(wěn)定開發(fā)基礎(chǔ)。
實測數(shù)據(jù)顯示,使用 TileLang-MUSA 開發(fā)大語言模型關(guān)鍵算子時,相較手寫 MUSA C++ 代碼可減少約 90% 代碼量,在矩陣運算場景下性能可達手工優(yōu)化版本的 95%,注意力機制算子達 85%。其自動調(diào)優(yōu)機制可快速搜索最優(yōu)分塊策略,幫助開發(fā)者超越未優(yōu)化基準(zhǔn)實現(xiàn)。該項目支持開發(fā)者無縫遷移現(xiàn)有算子邏輯至國產(chǎn) GPU 平臺,并為不熟悉底層指令的工程師提供高層開發(fā)入口。
摩爾線程計劃持續(xù)優(yōu)化編譯器性能,深度集成主流 AI 框架,并擴展至 Transformer 等復(fù)雜模型架構(gòu)的全局優(yōu)化。

