隨著具身智能成為人工智能的下一個(gè)戰(zhàn)略高地,底層算力底座的自主可控顯得尤為關(guān)鍵。近日,摩爾線程聯(lián)合北京智源人工智能研究院(以下簡(jiǎn)稱:智源)基于FlagOS-Robo框架,依托MTT S5000千卡智算集群,成功完成智源自研具身大腦模型RoboBrain 2.5的全流程訓(xùn)練。
這是行業(yè)內(nèi)首次驗(yàn)證國(guó)產(chǎn)算力集群在具身智能大模型訓(xùn)練中的可用性與高效性,標(biāo)志著國(guó)產(chǎn)AI基礎(chǔ)設(shè)施在應(yīng)對(duì)復(fù)雜多模態(tài)任務(wù)上邁出了關(guān)鍵一步。通過(guò)面向多元芯片的統(tǒng)一AI系統(tǒng)軟件棧FlagOS與MTT S5000硬件集群的高效協(xié)作,該解決方案不僅“能訓(xùn)”,而且實(shí)現(xiàn)了“訓(xùn)得穩(wěn)、訓(xùn)得快”,為具身智能從實(shí)驗(yàn)室走向產(chǎn)業(yè)落地提供了堅(jiān)實(shí)底座。
多維評(píng)測(cè)驗(yàn)證,指標(biāo)全面對(duì)齊
為了檢驗(yàn)?zāi)P退惴ㄐЧ?,智源團(tuán)隊(duì)在2D/3D空間感知推理榜單、時(shí)序價(jià)值評(píng)估榜單等多個(gè)權(quán)威具身評(píng)測(cè)數(shù)據(jù)集上進(jìn)行了驗(yàn)證。結(jié)果顯示,基于MTT S5000國(guó)產(chǎn)千卡訓(xùn)練出的RoboBrain-2.5模型,在多項(xiàng)關(guān)鍵指標(biāo)上均與國(guó)際主流GPU訓(xùn)練模型保持一致。特別是在CrossPoint、Q-Spatial、VABench-V任務(wù)上,算法效果表現(xiàn)更優(yōu)。這種全面對(duì)齊的評(píng)測(cè)結(jié)果,表明FlagOS-Robo框架與MTT S5000算力協(xié)同訓(xùn)練出的“具身大腦”,在理解、規(guī)劃和執(zhí)行能力上已達(dá)行業(yè)一流水準(zhǔn)。

Loss完美對(duì)齊,誤差小于0.62%
在模型精度方面,基于MTT S5000的夸娥智算集群表現(xiàn)出極高的穩(wěn)定性。訓(xùn)練曲線顯示,MTT S5000千卡集群上的Loss走勢(shì)與 國(guó)際主流GPU訓(xùn)練結(jié)果高度重合,相對(duì)誤差小于0.62%。這一低誤差表明國(guó)產(chǎn)算力訓(xùn)練準(zhǔn)確性的同時(shí),智源FlagOS-Robo框架成功實(shí)現(xiàn)了跨平臺(tái)的無(wú)損遷移,開(kāi)發(fā)者無(wú)需擔(dān)心硬件更換導(dǎo)致的模型性能下降,真正做到了“代碼不改、精度不降”的平滑適配。
極致線性擴(kuò)展,千卡加速比超90%
大規(guī)模集群訓(xùn)練的核心在于效率。本次訓(xùn)練實(shí)測(cè)數(shù)據(jù)顯示,摩爾線程MTT S5000千卡智算集群展現(xiàn)了較高的擴(kuò)展能力:從64卡擴(kuò)展至1024卡,系統(tǒng)實(shí)現(xiàn)了90%以上的線性擴(kuò)展效率。擴(kuò)展曲線呈現(xiàn)出極佳的線性增長(zhǎng)趨勢(shì),這意味著隨著算力資源的增加,訓(xùn)練速度幾乎同步倍增,充分證明了國(guó)產(chǎn)集群在大規(guī)模并行計(jì)算和通信調(diào)度上的成熟度,并具備支持萬(wàn)卡級(jí)訓(xùn)練的能力。
此次摩爾線程與智源研究院的深度合作,將進(jìn)一步加速具身智能從實(shí)驗(yàn)室走向產(chǎn)業(yè)落地的進(jìn)程,為行業(yè)提供可復(fù)制、可規(guī)?;摹皣?guó)產(chǎn)算力訓(xùn)練范式”,為中國(guó)具身智能產(chǎn)業(yè)提供了一個(gè)自主、開(kāi)放、高效的算力底座。

