《電子技術應用》
您所在的位置:首頁 > 人工智能 > 业界动态 > 中科曙光发布scaleX万卡超集群

中科曙光发布scaleX万卡超集群

部分能力超越2027年NVL576
2025-12-19
來源:芯智讯

2025年12月18日,在昆山舉行的光合組織2025人工智能創(chuàng)新大會(HAIC2025)上,中科曙光發(fā)布并展出了全球領先的大規(guī)模智能計算系統(tǒng)——scaleX萬卡超集群,這也是國產萬卡級AI集群系統(tǒng)首次以真機形式亮相。

99956.png

“scaleX萬卡超集群,是曙光發(fā)揮大型計算機系統(tǒng)研制經驗優(yōu)勢,面向萬億參數(shù)大模型、科學智能等復雜任務場景打造的大規(guī)模智能算力基礎設施方案”。中科曙光高級副總裁李斌表示,面對人工智能基礎設施對性能、效率、可靠性、可擴展性等方面的極致需求,scaleX萬卡超集群在超節(jié)點架構、高速互連網絡、存儲性能優(yōu)化、系統(tǒng)管理調度等方面實現(xiàn)了多項創(chuàng)新突破,部分技術與能力已超越海外同類產品研發(fā)路線圖的2027年NVL576里程節(jié)點,其核心技術優(yōu)勢如下:

優(yōu)勢1:全球首創(chuàng)單機柜級640卡超節(jié)點。scaleX萬卡超集群由16個曙光scaleX640超節(jié)點通過scaleFabric高速網絡互連而成,可實現(xiàn)10240塊AI加速卡部署,總算力規(guī)模超5EFlops。作為世界首個單機柜級640卡超節(jié)點,scaleX640采用超高密度刀片、浸沒相變液冷等技術,將單機柜算力密度提升20倍,PUE值低至1.04。

優(yōu)勢2:自主研發(fā)原生RDMA高速網絡。曙光scaleFabric網絡,基于國內首款400G 類InfiniBand的原生RDMA網卡與交換芯片,可實現(xiàn)400Gb/s超高帶寬、低于1微秒端側通信延遲,超節(jié)點間的通信性能達到業(yè)內領先水平,充分釋放萬卡超集群算力,并可將超集群規(guī)模輕松擴展至10 萬卡以上,相比傳統(tǒng)IB網絡提升2.33倍,同時網絡總體成本降低 30%。

優(yōu)勢3:存、算、傳緊耦合深度優(yōu)化。通過“超級隧道”、AI數(shù)據加速等設計,實現(xiàn)從芯片級、系統(tǒng)級到應用級的三級數(shù)據傳輸協(xié)同優(yōu)化,使存力平臺高效應對大模型訓練時萬卡并發(fā)讀寫帶寬極致需求挑戰(zhàn),提升高通量AI推理時的響應速度與結果精準度,并可將AI加速卡資源利用率提高55%。

優(yōu)勢4:超集群數(shù)字孿生與智能調度。通過物理集群數(shù)字孿生,實現(xiàn)故障定位、修復等全流程可視化智能管理;智能化運維平臺可支撐集群長期可用性達99.99%;智能調度引擎可管理萬級節(jié)點、服務十萬級用戶,支持每秒萬級作業(yè)調度。

1_99956.png

作為 “AI計算開放架構”最新重磅成果,scaleX萬卡超集群可支持多品牌加速卡以及主流計算生態(tài),并實現(xiàn)400+主流大模型、世界模型等適配優(yōu)化。在實際應用中,該超集群可覆蓋大模型訓練、金融風控、地質能源勘探及科學智能等多元場景。

“AI計算開放架構” 由中科曙光協(xié)同20多家AI產業(yè)鏈企業(yè)共同推出,以共享若干關鍵共性技術能力,依托系統(tǒng)工程思維推進智算集群創(chuàng)新。通過scaleX萬卡超集群,AI企業(yè)可降低智算集群研發(fā)門檻,并從技術“單點突圍”走向產業(yè)“生態(tài)共進”,將開放理念轉化為可落地普惠算力。


subscribe.jpg

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。