《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > 中國移動(dòng)攜手浪潮阿里云等組建超節(jié)點(diǎn)算力集群創(chuàng)新聯(lián)合體

中國移動(dòng)攜手浪潮阿里云等組建超節(jié)點(diǎn)算力集群創(chuàng)新聯(lián)合體

2024-12-26
來源:IT之家

12 月 26 日消息,以“創(chuàng)新驅(qū)動(dòng)智啟新程”為主題的 2024 中國人工智能大會(huì)(CCAI)開幕式于本月在北京召開,超節(jié)點(diǎn)算力集群創(chuàng)新聯(lián)合體揭牌儀式舉行。

會(huì)上,北京市科委、中關(guān)村管委會(huì)、中國移動(dòng)浪潮集團(tuán)、阿里云、清華大學(xué)、中國科學(xué)院等單位共同為“超節(jié)點(diǎn)算力集群創(chuàng)新聯(lián)合體”揭牌。

0.png

據(jù)中國移動(dòng)介紹,隨著人工智能大模型的迅猛發(fā)展,其參數(shù)規(guī)模正向超萬億級(jí)別演進(jìn),模型的性能和泛化能力不斷提升,對(duì)高性能智算基礎(chǔ)設(shè)施的需求更為迫切。在此背景下,傳統(tǒng)單臺(tái)智算服務(wù)器僅能容納 8 張 GPU 芯片的算力模式正被“超節(jié)點(diǎn)算力集群”這一形態(tài)所取代,以適應(yīng)日益增長的算力需求。

“超節(jié)點(diǎn)算力集群創(chuàng)新聯(lián)合體”的 GPU 卡間互聯(lián)是基于中國移動(dòng)原創(chuàng)的 OISA(全向智感互聯(lián))協(xié)議所構(gòu)建,OISA 旨在打造一個(gè)高效、智能、靈活且開放的 GPU 卡間互聯(lián)體系,該架構(gòu)致力于支持大模型訓(xùn)練、推理、高性能計(jì)算等數(shù)據(jù)密集型的 AI 應(yīng)用。

為了實(shí)現(xiàn)這一目標(biāo),OISA 采用了全向連接設(shè)計(jì),確保大規(guī)模 GPU 之間對(duì)等通信;引入智能感知設(shè)計(jì),通過定義流量感知標(biāo)簽,并結(jié)合流控和重傳機(jī)制,優(yōu)化數(shù)據(jù)傳輸效率。

在協(xié)議層面,OISA 采用精悍的報(bào)文格式、支持內(nèi)存和消息的多語義融合、多層次流控重傳以及預(yù)設(shè)集合通信加速等多個(gè)關(guān)鍵技術(shù),實(shí)現(xiàn)高帶寬、低時(shí)延和高可靠的 GPU 通信能力。

在當(dāng)前 Gen1.1 版本下,OISA 支持超節(jié)點(diǎn)內(nèi)任意 GPU 卡間的點(diǎn)對(duì)點(diǎn)讀寫互聯(lián)帶寬達(dá)到 896GB/s,每個(gè) OISA-Switch 芯片支持 128 個(gè)端口、交換容量 51.2T。

從中國移動(dòng)官方獲悉,中國移動(dòng)未來將全面支持超節(jié)點(diǎn)算力集群創(chuàng)新聯(lián)合體發(fā)展,計(jì)劃聯(lián)合產(chǎn)業(yè)界優(yōu)先完成在單層 Switch 條件下基于 OISA 互聯(lián)技術(shù)的 32/64 卡超節(jié)點(diǎn)產(chǎn)品落地,并加速 128 卡超節(jié)點(diǎn)產(chǎn)品的輸出。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。