《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 百度成功點(diǎn)亮國內(nèi)首個自研萬卡集群

百度成功點(diǎn)亮國內(nèi)首個自研萬卡集群

成功點(diǎn)亮昆侖芯三代萬卡集群,還將點(diǎn)亮 3 萬卡集群
2025-02-06
來源:IT之家
關(guān)鍵詞: 百度 昆侖芯 萬卡集群

2 月 5 日消息,百度智能云今日宣布成功點(diǎn)亮昆侖芯三代萬卡集群,這也是國內(nèi)首個正式點(diǎn)亮的自研萬卡集群。百度智能云將進(jìn)一步點(diǎn)亮 3 萬卡集群。

0.png

首先,突破硬件擴(kuò)展性瓶頸,如卡間互聯(lián)的拓?fù)湎拗?,避免通信帶寬成為瓶頸;

同時,圍繞芯片及集群功耗,基于萬卡規(guī)模常規(guī)方案功耗可達(dá)十兆瓦或更高,采用創(chuàng)新性散熱方案,從而解決萬卡集群的能效與散熱問題;

完善模型的分布式訓(xùn)練優(yōu)化,采用高效并行化任務(wù)切分策略,訓(xùn)練主流開源模型的集群 MFU 提升至 58%;

在提升穩(wěn)定性方面,提供容錯與穩(wěn)定性機(jī)制,避免由于單卡故障率隨規(guī)模指數(shù)上升而造成的萬卡集群有效性大幅下降,保障有效訓(xùn)練率達(dá)到 98%;

最后,針對機(jī)間通信帶寬需求,建設(shè)超大規(guī)模 HPN 高性能網(wǎng)絡(luò),優(yōu)化拓?fù)浣Y(jié)構(gòu),從而降低通信瓶頸,帶寬有效性達(dá)到 90% 以上。

從昆侖芯科技官方獲悉,本次點(diǎn)亮的昆侖芯三代萬卡集群,采用的是昆侖芯 P800。昆侖芯官網(wǎng)暫未公布該卡的參數(shù)。

0.png


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。