7月10日消息,近日,壁仞科技副總裁兼AI軟件首席架構(gòu)師丁云帆在談及計算瓶頸時表示,解決算力瓶頸問題需要從三個維度考慮:硬件集群算力、軟件有效算力、異構(gòu)聚合算力。
他認為,做好這三個維度的工作,即使國產(chǎn)AI芯片單個算力不強,也能通過綜合手段提升算力,滿足國內(nèi)大模型訓(xùn)練的需求。
“我們2020年設(shè)計的第一代產(chǎn)品里就做了chiplet架構(gòu),國外巨頭在今年發(fā)布的產(chǎn)品如英偉達B100和英特爾Gaudi 3也采用了同樣的思路,他們用最先進的制程,但也需要chiplet來突破摩爾定律限制來提升單卡算力?!倍≡品f道。
據(jù)他介紹,壁仞科技用三級的異步checkpoint技術(shù),結(jié)合GPU的顯存和CPU內(nèi)存,甚至是多節(jié)點內(nèi)存的備份系統(tǒng)去達到一個平衡,目前已能夠大幅降低故障恢復(fù)成本。
之前,壁仞科技發(fā)布首款通用GPU芯片BR100,創(chuàng)下全球算力紀(jì)錄,16位浮點算力達到1000T以上、8位定點算力達到2000T以上,單芯片峰值算力達到PFLOPS級別。
當(dāng)時,壁仞科技給出的數(shù)據(jù)顯示,其首款旗艦產(chǎn)品BR100對比英偉達在售的旗艦GPU峰值算力在Int8、BF16、TF32/TF32+、FP32數(shù)據(jù)格式下最少有3.3倍的峰值性能優(yōu)勢,在FP32數(shù)據(jù)格式下性能優(yōu)勢更是達到了13.1倍。
本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。