近日,海光信息技術(shù)團(tuán)隊(duì)成功完成DeepSeek V3和R1模型與海光DCU(深度計(jì)算單元)的適配,并正式上線!
用戶現(xiàn)可通過“光合開發(fā)者社區(qū)”中的“光源”板塊訪問并下載相關(guān)模型,或直接登錄[www.sourcefind.cn]搜索“DeepSeek”,即可基于DCU平臺(tái)快速部署和使用相關(guān)模型。
DeepSeek V3和R1模型采用了Multi-Head Latent Attention(MLA)、DeepSeekMoE、多令牌預(yù)測(cè)、FP8混合精度訓(xùn)練等創(chuàng)新技術(shù),顯著提升了模型的訓(xùn)練效率和推理性能。
DCU是海光信息推出的高性能GPGPU架構(gòu)AI加速卡,致力于為行業(yè)客戶提供自主可控的全精度通用AI加速計(jì)算解決方案。憑借卓越的算力性能和完備的軟件生態(tài),DCU已在科教、金融、醫(yī)療、政務(wù)、智算中心等多個(gè)領(lǐng)域?qū)崿F(xiàn)規(guī)?;瘧?yīng)用。
海光DCU技術(shù)團(tuán)隊(duì)表示,將持續(xù)推動(dòng)大模型迭代適配與優(yōu)化更新,攜手更多優(yōu)秀大模型企業(yè)為行業(yè)客戶提供更高效、更經(jīng)濟(jì)、更安全的AI解決方案。同時(shí),團(tuán)隊(duì)也將積極探索更多應(yīng)用場(chǎng)景,推動(dòng)AI技術(shù)在更多行業(yè)的落地與普及。
本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。