《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > DeepSeek采用UE8M0 FP8標(biāo)準(zhǔn)徹底和英偉達(dá)決裂

DeepSeek采用UE8M0 FP8標(biāo)準(zhǔn)徹底和英偉達(dá)決裂

2025-08-26
來源:快科技

8月25日消息,近日,深度求索宣布正式發(fā)布DeepSeek-V3.1。其中一個(gè)重大的進(jìn)步和驚喜,就是支持了UE8M0 FP8。

1.png

DeepSeek在其官宣發(fā)布DeepSeek-V3.1的文章中提到,UE8M0 FP8是針對(duì)即將發(fā)布的下一代國(guó)產(chǎn)芯片設(shè)計(jì)。

2.png

東莞證券指出,該格式通過更高的靈活度支持復(fù)雜模型推理,提升芯片的解碼效率與運(yùn)算能力,為國(guó)產(chǎn)芯片適配更大模型提供技術(shù)路徑,國(guó)產(chǎn)AI算力生態(tài)有望加速成型。

那UE8M0 FP8到底是什么?將有何影響?

人工智能領(lǐng)域的企業(yè)家與技術(shù)專家、清華大學(xué)計(jì)算機(jī)系人工智能所博士梁斌表示,DeepSeek這次為什么非要強(qiáng)調(diào)UE8M0 FP8呢?這個(gè)和英偉達(dá)的FP8是兩個(gè)東西,兩套標(biāo)準(zhǔn)。

他解釋稱,顯存的發(fā)展是有限的,而模型的發(fā)展是快速的,對(duì)每個(gè)參數(shù)的表達(dá)必須通過量化進(jìn)行壓縮,F(xiàn)P32就是32位表達(dá)一個(gè)參數(shù),F(xiàn)P8就是8位表達(dá)一個(gè)參數(shù),在可接受的范圍內(nèi),肯定是越低的表達(dá),在顯存里面能裝下更多的參數(shù)。

FP8有英偉達(dá)的E4M3/E5M2方案和DS的這個(gè)UE8M0方案,主要區(qū)別就是前者有3-2位的小數(shù)表達(dá),后者沒有小數(shù)表達(dá)。前者精度好,后者功耗低,運(yùn)算快,對(duì)芯片要求低。

梁斌表示,現(xiàn)在DeepSeek支持UE8M0 FP8,加上國(guó)產(chǎn)芯片都向這個(gè)標(biāo)準(zhǔn)靠攏,這是徹底和英偉達(dá)決裂了,以后其他推理模型,要么選擇DS這套體系,要么選擇英偉達(dá)體系,國(guó)內(nèi)芯片公司也積極向這套體系靠攏。

“現(xiàn)在華為他們那邊真是為了適配這個(gè)標(biāo)準(zhǔn),真是玩命干,干成了就是名垂千古,多大誘惑,而且我發(fā)現(xiàn)DeepSeek還真是有膽量,真是把國(guó)產(chǎn)大模型的發(fā)展推到了一個(gè)牛X的高度上去,太了不起了?!?/p>


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。