《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > DeepSeek開源周第四日:開源DualPipe和EPLB

DeepSeek開源周第四日:開源DualPipe和EPLB

2025-02-27
來源:快科技
關(guān)鍵詞: Deepseek 開源周 DualPipe EPLB

2月27日消息,今天是DeepSeek開源周第四日,不同于前三日早早就發(fā)出的開源項(xiàng)目。

今天DeepSeek公布開源項(xiàng)目,比平日稍微晚些,讓關(guān)注者們等的稍微有點(diǎn)著急,包括小編在內(nèi)。

但是等待的結(jié)果總是值得的,這不今天公布了兩項(xiàng)開源內(nèi)容。話不多說,轉(zhuǎn)入正題。

今天DeepSeek發(fā)布了DualPipe(雙向管道并行算法)和EPLB(專家并行負(fù)載均衡器)。

據(jù)DeepSeek介紹,DualPipe是一項(xiàng)在DeepSeek-V3技術(shù)報(bào)告中引入的雙向管道等值算法,它實(shí)現(xiàn)了向后和向后計(jì)算通信階段的雙向重疊,顯著減少訓(xùn)練空閑時間。

同時,流水線氣泡優(yōu)化這一創(chuàng)新調(diào)度策略,降低傳統(tǒng)管道并行中的“氣泡”問題,有效提升硬件資源利用率。在GitHub上,目前該算法已經(jīng)獲得544個Star收藏。

另外,在此談一談EPLB(專家并行負(fù)載均衡器)。

EPLB(專家并行負(fù)載均衡器)具有動態(tài)負(fù)載均衡、分層與全局平衡結(jié)合、流量優(yōu)化的特點(diǎn)。

具體來看,動態(tài)負(fù)載均衡是基于混合專家(MoE)架構(gòu),通過冗余專家策略復(fù)制高負(fù)載專家,并采用啟發(fā)式分配算法優(yōu)化GPU間的負(fù)載均衡;

另外在分層與全局平衡結(jié)合方面,它既支持單個節(jié)點(diǎn)的分層負(fù)載管理,也實(shí)現(xiàn)跨節(jié)點(diǎn)的全局負(fù)載平衡,減少GPU閑置。

此外在流量優(yōu)化上,可在平衡負(fù)載的同時,通過調(diào)整專家分布降低節(jié)點(diǎn)間通信數(shù)據(jù)量,提升整體訓(xùn)練效率。

0.png


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。