2月27日消息,今天是DeepSeek開源周第四日,不同于前三日早早就發(fā)出的開源項(xiàng)目。
今天DeepSeek公布開源項(xiàng)目,比平日稍微晚些,讓關(guān)注者們等的稍微有點(diǎn)著急,包括小編在內(nèi)。
但是等待的結(jié)果總是值得的,這不今天公布了兩項(xiàng)開源內(nèi)容。話不多說,轉(zhuǎn)入正題。
今天DeepSeek發(fā)布了DualPipe(雙向管道并行算法)和EPLB(專家并行負(fù)載均衡器)。
據(jù)DeepSeek介紹,DualPipe是一項(xiàng)在DeepSeek-V3技術(shù)報(bào)告中引入的雙向管道等值算法,它實(shí)現(xiàn)了向后和向后計(jì)算通信階段的雙向重疊,顯著減少訓(xùn)練空閑時間。
同時,流水線氣泡優(yōu)化這一創(chuàng)新調(diào)度策略,降低傳統(tǒng)管道并行中的“氣泡”問題,有效提升硬件資源利用率。在GitHub上,目前該算法已經(jīng)獲得544個Star收藏。
另外,在此談一談EPLB(專家并行負(fù)載均衡器)。
EPLB(專家并行負(fù)載均衡器)具有動態(tài)負(fù)載均衡、分層與全局平衡結(jié)合、流量優(yōu)化的特點(diǎn)。
具體來看,動態(tài)負(fù)載均衡是基于混合專家(MoE)架構(gòu),通過冗余專家策略復(fù)制高負(fù)載專家,并采用啟發(fā)式分配算法優(yōu)化GPU間的負(fù)載均衡;
另外在分層與全局平衡結(jié)合方面,它既支持單個節(jié)點(diǎn)的分層負(fù)載管理,也實(shí)現(xiàn)跨節(jié)點(diǎn)的全局負(fù)載平衡,減少GPU閑置。
此外在流量優(yōu)化上,可在平衡負(fù)載的同時,通過調(diào)整專家分布降低節(jié)點(diǎn)間通信數(shù)據(jù)量,提升整體訓(xùn)練效率。