2月9日消息,飛騰官方宣布,飛騰騰云S5000C、飛騰騰銳D3000處理器已成功實(shí)現(xiàn)對(duì)DeepSeek全系列大模型的端到端支持,覆蓋數(shù)據(jù)中心和終端場(chǎng)景,而且性能非常出色。
其實(shí)在2024年,DeepSeek-V2.5 236B大模型就已經(jīng)在飛騰騰云S5000C平臺(tái)成功穩(wěn)定運(yùn)行。
DeepSeek-V3、R1版本發(fā)布后,飛騰第一時(shí)間在騰云S5000C、騰銳D3000平臺(tái)上本地部署驗(yàn)證,形成整體解決方案,構(gòu)建端到端的國(guó)產(chǎn)平臺(tái)DeepSeek大模型智算環(huán)境。
在數(shù)據(jù)中心側(cè),騰云S5000C服務(wù)器可以與多款A(yù)I加速卡配合,實(shí)現(xiàn)DeepSeek蒸餾版和全量版的部署。
根據(jù)官方實(shí)測(cè),飛騰騰云S5000C搭配8塊國(guó)產(chǎn)的AI加速卡,蒸餾版DeepSeek-R1-Distill-Llama-70B版本的推理速度可達(dá)到每秒22個(gè)tokens,本地部署的推理效率與國(guó)外同類(lèi)產(chǎn)品架構(gòu)解決方案相當(dāng),整體性能相當(dāng)于國(guó)外平臺(tái)性能的80%左右。
同時(shí),完整版DeepSeek R1 671B模型采用分布式推理框架,基于四機(jī)、32卡AI服務(wù)器集群,也已部署成功。
在用戶(hù)終端側(cè),基于騰銳D3000、銀河麒麟V10系統(tǒng)的臺(tái)式機(jī),可以本地部署DeepSeek-R1 7B蒸餾版模型,再搭配1張國(guó)產(chǎn)推理卡,就實(shí)現(xiàn)了AI PC能力,能夠建立安全可靠的本地知識(shí)助手。
現(xiàn)階段,飛騰平臺(tái)已實(shí)現(xiàn)端到端支持DeepSeek全系列、眾多開(kāi)源和國(guó)產(chǎn)頭部大模型的本地化部署,可為企業(yè)級(jí)和個(gè)人應(yīng)用提供全國(guó)產(chǎn)化、軟硬一體、性?xún)r(jià)比高、安全、開(kāi)放的全棧解決方案。