2月8日,在中國移動的助力下,中國石油高效完成DeepSeek V3/R1全棧國產(chǎn)化的訓(xùn)推適配和私有化部署。此次部署,基于DeepSeek的關(guān)鍵技術(shù)點(diǎn),開展了系列基礎(chǔ)模型算法創(chuàng)新,實(shí)現(xiàn)了從底層芯片到框架、模型的全棧自主可控,為推動人工智能技術(shù)在能源化工領(lǐng)域的深度應(yīng)用與國產(chǎn)AI技術(shù)生態(tài)的規(guī)?;涞刈⑷肓藦?qiáng)大動力。
一直以來,中國移動與中國石油兩大央企積極響應(yīng)國家人工智能戰(zhàn)略,努力推動 “人工智能 +” 在能源化工行業(yè)落地生根。此前,中國移動攜手中國石油發(fā)布能源化工領(lǐng)域首個(gè)行業(yè)大模型——700億參數(shù)昆侖大模型,助力中國石油打造“五個(gè)一”:建設(shè)一個(gè)央企領(lǐng)先的算力中心,一個(gè)集中統(tǒng)一AI中臺,一套高質(zhì)量行業(yè)數(shù)據(jù)集,一套國內(nèi)領(lǐng)先的行業(yè)大模型、一系列創(chuàng)新應(yīng)用。
面對中國石油多模態(tài)、超百億參數(shù)的大模型訓(xùn)練任務(wù)需求,移動云憑借強(qiáng)大的算力網(wǎng)絡(luò)能力,實(shí)現(xiàn)了資源的快速響應(yīng)、彈性擴(kuò)展及高質(zhì)量供給。通過為中國石油構(gòu)建“算力泛在、算網(wǎng)共生、智能敏捷、安全可靠、綠色低碳”的一體化算力體系,移動云已提供超過1000P的穩(wěn)定算力資源,為大模型的建設(shè)和運(yùn)行提供了堅(jiān)實(shí)的算力保障。
為了使DeepSeek系列模型在昆侖大模型原有的框架下,獲得更好的適配效果和執(zhí)行性能,中國移動第一時(shí)間開展相關(guān)的分析、適配與創(chuàng)新工作。中國移動通過配置化開發(fā),在DeepSeek V3模型基礎(chǔ)上快速實(shí)現(xiàn)了自定義模型參數(shù)和規(guī)模的針對性優(yōu)化。團(tuán)隊(duì)在不實(shí)際啟動集群訓(xùn)練任務(wù)的情況下,僅通過單卡即模擬出集群中所有卡的內(nèi)存占用情況,從而制定整體的集群分布式訓(xùn)練策略。
中國移動復(fù)現(xiàn)并優(yōu)化了DeepSeek MTP多Tokens預(yù)測功能,通過DeepSeek-V3/R1主模型和MTP Module的分布式調(diào)度,實(shí)現(xiàn)一次解碼生成多個(gè)Token,并通過使整圖編譯功能,組合計(jì)算圖的通用算子,實(shí)現(xiàn)自動融合加速,提升DeepSeek-V3/R1端到端的推理性能。
此次DeepSeek大模型的成功部署,為中國政企客戶實(shí)現(xiàn)DeepSeek V3/R1全棧國產(chǎn)化的訓(xùn)推適配和部署提供了重要參考。它也為中國石油昆侖大模型優(yōu)化應(yīng)用效果、縮短研發(fā)周期、構(gòu)建健康生態(tài)提供了新引擎,推動“數(shù)智中國石油”建設(shè)步入快車道。
在應(yīng)用層面,昆侖大模型的問答應(yīng)用“行業(yè)大家”目前已新增DeepSeek深度推理能力。用戶在使用該應(yīng)用時(shí),除了可以得到昆侖大模型生成的能源化工領(lǐng)域?qū)I(yè)問答結(jié)果,還能選擇“深度思考”模式,體驗(yàn)知識推理、場景理解等AI服務(wù)。
在模型層面,昆侖大模型的AI中臺模型廣場目前已上線DeepSeek-V3與DeepSeek-R1模型版本,并實(shí)現(xiàn)全尺寸適配,用戶可基于AI中臺調(diào)用DeepSeek模型API服務(wù),并使用AI中臺組件及工具構(gòu)建智能體,以滿足不同場景的需求。
未來,中國移動與中國石油將繼續(xù)攜手共進(jìn),在油氣勘探開發(fā)、煉油化工、油氣銷售、工程建設(shè)等核心業(yè)務(wù)領(lǐng)域深入挖掘AI潛力,以新質(zhì)生產(chǎn)力為中國式現(xiàn)代化建設(shè)貢獻(xiàn)力量。