11 月 29 日消息,據(jù)中國石油報,11 月 28 日,以“AI 領(lǐng)航?智繪能源”為主題的 700 億參數(shù)昆侖大模型建設(shè)成果發(fā)布會在京舉辦。發(fā)布會上,中國石油介紹了與中國移動、華為、科大訊飛聯(lián)手打造的 700 億參數(shù)昆侖大模型,展示了 43 個專業(yè)應(yīng)用和通用應(yīng)用創(chuàng)新場景。
在行業(yè)大模型方面,昆侖大模型語言大模型參數(shù)從 330 億升級到 700 億,自然語言處理、語音視覺識別、多模態(tài)交互、科學(xué)計算等專業(yè)能力大幅提升;視覺大模型訓(xùn)練數(shù)據(jù)進一步豐富,新增的巖石識別功能有效提升了地質(zhì)研究智能化水平;新訓(xùn)練的 160 億參數(shù)多模態(tài)大模型為“人?車?生活”等營銷與服務(wù)業(yè)務(wù)提供了豐富的文、圖、音多模態(tài)交互能力。
在專業(yè)大模型方面,其構(gòu)建了我國首個勘探全領(lǐng)域?qū)I(yè)大模型,涵蓋地震處理、地震解釋、測井處理解釋 3 個專業(yè)大模型,相比傳統(tǒng)方法,在泛化性、精度等方面都有了大幅提升。
在場景大模型方面,按需構(gòu)建了 21 個場景大模型,每個場景大模型支持一類應(yīng)用場景的多種應(yīng)用。同時,昆侖大模型建立了場景數(shù)據(jù)集回流機制,定期將場景語料匯聚到專業(yè)、行業(yè)數(shù)據(jù)集,逐步提高專業(yè)、行業(yè)大模型能力,減少場景大模型數(shù)量。
此外,中國石油還構(gòu)建了超過 280TB 的高質(zhì)量數(shù)據(jù)集,研發(fā)了集團公司集中統(tǒng)一 AI 中臺,算力、模型、應(yīng)用的統(tǒng)一管理和協(xié)同調(diào)度能力有效加強。
昆侖大模型是中國能源化工行業(yè)首個通過備案的大模型,于今年 5 月正式啟動建設(shè),3 個月后參數(shù)量級達到 330 億。