國產(chǎn)大模型最新進展,這次來自“國家隊”!
剛剛,全棧國產(chǎn)化生態(tài)大模型“九天智能基座”正式發(fā)布!
它由中國移動自研。包括萬卡算力、千億模型及百匯平臺三部分。
其中模型部分是九天自主研發(fā)的從算子到框架全棧國產(chǎn)訓練的千億參數(shù)大模型,能力達到GPT-4的90%水平。
以它為底座,已經(jīng)布局17個細分領(lǐng)域行業(yè)大模型,覆蓋政務(wù)、醫(yī)療、辦公、金融風控、客服、代碼等行業(yè)。
算力方面,中國移動宣布年內(nèi)將建成3個國產(chǎn)近2萬卡智算中心。此外,還發(fā)布了AI+5G新通話,AI+辦公等23個AI軟硬產(chǎn)品,AI+工業(yè)、AI+交通等20個行業(yè)應用。
沒想到,大模型“國家隊”進展已經(jīng)如此迅速了。
自大模型趨勢開始,運營商等央企就開始將注意力集中到AI自研與行業(yè)落地上,為大模型國產(chǎn)自主化持續(xù)加碼。歷時一年多,成果開始不斷涌現(xiàn)。
那么,當下大模型“國家隊”進展究竟如何了?
來參考中國移動的最新發(fā)布。
“萬百千”智能基座發(fā)布
今年數(shù)字中國峰會上,中國移動發(fā)布的核心內(nèi)容為1套“萬百千”智能基座、3大產(chǎn)業(yè)融通基地、N個AI+產(chǎn)品及應用。
其中,“萬百千”智能基座正是指“九天智能基座”,它由萬卡算力、千億參數(shù)模型及百匯平臺組成。
算力方面,中國移動將要建成智算網(wǎng)絡(luò)新集群。年內(nèi)將投產(chǎn)3個近2萬卡超大規(guī)模單體智算中心和12個區(qū)域智算中心,廣泛升級1500個邊緣節(jié)點,將訓/推算力資源配比上升至1:10。建成的單體智算中心可為萬億、千億等超大參數(shù)模型訓練提供澎湃算力。
模型方面,九天基座大模型聚焦解決行業(yè)復雜系統(tǒng)智能化難題,實現(xiàn)行業(yè)定向增強、行業(yè)模態(tài)匹配、全棧國產(chǎn)化、安全可信等四大技術(shù)突破。
行業(yè)定向增強方面,在全球海量通識知識基礎(chǔ)上,模型針對通信、電力、運輸、能源等行業(yè)專業(yè)知識進行增強。成為國內(nèi)預訓練行業(yè)數(shù)據(jù)占比最高的大模型,達10%。
行業(yè)模態(tài)匹配方面,九天獨創(chuàng)了結(jié)構(gòu)化數(shù)據(jù)大模型,能夠更好面向千行百業(yè)處理復雜的產(chǎn)業(yè)結(jié)構(gòu)化數(shù)據(jù)。同時構(gòu)建了語音、視覺、文本等方面能力,可為不同行業(yè)提供所需的模態(tài)能力。
國產(chǎn)化方面,九天已實現(xiàn)數(shù)據(jù)構(gòu)建、預訓練、微調(diào)、部署全鏈路核心技術(shù)自主創(chuàng)新,適配國產(chǎn)算力,實現(xiàn)全棧國產(chǎn)。
安全可信方面,九天已建立數(shù)據(jù)指令評估體系,同時加強數(shù)據(jù)處理和清洗、優(yōu)化DPO算法、加強人類價值觀對齊,確保模型實現(xiàn)指令安全相應。九天是唯一通過雙備案的央企背景大模型,并獲得中國軟件測評中心安全測評的最高等級A級證書。
基于千億基座大模型,中國移動已研發(fā)工程設(shè)計、金融風控等17款行業(yè)大模型,未來還將布局40款自研行業(yè)大模型,賦能生產(chǎn)、生活、社會治理等創(chuàng)新升級。
平臺方面,匯聚平臺是一個鏈接大模型廠商和用戶的平臺。它已匯聚并開放超30個“自有+開源+生態(tài)”大模型、超20個高質(zhì)量數(shù)據(jù)集,包含模型體驗、調(diào)優(yōu)、部署、推理、評測全鏈條大模型開發(fā)工具,是一個大模型生產(chǎn)超級工廠。
一同亮相的三大產(chǎn)業(yè)融通基地,分別是訓練基地、評測基地和聯(lián)創(chuàng)基地,它們將助力大模型訓練更快、更好、應用落地更明確。
訓練基地優(yōu)先開放內(nèi)蒙千卡算力資源,年底開放萬卡算力資源;測試基地聯(lián)合賽迪,提供公正、優(yōu)質(zhì)大模型測評服務(wù);產(chǎn)創(chuàng)基地開放北京、湖北、山東、福建,匯聚本地優(yōu)質(zhì)資源,可為本地央國企、頭部行業(yè)客戶、中小企業(yè),提供AI+應用創(chuàng)新“試飛場”。
此外,依托中國移動AI技術(shù)的23款AI+產(chǎn)品及20個AI+DICT行業(yè)應用也一同亮相。比如,5G+AI新通話支持通話中實時轉(zhuǎn)寫、字幕翻譯;視頻彩鈴推出文生圖、文生音樂等功能。
以上就是此次中國移動帶來最新大模型進展。
實際上,不只是中國移動一家央企大力在大模型領(lǐng)域積極布局。不完全統(tǒng)計,幾大運營商、中國電科、國家電網(wǎng)、國投集團等央企都以不同方式完成入局。
為什么會出現(xiàn)這種現(xiàn)象?作為“國家隊”,它們又有哪些特別之處值得被關(guān)注?
為啥“國家隊”值得關(guān)注?
去年2月27日,國務(wù)院印發(fā)《數(shù)字中國建設(shè)整體布局規(guī)劃》。
其中重點提到,要夯實數(shù)字中國建設(shè)基礎(chǔ),要全面賦能經(jīng)濟社會發(fā)展,要強化數(shù)字中國關(guān)鍵能力,要優(yōu)化數(shù)字化發(fā)展環(huán)境。
與此同時,ChatGPT掀起的大模型趨勢激流勇進。重視發(fā)展通用人工智能、把握人工智能等新科技革命浪潮,也被在幾次重要會議中提出。
在如此時代背景和發(fā)展要求下,運營商自然就走到了聚光燈下。
一方面,運營商有技術(shù)實力。
首先在算力方面,隨著“東數(shù)西算”工程啟動,運營商在建設(shè)算力網(wǎng)絡(luò)方面已悄然走在前列。
目前,我國運營商已經(jīng)建立起全球規(guī)模最大的網(wǎng)絡(luò)。同時全國約50%以上的IDC(互聯(lián)網(wǎng)數(shù)據(jù)中心)都是由運營商提供。
云計算方面,IDC數(shù)據(jù)顯示,2023年下半年中國TOP5公有云IaaS廠商中有兩位都是運營商背景。比如移動云2023年收入已達833億元人民幣,同比增長率65.6%,在公有云服務(wù)市場位居國內(nèi)第一陣營。
運營商先天具備網(wǎng)絡(luò)優(yōu)勢,也進一步夯實其算力基礎(chǔ)。目前我國5G基站總數(shù)已達238.4萬個。
其次,運營商有數(shù)據(jù)優(yōu)勢。
憑借此前與千行百業(yè)的合作,運營商已經(jīng)積累了龐大業(yè)務(wù)數(shù)據(jù),能夠快速構(gòu)建稀缺數(shù)據(jù)集,更快訓出垂直行業(yè)大模型。而這些合作經(jīng)驗也能讓運營商在實際合作中,更快推進技術(shù)落地。
同時,東數(shù)西算、東數(shù)西訓等工程的參與,也讓運營商構(gòu)建了更靈活的數(shù)據(jù)流通能力。
最后,不少運營商在AI方面都有提前布局。
以中國移動為例,在2013年就成立了“九天”團隊,在機器視覺、語音、自然語言處理、網(wǎng)絡(luò)智能化等領(lǐng)域有多年技術(shù)積累。
另一方面,運營商也有身份優(yōu)勢。
大模型趨勢是科技革命,也是全球競爭。隨著趨勢不斷發(fā)展,通用人工智能國產(chǎn)自主化越來越被重視。加之政務(wù)、交通等強調(diào)隱私保護的領(lǐng)域也在積極擁抱大模型,對數(shù)據(jù)安全的要求,都使得央企在競爭中具備獨特自身優(yōu)勢。
這兩重優(yōu)勢都讓大模型“國家隊”需要被重點關(guān)注。
更何況,“國家隊”的動向一定程度上反映國家對AI、大模型的重視程度,同時也能體現(xiàn)出我國大模型自研水平、國產(chǎn)自有化的能力。而且在落地上,央企更接近國民經(jīng)濟骨干行業(yè),比如通信、政務(wù)等,能更快促進我國整體生產(chǎn)力躍升。
不過隨著趨勢演進,“國家隊”成員之間的差距也在逐漸形成。比如帶來最新進展的中國移動,成為今年國家網(wǎng)信辦公布的已備案大模型清單中首家央企。
為什么是中國移動?它做對了什么?
為什么是中國移動?
過去1年里,中國移動完成了大模型領(lǐng)域的一系列發(fā)布。
去年世界人工智能大會上,中國移動在大模型領(lǐng)域的第一落子便是發(fā)布兩款行業(yè)大模型“九天·海算政務(wù)”和“九天·客服”。
幾個月后,中國移動又聯(lián)合多家央企發(fā)布“九天·眾擎基座大模型”。它主打融入各類專業(yè)知識,深度匹配行業(yè)需求。
今年早些時候,在國家網(wǎng)信辦公布的已備案大模型清單中,中國移動“九天自然語言交互大模型”名列其中。這是首個同時通過國家“生成式人工智能服務(wù)備案”和“境內(nèi)深度合成服務(wù)算法備案”雙備案的央企大模型。目前已形成9B、13.9B、57B、千億等多種參數(shù)量版本,可靈活部署于云、邊、端不同場景。
以九天基礎(chǔ)大模型為基礎(chǔ),中國移動已經(jīng)推出了二十余個行業(yè)大模型,覆蓋政府治理、工業(yè)生產(chǎn)、民生服務(wù)和通信特色等領(lǐng)域,其中九天·客服大模型、九天·海算政務(wù)大模型等已經(jīng)落地集團內(nèi)外部客戶。
此外,中國移動還推出了一站式大模型開發(fā)平臺、大模型應用平臺(LLM Studio),面向個人及行業(yè)客戶提供從算力、數(shù)據(jù)、算法框架到研發(fā)工具的全棧人工智能服務(wù)。
梳理來看,中國移動的大模型戰(zhàn)略其實非常清晰:
依托自身技術(shù)積累及業(yè)務(wù),形成從平臺、大模型及能力到規(guī)模化應用的全面產(chǎn)業(yè)級智能化服務(wù)能力。
據(jù)了解,中國移動原創(chuàng)性提出體系化人工智能(Holistic AI)技術(shù),該技術(shù)具有AI服務(wù)大閉環(huán)、AI能力原子化重構(gòu)、網(wǎng)絡(luò)原生和安全可信四大技術(shù)特征,通過體系化人工智能核心技術(shù)引擎,實現(xiàn)算力、網(wǎng)絡(luò)、人工智能能力全局統(tǒng)一調(diào)度和開放服務(wù),從而構(gòu)建了新型人工智能服務(wù)模式。
無疑,大模型浪潮這對于中國移動自身而言,是一次自我革新的機會,符合發(fā)展需求。運營商本身就是數(shù)字產(chǎn)業(yè)鏈條中的重要參與成員。如果不構(gòu)建大模型能力,運營商只能“賣水”,在產(chǎn)業(yè)鏈中的話語權(quán)將可能逐漸被削弱。
對于國家而言,也需要中國移動這樣的運營商站出來,構(gòu)建更加國有化的大模型能力。
在《數(shù)字中國建設(shè)整體布局規(guī)劃》中明確指出,要強化數(shù)字中國關(guān)鍵能力,構(gòu)筑自強自立的數(shù)字技術(shù)創(chuàng)新體系,筑牢可信可控的數(shù)字安全屏障。
具體推進動作上,憑借扎實的技術(shù)積累,中國移動的步伐越走越快。
中國移動從11年前開始布局AI,長期關(guān)注CV、NLP等前沿AI領(lǐng)域技術(shù),目前在內(nèi)部建立了一支由馮俊蘭博士領(lǐng)軍的百人規(guī)模人工智能研發(fā)團隊。
馮俊蘭博士是IEEE Fellow、中國移動集團級首席科學家。于2001年在中國科學院獲得聲學博士學位,同年加入美國AT&T研究中心,曾任高級研究員、主任研究員,主要研究方向包括:語音識別、 語言理解和數(shù)據(jù)挖掘。
2013年9月加入中國移動研究院,一手帶出“九天”團隊。
目前,中國移動AI團隊發(fā)表國際頂會、頂刊論文150余篇,發(fā)明專利930項,頂級AI競賽TOP5獎項18項,主導了業(yè)界近九成網(wǎng)絡(luò)智能化領(lǐng)域國際標準。
同時在技術(shù)落地方面,中國移動也更加關(guān)注直接影響國民生活的領(lǐng)域。最新展示的行業(yè)大模型覆蓋醫(yī)療、辦公、物聯(lián)水利、網(wǎng)絡(luò)安全、社會綜合治理等領(lǐng)域。
數(shù)據(jù)顯示,九天”產(chǎn)品目前已服務(wù)超10億用戶、300家客戶、云邊端能力調(diào)用次數(shù)超9.6萬億,年賦能價值達41億元。
顯然,在輻射全社會、實現(xiàn)AI普惠、推進數(shù)字中國建設(shè)上,以中國移動為代表的“國家隊”正在異軍突起,它們在中國大模型浪潮中的地位將愈加不可取代。
而在這場波及全球的科技浪潮中,中國移動等運營商也在將中國的數(shù)字基建優(yōu)勢進一步發(fā)揮釋放,為中國數(shù)字化建設(shè)提供獨有的一股驅(qū)動力。