《電子技術(shù)應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 中國移動發(fā)布全棧國產(chǎn)化生態(tài)大模型九天智能基座

中國移動發(fā)布全棧國產(chǎn)化生態(tài)大模型九天智能基座

萬卡算力、千億模型及百匯平臺
2024-05-27
來源:快科技

國產(chǎn)大模型最新進展,這次來自“國家隊”!

剛剛,全棧國產(chǎn)化生態(tài)大模型九天智能基座”正式發(fā)布!

它由中國移動自研。包括萬卡算力、千億模型及百匯平臺三部分。

其中模型部分是九天自主研發(fā)的從算子到框架全棧國產(chǎn)訓練的千億參數(shù)大模型,能力達到GPT-4的90%水平。

1.jpg

以它為底座,已經(jīng)布局17個細分領(lǐng)域行業(yè)大模型,覆蓋政務(wù)、醫(yī)療、辦公、金融風控、客服、代碼等行業(yè)。

算力方面,中國移動宣布年內(nèi)將建成3個國產(chǎn)近2萬卡智算中心。此外,還發(fā)布了AI+5G新通話,AI+辦公等23個AI軟硬產(chǎn)品,AI+工業(yè)、AI+交通等20個行業(yè)應用。

沒想到,大模型“國家隊”進展已經(jīng)如此迅速了。

自大模型趨勢開始,運營商等央企就開始將注意力集中到AI自研與行業(yè)落地上,為大模型國產(chǎn)自主化持續(xù)加碼。歷時一年多,成果開始不斷涌現(xiàn)。

那么,當下大模型“國家隊”進展究竟如何了?

來參考中國移動的最新發(fā)布。

“萬百千”智能基座發(fā)布

今年數(shù)字中國峰會上,中國移動發(fā)布的核心內(nèi)容為1套“萬百千”智能基座、3大產(chǎn)業(yè)融通基地、N個AI+產(chǎn)品及應用。

2.png

其中,“萬百千”智能基座正是指“九天智能基座”,它由萬卡算力、千億參數(shù)模型及百匯平臺組成。

算力方面,中國移動將要建成智算網(wǎng)絡(luò)新集群。年內(nèi)將投產(chǎn)3個近2萬卡超大規(guī)模單體智算中心和12個區(qū)域智算中心,廣泛升級1500個邊緣節(jié)點,將訓/推算力資源配比上升至1:10。建成的單體智算中心可為萬億、千億等超大參數(shù)模型訓練提供澎湃算力。

模型方面,九天基座大模型聚焦解決行業(yè)復雜系統(tǒng)智能化難題,實現(xiàn)行業(yè)定向增強、行業(yè)模態(tài)匹配、全棧國產(chǎn)化、安全可信等四大技術(shù)突破。

行業(yè)定向增強方面,在全球海量通識知識基礎(chǔ)上,模型針對通信、電力、運輸、能源等行業(yè)專業(yè)知識進行增強。成為國內(nèi)預訓練行業(yè)數(shù)據(jù)占比最高的大模型,達10%。

行業(yè)模態(tài)匹配方面,九天獨創(chuàng)了結(jié)構(gòu)化數(shù)據(jù)大模型,能夠更好面向千行百業(yè)處理復雜的產(chǎn)業(yè)結(jié)構(gòu)化數(shù)據(jù)。同時構(gòu)建了語音、視覺、文本等方面能力,可為不同行業(yè)提供所需的模態(tài)能力。

國產(chǎn)化方面,九天已實現(xiàn)數(shù)據(jù)構(gòu)建、預訓練、微調(diào)、部署全鏈路核心技術(shù)自主創(chuàng)新,適配國產(chǎn)算力,實現(xiàn)全棧國產(chǎn)。

安全可信方面,九天已建立數(shù)據(jù)指令評估體系,同時加強數(shù)據(jù)處理和清洗、優(yōu)化DPO算法、加強人類價值觀對齊,確保模型實現(xiàn)指令安全相應。九天是唯一通過雙備案的央企背景大模型,并獲得中國軟件測評中心安全測評的最高等級A級證書。

基于千億基座大模型,中國移動已研發(fā)工程設(shè)計、金融風控等17款行業(yè)大模型,未來還將布局40款自研行業(yè)大模型,賦能生產(chǎn)、生活、社會治理等創(chuàng)新升級。

平臺方面,匯聚平臺是一個鏈接大模型廠商和用戶的平臺。它已匯聚并開放超30個“自有+開源+生態(tài)”大模型、超20個高質(zhì)量數(shù)據(jù)集,包含模型體驗、調(diào)優(yōu)、部署、推理、評測全鏈條大模型開發(fā)工具,是一個大模型生產(chǎn)超級工廠。

一同亮相的三大產(chǎn)業(yè)融通基地,分別是訓練基地、評測基地和聯(lián)創(chuàng)基地,它們將助力大模型訓練更快、更好、應用落地更明確。

訓練基地優(yōu)先開放內(nèi)蒙千卡算力資源,年底開放萬卡算力資源;測試基地聯(lián)合賽迪,提供公正、優(yōu)質(zhì)大模型測評服務(wù);產(chǎn)創(chuàng)基地開放北京、湖北、山東、福建,匯聚本地優(yōu)質(zhì)資源,可為本地央國企、頭部行業(yè)客戶、中小企業(yè),提供AI+應用創(chuàng)新“試飛場”。

此外,依托中國移動AI技術(shù)的23款AI+產(chǎn)品及20個AI+DICT行業(yè)應用也一同亮相。比如,5G+AI新通話支持通話中實時轉(zhuǎn)寫、字幕翻譯;視頻彩鈴推出文生圖、文生音樂等功能。

以上就是此次中國移動帶來最新大模型進展。

3.jpg

實際上,不只是中國移動一家央企大力在大模型領(lǐng)域積極布局。不完全統(tǒng)計,幾大運營商、中國電科、國家電網(wǎng)、國投集團等央企都以不同方式完成入局。

為什么會出現(xiàn)這種現(xiàn)象?作為“國家隊”,它們又有哪些特別之處值得被關(guān)注?

為啥“國家隊”值得關(guān)注?

去年2月27日,國務(wù)院印發(fā)《數(shù)字中國建設(shè)整體布局規(guī)劃》。

其中重點提到,要夯實數(shù)字中國建設(shè)基礎(chǔ),要全面賦能經(jīng)濟社會發(fā)展,要強化數(shù)字中國關(guān)鍵能力,要優(yōu)化數(shù)字化發(fā)展環(huán)境。

與此同時,ChatGPT掀起的大模型趨勢激流勇進。重視發(fā)展通用人工智能、把握人工智能等新科技革命浪潮,也被在幾次重要會議中提出。

在如此時代背景和發(fā)展要求下,運營商自然就走到了聚光燈下。

一方面,運營商有技術(shù)實力。

首先在算力方面,隨著“東數(shù)西算”工程啟動,運營商在建設(shè)算力網(wǎng)絡(luò)方面已悄然走在前列。

目前,我國運營商已經(jīng)建立起全球規(guī)模最大的網(wǎng)絡(luò)。同時全國約50%以上的IDC(互聯(lián)網(wǎng)數(shù)據(jù)中心)都是由運營商提供。

云計算方面,IDC數(shù)據(jù)顯示,2023年下半年中國TOP5公有云IaaS廠商中有兩位都是運營商背景。比如移動云2023年收入已達833億元人民幣,同比增長率65.6%,在公有云服務(wù)市場位居國內(nèi)第一陣營。

運營商先天具備網(wǎng)絡(luò)優(yōu)勢,也進一步夯實其算力基礎(chǔ)。目前我國5G基站總數(shù)已達238.4萬個。

4.jpg

其次,運營商有數(shù)據(jù)優(yōu)勢。

憑借此前與千行百業(yè)的合作,運營商已經(jīng)積累了龐大業(yè)務(wù)數(shù)據(jù),能夠快速構(gòu)建稀缺數(shù)據(jù)集,更快訓出垂直行業(yè)大模型。而這些合作經(jīng)驗也能讓運營商在實際合作中,更快推進技術(shù)落地。

同時,東數(shù)西算、東數(shù)西訓等工程的參與,也讓運營商構(gòu)建了更靈活的數(shù)據(jù)流通能力。

最后,不少運營商在AI方面都有提前布局。

以中國移動為例,在2013年就成立了“九天”團隊,在機器視覺、語音、自然語言處理、網(wǎng)絡(luò)智能化等領(lǐng)域有多年技術(shù)積累。

另一方面,運營商也有身份優(yōu)勢。

大模型趨勢是科技革命,也是全球競爭。隨著趨勢不斷發(fā)展,通用人工智能國產(chǎn)自主化越來越被重視。加之政務(wù)、交通等強調(diào)隱私保護的領(lǐng)域也在積極擁抱大模型,對數(shù)據(jù)安全的要求,都使得央企在競爭中具備獨特自身優(yōu)勢。

這兩重優(yōu)勢都讓大模型“國家隊”需要被重點關(guān)注。

更何況,“國家隊”的動向一定程度上反映國家對AI、大模型的重視程度,同時也能體現(xiàn)出我國大模型自研水平、國產(chǎn)自有化的能力。而且在落地上,央企更接近國民經(jīng)濟骨干行業(yè),比如通信、政務(wù)等,能更快促進我國整體生產(chǎn)力躍升。

不過隨著趨勢演進,“國家隊”成員之間的差距也在逐漸形成。比如帶來最新進展的中國移動,成為今年國家網(wǎng)信辦公布的已備案大模型清單中首家央企。

為什么是中國移動?它做對了什么?

為什么是中國移動?

過去1年里,中國移動完成了大模型領(lǐng)域的一系列發(fā)布。

去年世界人工智能大會上,中國移動在大模型領(lǐng)域的第一落子便是發(fā)布兩款行業(yè)大模型“九天·海算政務(wù)”和“九天·客服”。

5.png

幾個月后,中國移動又聯(lián)合多家央企發(fā)布“九天·眾擎基座大模型”。它主打融入各類專業(yè)知識,深度匹配行業(yè)需求。

今年早些時候,在國家網(wǎng)信辦公布的已備案大模型清單中,中國移動“九天自然語言交互大模型”名列其中。這是首個同時通過國家“生成式人工智能服務(wù)備案”和“境內(nèi)深度合成服務(wù)算法備案”雙備案的央企大模型。目前已形成9B、13.9B、57B、千億等多種參數(shù)量版本,可靈活部署于云、邊、端不同場景。

以九天基礎(chǔ)大模型為基礎(chǔ),中國移動已經(jīng)推出了二十余個行業(yè)大模型,覆蓋政府治理、工業(yè)生產(chǎn)、民生服務(wù)和通信特色等領(lǐng)域,其中九天·客服大模型、九天·海算政務(wù)大模型等已經(jīng)落地集團內(nèi)外部客戶。

此外,中國移動還推出了一站式大模型開發(fā)平臺、大模型應用平臺(LLM Studio),面向個人及行業(yè)客戶提供從算力、數(shù)據(jù)、算法框架到研發(fā)工具的全棧人工智能服務(wù)。

6.png

梳理來看,中國移動的大模型戰(zhàn)略其實非常清晰:

依托自身技術(shù)積累及業(yè)務(wù),形成從平臺、大模型及能力到規(guī)模化應用的全面產(chǎn)業(yè)級智能化服務(wù)能力。

據(jù)了解,中國移動原創(chuàng)性提出體系化人工智能(Holistic AI)技術(shù),該技術(shù)具有AI服務(wù)大閉環(huán)、AI能力原子化重構(gòu)、網(wǎng)絡(luò)原生和安全可信四大技術(shù)特征,通過體系化人工智能核心技術(shù)引擎,實現(xiàn)算力、網(wǎng)絡(luò)、人工智能能力全局統(tǒng)一調(diào)度和開放服務(wù),從而構(gòu)建了新型人工智能服務(wù)模式。

無疑,大模型浪潮這對于中國移動自身而言,是一次自我革新的機會,符合發(fā)展需求。運營商本身就是數(shù)字產(chǎn)業(yè)鏈條中的重要參與成員。如果不構(gòu)建大模型能力,運營商只能“賣水”,在產(chǎn)業(yè)鏈中的話語權(quán)將可能逐漸被削弱。

對于國家而言,也需要中國移動這樣的運營商站出來,構(gòu)建更加國有化的大模型能力。

在《數(shù)字中國建設(shè)整體布局規(guī)劃》中明確指出,要強化數(shù)字中國關(guān)鍵能力,構(gòu)筑自強自立的數(shù)字技術(shù)創(chuàng)新體系,筑牢可信可控的數(shù)字安全屏障。

7.jpg

具體推進動作上,憑借扎實的技術(shù)積累,中國移動的步伐越走越快。

中國移動從11年前開始布局AI,長期關(guān)注CV、NLP等前沿AI領(lǐng)域技術(shù),目前在內(nèi)部建立了一支由馮俊蘭博士領(lǐng)軍的百人規(guī)模人工智能研發(fā)團隊。

馮俊蘭博士是IEEE Fellow、中國移動集團級首席科學家。于2001年在中國科學院獲得聲學博士學位,同年加入美國AT&T研究中心,曾任高級研究員、主任研究員,主要研究方向包括:語音識別、 語言理解和數(shù)據(jù)挖掘。

2013年9月加入中國移動研究院,一手帶出“九天”團隊。

目前,中國移動AI團隊發(fā)表國際頂會、頂刊論文150余篇,發(fā)明專利930項,頂級AI競賽TOP5獎項18項,主導了業(yè)界近九成網(wǎng)絡(luò)智能化領(lǐng)域國際標準。

同時在技術(shù)落地方面,中國移動也更加關(guān)注直接影響國民生活的領(lǐng)域。最新展示的行業(yè)大模型覆蓋醫(yī)療、辦公、物聯(lián)水利、網(wǎng)絡(luò)安全、社會綜合治理等領(lǐng)域。

數(shù)據(jù)顯示,九天”產(chǎn)品目前已服務(wù)超10億用戶、300家客戶、云邊端能力調(diào)用次數(shù)超9.6萬億,年賦能價值達41億元。

顯然,在輻射全社會、實現(xiàn)AI普惠、推進數(shù)字中國建設(shè)上,以中國移動為代表的“國家隊”正在異軍突起,它們在中國大模型浪潮中的地位將愈加不可取代。

而在這場波及全球的科技浪潮中,中國移動等運營商也在將中國的數(shù)字基建優(yōu)勢進一步發(fā)揮釋放,為中國數(shù)字化建設(shè)提供獨有的一股驅(qū)動力。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。