9 月 25 日消息,2024 百度云智大會今日在北京召開,百度在大會上宣布全面升級百舸 AI 異構(gòu)計算平臺 4.0、千帆大模型平臺 3.0 兩大 AI 基礎(chǔ)設(shè)施,并升級代碼助手、智能客服、數(shù)字人三大 AI 原生應(yīng)用產(chǎn)品。
百度智能云事業(yè)群總裁沈抖表示:“2024 年大模型的產(chǎn)業(yè)落地正在加速,目前在千帆大模型平臺上,文心大模型日均調(diào)用量超過 7 億次,累計幫助用戶精調(diào)了 3 萬個大模型,開發(fā)出 70 多萬個企業(yè)級應(yīng)用。過去一年,文心旗艦大模型降價幅度超過 90%,主力模型全面免費?!?/p>
升級百舸 4.0
為滿足企業(yè)落地大模型從集群創(chuàng)建、開發(fā)實驗,到模型訓練、推理的全旅程算力需求,百度智能云升級發(fā)布百舸 AI 異構(gòu)計算平臺 4.0,面向萬卡、十萬卡集群全面升級算力管理能力。
集群創(chuàng)建階段:百舸 4.0 預置了主流的大模型訓練工具,能夠?qū)崿F(xiàn)工具層面的秒級部署,并將萬卡集群運行準備時間從幾周縮減至 1 小時。
開發(fā)實驗階段:企業(yè)需要針對業(yè)務(wù)目標對不同架構(gòu)、參數(shù)的模型進行多次測試,進而制定最佳模型訓練策略,保障后續(xù)訓練的性能和效果。百舸 4.0 全新升級的可觀測大盤,能夠?qū)Χ嘈具m配、集群效能、任務(wù)自動容錯等方面進行全方位監(jiān)測。
模型訓練階段:百舸 4.0 能夠自動篩查集群狀態(tài),并基于對 GPU 故障的預測,及時轉(zhuǎn)移工作負載,降低故障發(fā)生頻次。此外,百舸故障秒級感知定位、Flash Checkpoint 模型任務(wù)狀態(tài)回滾等技術(shù),能夠減少集群故障處置時間。
百度官方表示,目前百舸在萬卡集群上實現(xiàn)了有效訓練時長占比 99.5% 以上。此外,百舸 4.0 通過集群設(shè)計、任務(wù)調(diào)度、并行策略、顯存優(yōu)化等一系列升級,整體性能相比業(yè)界平均水平提升 30%。
在模型推理環(huán)節(jié),百舸則通過架構(gòu)分離、KV Cache、負載分配等一系列加速方法,實現(xiàn)了模型推理的降本提效,尤其在長文本推理方面,推理效率號稱提升超過 1 倍。
百舸 4.0 號稱已經(jīng)構(gòu)建了十萬卡級別的超大規(guī)模無擁塞 HPN 高性能網(wǎng)絡(luò)、10ms 級別超高精度網(wǎng)絡(luò)監(jiān)控,以及面向十萬卡集群的分鐘級故障恢復能力。
千帆 3.0,三大服務(wù)升級
為了滿足企業(yè)客戶對模型調(diào)用、模型開發(fā)、應(yīng)用開發(fā)的需求,百度智能云發(fā)布千帆大模型平臺 3.0。
模型調(diào)用方面:升級后的千帆平臺,不但可以調(diào)用包括文心系列大模型在內(nèi)的近百個國內(nèi)外大模型,還支持調(diào)用語音、視覺等各種傳統(tǒng)的小模型。過去一年,文心旗艦大模型降價幅度超過 90%、主力模型全面免費。
模型開發(fā)方面:對于需要定制、微調(diào)專屬模型的客戶,千帆 3.0 不僅提供了大模型工具鏈,還支持 CV、NLP、語音等傳統(tǒng)模型的開發(fā),并實現(xiàn)數(shù)據(jù)、模型、算力等資源的統(tǒng)一納管和調(diào)度。
模型投入使用后,千帆平臺還支持企業(yè)將應(yīng)用中產(chǎn)生的數(shù)據(jù),經(jīng)過采樣評估、人工標注、對齊或微調(diào)等方式反饋給模型,形成數(shù)據(jù)飛輪。
應(yīng)用開發(fā)方面:針對企業(yè)落地大模型的高頻應(yīng)用場景,千帆 3.0 從檢索效果、檢索性能、存儲擴展、調(diào)配靈活性四方面對企業(yè)級檢索增強生成(RAG)進行了升級;針對企業(yè)級 Agent 的開發(fā),千帆 3.0 增加了業(yè)務(wù)自主編排、人工編排、知識注入、記憶能力以及百度搜索等 80 多個官方組件支持。
此外,本次大會還發(fā)布了智能化低代碼應(yīng)用開發(fā)平臺“AI 速搭”,通過自然語言對話就能進行企業(yè)級應(yīng)用開發(fā)。
代碼助手、智能客服、數(shù)字人升級
為了滿足企業(yè)直接選購成熟 AI 應(yīng)用的需求,百度智能云面向數(shù)字人、智能客服、代碼提效,升級了三大 AI 原生應(yīng)用產(chǎn)品,IT之家匯總升級內(nèi)容如下:
1、基于文心大模型重構(gòu)的 AI 原生智能客服應(yīng)用“客悅”:
在用戶復雜意圖理解、多模態(tài)信息交流等方面實現(xiàn)了大幅提升,讓智能客服變得更聰明、更擬人。
“問題自助解決率”是智能客服領(lǐng)域最關(guān)鍵的考核指標,當前業(yè)內(nèi)平均水平是 80%,升級后,客悅將這一指標提升至 92%。
目前,客悅已累計幫助企業(yè)客戶服務(wù)超過 1.5 億人次,交互超過 5 億次。
2、基于大模型能力,新升級的曦靈數(shù)字人 4.0:
支持根據(jù)文字快速生成不同妝造、不同行業(yè)特色的 3D 數(shù)字人形象和視頻。本次大會期間,曦靈平臺宣布:將 3D 超寫實數(shù)字人的價格從萬元降價至 199 元。
全新升級的 4D(3D + 時間維度)自動綁定技術(shù)和創(chuàng)新模態(tài)遷移技術(shù),還解決了傳統(tǒng) 2D 數(shù)字人動作僵硬的問題,可以實現(xiàn)人物在不同角度、形體、表情的高度一致,即使是面部微表情也能做到自然、逼真。
3、全新升級的全流程 AI 代碼提效工具“文心快碼”:
本次大會,文心快碼業(yè)界首發(fā)「企業(yè)級代碼架構(gòu)解釋」、「企業(yè)級代碼審查」兩項全新功能。企業(yè)級代碼架構(gòu)解釋能在項目接手初期,實現(xiàn)工程架構(gòu)的智能解讀,幫工程師快速理解業(yè)務(wù)邏輯;而企業(yè)級代碼審查則能傳承資深工程師的編碼經(jīng)驗,智能輔助程序員查缺補漏。
此外,針對市面上通用代碼助手缺乏對企業(yè)歷史代碼庫的理解的痛點,文心快碼全新升級的「企業(yè)級代碼輔助能力」能夠深度理解企業(yè)代碼庫,快速學習企業(yè)過往的代碼與規(guī)范,讓生成的代碼更貼近企業(yè)的要求。
目前,文心快碼已經(jīng)服務(wù)超過 1 萬家企業(yè)客戶,整體研發(fā)效率提升 20%。