2月14日消息,國際數(shù)據(jù)公司(IDC)與浪潮信息聯(lián)合發(fā)布《2025年中國人工智能計算力發(fā)展評估報告》(簡稱《報告》)?!秷蟾妗分赋?,大模型和生成式人工智能推高算力需求,中國智能算力增速高于預期。2025年中國智能算力規(guī)模將達到1,037.3 EFLOPS,預計到2028年將達到2,781.9 EFLOPS。
中國企業(yè)將人工智能作為產(chǎn)業(yè)創(chuàng)新的抓手,加速探究生成式人工智能等先進技術在行業(yè)中的應用,越來越多的中國企業(yè)正在積極制定和實踐人工智能轉(zhuǎn)型戰(zhàn)略。IDC調(diào)研顯示,42%的中國企業(yè)已經(jīng)開始進行大模型的初步測試和重點概念驗證,17%的企業(yè)已經(jīng)將技術引入生產(chǎn)階段,并應用于實際業(yè)務中。
對大型模型及生成式人工智能需求的日益增長,正顯著推動中國人工智能算力基礎設施的快速發(fā)展,促使企業(yè)不斷升級其硬件配置,通過采購高性能的計算設備、優(yōu)化數(shù)據(jù)中心基礎設施、提升存儲和網(wǎng)絡能力等,進一步支持復雜的人工智能運算任務。IDC調(diào)研結果顯示,在未來18個月內(nèi),中國企業(yè)在生成式人工智能項目上的投資將首要集中在硬件升級方面。
IDC研究發(fā)現(xiàn),隨著生成式人工智能和大模型逐步擴大應用,企業(yè)將面臨來自數(shù)據(jù)、算力、模型、人才、成本等多方面的挑戰(zhàn)。其中,算力基礎設施是關鍵議題,企業(yè)當下面臨的相關挑戰(zhàn)包括但不限于計算架構難以支持大規(guī)模應用、與基礎設施建設和維護相關的高昂成本投入,以及高性能的計算資源的不足。
企業(yè)在人工智能大模型訓練、推理階段,會面臨不同的算力挑戰(zhàn)。對于持續(xù)開展大模型訓練和研發(fā)的企業(yè)和研究機構而言,他們需要完成大量計算任務,推高算力需求,將長期處于高性能算力供不應求的狀態(tài);隨著大模型和生成式人工智能技術在實際應用場景中落地,企業(yè)普遍面臨以推理負載為主的算力需求,在推理階段,算力分配和調(diào)度是主要問題,推理任務的算力需求具有波動性,難以預測和管理,導致資源分配不均衡,缺乏有效的算力分配和調(diào)度機制,導致算力資源的局部浪費和整體利用率低下,這不僅影響了人工智能基礎設施的算力效率,也增加了整體成本。
此外,對于調(diào)整技術發(fā)展路徑的科技企業(yè)或者行業(yè)巨頭而言,如放棄自研大模型轉(zhuǎn)用第三方模型,結束大模型訓練轉(zhuǎn)向模型推理,或通過模型剪枝、量化等方法降低模型算力需求,可能會出現(xiàn)算力盈余的情況。同時,在智算中心的積極建設的過程中,部分中心也出現(xiàn)了在實際運營中算力利用率未達預期的情況。
在人工智能單點技術應用方面,IDC調(diào)研顯示,圖像技術成為當下最主要的應用技術類型,人臉與人體識別緊隨其后, 自然語言處理位列第三。