6 月 23 日消息,阿里云今日宣布推出面向自動(dòng)駕駛領(lǐng)域模型的訓(xùn)練、推理加速框架 PAI-TurboX。
據(jù)介紹,該框架可提升感知、規(guī)劃控制乃至世界模型的訓(xùn)推效率,在多個(gè)行業(yè)模型的訓(xùn)練任務(wù)中,PAI-TurboX 均可縮短 50% 的時(shí)間。該框架可用于多模態(tài)數(shù)據(jù)預(yù)處理、離線大規(guī)模模型訓(xùn)練以及實(shí)時(shí)智駕推理等環(huán)節(jié),可為自動(dòng)駕駛、具身智能等領(lǐng)域提供全面解決方案,目前已應(yīng)用于多家車企。
在系統(tǒng)側(cè),PAI-TurboX 通過(guò)優(yōu)化 CPU 親和性、動(dòng)態(tài)編譯、流水線并行等策略,顯著提升模型的訓(xùn)練推理效率;
在數(shù)據(jù)側(cè),PAI-TurboX 提出了高性能的 DataLoader 引擎,并且優(yōu)化了數(shù)據(jù)預(yù)處理流程和實(shí)現(xiàn)了智能訓(xùn)練樣本分組,有效提升數(shù)據(jù)處理效率。
此外,PAI-TurboX 還提供了算子優(yōu)化和量化等能力,可進(jìn)一步減少訓(xùn)練階段的訪存延遲,提升吞吐效率,同時(shí)在推理任務(wù)中,能在保障精度的同時(shí)降低計(jì)算開(kāi)銷與內(nèi)存帶寬需求,可實(shí)現(xiàn)異構(gòu)平臺(tái)下的高性能推理部署。
官方實(shí)測(cè)結(jié)果顯示:
在自動(dòng)駕駛的 3D 物體檢測(cè)模型 BEVFusion 訓(xùn)練任務(wù)中,PAI-TurboX 可以將訓(xùn)練時(shí)間縮短 58.5%;
在實(shí)時(shí)在線矢量化高精地圖構(gòu)建模型 MapTR 訓(xùn)練任務(wù)中,PAI-TurboX 可以將訓(xùn)練時(shí)間縮短 53%;
在端到端自動(dòng)駕駛模型 SparseDrive 訓(xùn)練任務(wù)中,PAI-TurboX 可以在感知模塊訓(xùn)練和聯(lián)合訓(xùn)練兩個(gè)階段獲得明顯的速度提升,相同訓(xùn)練步數(shù)下兩個(gè)階段可分別縮短 51.5% 和 48.5%。
從公開(kāi)資料獲悉,阿里云人工智能平臺(tái) PAI 可提供貫穿 AI 開(kāi)發(fā)和運(yùn)維全流程的平臺(tái)服務(wù)。自 2016 年誕生以來(lái),PAI 已累計(jì)服務(wù)超過(guò) 10 萬(wàn)家企業(yè)客戶及數(shù)百萬(wàn) AI 開(kāi)發(fā)者,支撐阿里云百煉、魔搭社區(qū)等 MaaS 服務(wù)及社區(qū)。