123,123,123

自动驾驶算力之争从天上卷到地上了

日期： 2023-01-01

來源：EETOP

關(guān)鍵詞： 自动驾驶算力特斯拉

在量產(chǎn)自動(dòng)駕駛方向，特斯拉是當(dāng)之無愧的領(lǐng)軍者。

不管是產(chǎn)品定義、產(chǎn)品命名，還是下一階段的發(fā)展方向，都是特斯拉在引領(lǐng)全球車企和自動(dòng)駕駛公司發(fā)展。

特斯拉自動(dòng)駕駛系統(tǒng)的優(yōu)異表現(xiàn)是算法的勝利，但算法背后，算力同樣重要。

這方面特斯拉實(shí)際上是掀起了三波浪潮，從車端算力到云端算力，再到AI智算中心…每一次算力的迭代，都促進(jìn)了特斯拉自動(dòng)駕駛系統(tǒng)邁上新的臺階。

現(xiàn)在，中國車企在車端算力上動(dòng)輒數(shù)千TOPS，已經(jīng)大幅超過特斯拉，接下來就是要在車外算力上去追趕了。

一、自動(dòng)駕駛越來越卷車外算力成新熱點(diǎn)

今年8月份，內(nèi)蒙古烏蘭察布已經(jīng)有了一絲絲涼意。雖然街上人不多，但在一間酒店會(huì)議室里卻聚集起了省市區(qū)三級領(lǐng)導(dǎo)，共同見證小鵬汽車的自動(dòng)駕駛AI智算中心“扶搖”揭牌。

該中心由小鵬和阿里聯(lián)合出資打造。據(jù)小鵬汽車CEO何小鵬介紹，該中心具備60億億次浮點(diǎn)運(yùn)算能力（60000TFLOPs），可將自動(dòng)駕駛算法的模型訓(xùn)練時(shí)間提速170倍，并且未來還具備10~100倍的算力提升空間。

就在小鵬“扶搖”官宣后的1個(gè)多月，長城旗下的自動(dòng)駕駛公司毫末智行也宣布將打造屬于自己的AI智算中心。毫末智行CEO顧維灝表示，該中心的目標(biāo)是滿足千億參數(shù)大模型的訓(xùn)練，訓(xùn)練100萬Clips的數(shù)據(jù)，訓(xùn)練成本降低200倍。

在這兩個(gè)案例之外，智己汽車在6月份公布了和阿里云聯(lián)合打造的“云上數(shù)據(jù)超級工廠”，這是跟小鵬“扶搖”類似的AI計(jì)算中心；10月份的特斯拉AI Day上，特斯拉也展示了自有AI計(jì)算中心的最新進(jìn)展，用自研的D1芯片打造的計(jì)算設(shè)備能夠提升30%的模型訓(xùn)練效率…

毫無疑問，車外算力已經(jīng)成了車載自動(dòng)駕駛芯片之外，車企和自動(dòng)駕駛公司們競爭的新焦點(diǎn)。

二、AI技術(shù)越用越多算力是核心競爭力

車外算力成為新焦點(diǎn)，與自動(dòng)駕駛算法的演進(jìn)趨勢密切相關(guān)。

過去10年來，面向量產(chǎn)的L2自動(dòng)駕駛系統(tǒng)在特斯拉的帶動(dòng)下發(fā)生了一系列變化：在單車道居中智能巡航的基礎(chǔ)功能上，增加了指令式或全自動(dòng)變道功能，以此為基礎(chǔ)又衍生出了自動(dòng)導(dǎo)航輔助駕駛系統(tǒng) -- 設(shè)定好目的地后，車輛在高速上智能巡航，并知道何時(shí)駛下高速。

在自動(dòng)導(dǎo)航輔助駕駛過程中，車輛需要時(shí)刻感知周邊車輛，并自動(dòng)做出變道決策。這與此前的單車道巡航功能相比，難度直接提升了一個(gè)數(shù)量級，進(jìn)而也逼著自動(dòng)駕駛算法從固定的“規(guī)則算法”向著數(shù)據(jù)驅(qū)動(dòng)的AI算法轉(zhuǎn)變。

隨著算法越來越成熟，最近一兩年高速場景的自動(dòng)駕駛系統(tǒng)已經(jīng)不再是車企宣傳的重點(diǎn)，各家轉(zhuǎn)而開始比拼城市場景的點(diǎn)到點(diǎn)自動(dòng)駕駛能力。

與高速自動(dòng)導(dǎo)航輔助駕駛相比，城市內(nèi)行車又涉及到了紅綠燈、十字路口、行人電動(dòng)車、遮擋、固定障礙物等一系列難題，復(fù)雜度又提升了好幾個(gè)數(shù)量級。

為了解決這些新問題，車企和自動(dòng)駕駛公司給汽車引入了更多的傳感器，高精地圖、半固態(tài)激光雷達(dá)、4D成像毫米波雷達(dá)紛紛上車，且背后的算法也得進(jìn)一步升級 -- 以前是從規(guī)則到AI，現(xiàn)在是從簡單AI到高級AI。

在特斯拉的帶動(dòng)下，過去量產(chǎn)自動(dòng)駕駛常見的后融合算法逐漸被拋棄，轉(zhuǎn)而使用前融合的BEV算法，把攝像頭的感知到的畫面直接扔進(jìn)AI算法里，生成一個(gè)鳥瞰視角的3D空間，并在這個(gè)空間內(nèi)輸出感知結(jié)果。

因?yàn)槭撬袛z像頭統(tǒng)一在3D空間里輸出感知目標(biāo)，BEV算法很好的解決了跨攝像頭的識別問題，在處理近距離加塞這種行業(yè)難題時(shí)有了更好的表現(xiàn)。

這還沒完。因?yàn)榱慨a(chǎn)車搭載的自動(dòng)駕駛芯片算力相對有限，車企和自動(dòng)駕駛公司還在積極使用多任務(wù)神經(jīng)網(wǎng)絡(luò)，比如特斯拉的HydraNet，就是讓一套AI算法同時(shí)輸出多個(gè)結(jié)果。

大家使用的AI算法越來越高級，給行業(yè)也帶來了兩個(gè)重要變化：

一是需要越來越多的數(shù)據(jù)來培育算法背后的神經(jīng)網(wǎng)絡(luò)，算法之間的競爭逐步變成了數(shù)據(jù)之爭。

二是海量數(shù)據(jù)需要海量的存儲和處理能力，車企和自動(dòng)駕駛公司對專用的AI計(jì)算設(shè)備的需求量持續(xù)增長。

多位自動(dòng)駕駛技術(shù)專家都曾告訴車東西，AI技術(shù)進(jìn)步很快，大家在算法和模型層面的差距其實(shí)并不大，真正拉開差距的是數(shù)據(jù)收集和處理能力。

正是如此，我們才看到了車企和自動(dòng)駕駛公司們在今年紛紛宣布了自建AI計(jì)算中心的消息，瘋狂卷起了車外算力。

三、車外算力不只有云特斯拉打響算力

看到這里你肯定該提問了，現(xiàn)在云服務(wù)這么方便，算力要多少有多少，租云不就好了嗎？為啥要費(fèi)勁自建AI計(jì)算中心呢？

這里需要從成本和技術(shù)兩個(gè)維度考量。

先說經(jīng)濟(jì)性。據(jù)車東西了解，目前車企和自動(dòng)駕駛公司每年在云計(jì)算方面花費(fèi)的資金普遍在數(shù)千萬元，頭部玩家上億也很常見，且隨著數(shù)據(jù)量的日益增長，在AI計(jì)算方面的投資也在水漲船高。

據(jù)IDC統(tǒng)計(jì)，2022年自動(dòng)駕駛相關(guān)公司對AI計(jì)算的投資全部在增長，并且有28%的企業(yè)投資增長幅度超過30%。

如果持續(xù)使用公有云服務(wù)，顯然存在邊際成本不斷上漲的問題。

而若是自行采購設(shè)備組建AI計(jì)算中心，一次性投資約在數(shù)千萬到1億元以內(nèi)，長期來看性價(jià)比更高。

當(dāng)然這里也有個(gè)前提，那就是企業(yè)的數(shù)據(jù)處理、模型訓(xùn)練流程得相對固定才行。如果還處于研發(fā)早期，AI算力需求不固定，那還是使用具有彈性的公有云最合適。

技術(shù)層面，自建AI計(jì)算中心也更具優(yōu)勢。

云計(jì)算的本質(zhì)是租賃計(jì)算設(shè)備。云服務(wù)商的設(shè)備都是統(tǒng)一采購 -- 目標(biāo)是具備最大的通用性（這樣才能獲得更多客戶）。所以其設(shè)備內(nèi)部使用的CPU、GPU/AI加速器、內(nèi)存的型號與規(guī)格都相對固定，很難與車企和自動(dòng)駕駛公司的算法形成最佳匹配。

另一方面，云服務(wù)廠商對自動(dòng)駕駛算法的了解程度不高，其使用的管理軟件在調(diào)度AI計(jì)算設(shè)備集群時(shí)難免會(huì)出現(xiàn)損耗和效率不高的問題。

這導(dǎo)致在理論算力一定的情況下，其訓(xùn)練AI模型需要更多的時(shí)間。

作為量產(chǎn)自動(dòng)駕駛方面的領(lǐng)頭羊，特斯拉是深知專用AI算力的重要性。

其在多年前就開始打造了屬于自己的AI計(jì)算中心 -- Dojo，總計(jì)使用了1.4萬個(gè)英偉達(dá)的GPU來訓(xùn)練AI模型。

特斯拉專家在今年AI Day上表示，其需要使用14億幀畫面才能訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)，對應(yīng)的是10萬個(gè)GPU工時(shí)！可見這是一個(gè)非常龐雜和耗時(shí)的過程。

特斯拉為了進(jìn)一步提升效率，在2021年發(fā)布了自研的AI加速芯片D1。25個(gè)D1封裝在一起組成一個(gè)訓(xùn)練模塊（Training tile），然后再將訓(xùn)練模塊組成一個(gè)機(jī)柜（Dojo ExaPOD）。

按照特斯拉方面的說法，使用Dojo組成的AI計(jì)算集群，可提升30%的網(wǎng)絡(luò)訓(xùn)練速度。

上面實(shí)打?qū)嵉臄?shù)據(jù)說明，特斯拉通過高度定制化的方式建立自己的AI計(jì)算中心，確實(shí)使其在模型訓(xùn)練的效率方面獲得了明顯的提升。

某種程度來說，特斯拉通過自研D1芯片，自研Dojo ExaPOD智算設(shè)備，實(shí)際上構(gòu)建的是一種其他競爭對手難以企及的算力霸權(quán)。

接下來，隨著路上特斯拉的車隊(duì)規(guī)模越來越大，采集的數(shù)據(jù)越來越多，特斯拉的算法迭代速度也會(huì)越來越快，對其他車企和自動(dòng)駕駛公司形成越來越難以逾越的領(lǐng)先優(yōu)勢。

四、自建AI計(jì)算中心選對設(shè)備很關(guān)鍵

既然自建AI計(jì)算中心如此重要，而數(shù)據(jù)中心最核心的AI智算設(shè)備，更是一點(diǎn)不能含糊。

目前國內(nèi)AI智算設(shè)備銷量第一的浪潮，已經(jīng)開始全面布局智能汽車和自動(dòng)駕駛領(lǐng)域，希望用自家高質(zhì)量的AI智算設(shè)備為車企和自動(dòng)駕駛公司的模型訓(xùn)練提供支持。

如何選擇AI計(jì)算設(shè)備？軟硬件結(jié)合最關(guān)鍵。

正如前文所言，只有高度定制化的AI智算設(shè)備才能發(fā)揮最佳的訓(xùn)練效果。

浪潮深知這個(gè)道理。為了研發(fā)出最適合自動(dòng)駕駛行業(yè)的AI智算設(shè)備，浪潮專門組建了一支幾十人的算法團(tuán)隊(duì)，先研究自動(dòng)駕駛的前沿算法。

比如最近在NuScenes數(shù)據(jù)集的3D目標(biāo)檢測比賽中，浪潮自動(dòng)駕駛團(tuán)隊(duì)的DABNet4D算法一舉拿下了第一名的成績 -- NDS綜合檢測精度0.624，較2021年的第一名提升了16個(gè)點(diǎn)，進(jìn)步明顯。

▲NuScenes 3D目標(biāo)檢測比賽榜單

浪潮信息的AI團(tuán)隊(duì)早在今年年初就構(gòu)建了一個(gè)基于Transformer架構(gòu)的多視角特征融合模型CBTR算法，并繼續(xù)基于多相機(jī)時(shí)空特征優(yōu)化，設(shè)計(jì)構(gòu)建MASTER（Multi-camerA Spatial and Temporal feature ExtractoR，多相機(jī)時(shí)空特征提取器）。而最近所登頂?shù)腄ABNet4D算法正是在MASTER算法的基礎(chǔ)上進(jìn)一步引入了深度估計(jì)網(wǎng)絡(luò)等等，最終實(shí)現(xiàn)了更為高效穩(wěn)定的BEV輸出。

此外，通過圖像數(shù)據(jù)增強(qiáng)、BEV特征增強(qiáng)和樣本貼圖增強(qiáng)等多尺度的數(shù)據(jù)增強(qiáng)技術(shù)等，提升模型的檢測效果，最終DABNet4D算法在NuScenes數(shù)據(jù)集中奪得3D目標(biāo)檢測第一名的佳績。

有了對自動(dòng)駕駛算法模型的深刻理解，浪潮就能在硬件和軟件兩個(gè)維度優(yōu)化自家的AI智算設(shè)備。

硬件層面，不僅CPU、GPU/AI加速器等核心硬件的選型做過優(yōu)化，像是CPU與GPU之間、計(jì)算設(shè)備之間的通信鏈路設(shè)計(jì)也進(jìn)行了專門的設(shè)計(jì)。

比如浪潮自動(dòng)駕駛團(tuán)隊(duì)訓(xùn)練模型使用的是全球領(lǐng)先的AI服務(wù)器5488A5服務(wù)器平臺。其中GPU之間使用了NV-Switch全互聯(lián)架構(gòu)，來滿足模型訓(xùn)練的高顯存需求，以及模型并行訓(xùn)練的高通信帶寬需求。

軟件方面的優(yōu)化更為重要，配套軟件算法要讓硬件高效的運(yùn)轉(zhuǎn)起來。

浪潮的AI智算設(shè)備融合AIStation，通過整合計(jì)算資源、數(shù)據(jù)資源以及AI開發(fā)環(huán)境，實(shí)現(xiàn)AI 計(jì)算資源統(tǒng)一分配調(diào)度、訓(xùn)練數(shù)據(jù)集中管理與加速、AI模型流程化開發(fā)訓(xùn)練，為自動(dòng)駕駛車企開發(fā)團(tuán)隊(duì)構(gòu)建敏捷高效的一體化開發(fā)平臺。

這里舉個(gè)例子。

當(dāng)前大多數(shù)的AI模型訓(xùn)練一般需要使用幾個(gè)到幾十個(gè)GPU加速卡，而面向自動(dòng)駕駛?cè)诤细兄哪Ｐ陀?xùn)練，因?yàn)槠淠Ｐ蛷?fù)雜度的提升和數(shù)據(jù)量的規(guī)模因素，則需要使用幾百上千個(gè)GPU加速卡協(xié)同訓(xùn)練。

如此大規(guī)模的協(xié)同計(jì)算，無論是在集群硬件，還是在算法軟件上，都是需要進(jìn)行專門的設(shè)計(jì)優(yōu)化。如果不進(jìn)行優(yōu)化，假設(shè)用搭載了1000塊GPU的AI計(jì)算中心訓(xùn)練一個(gè)模型，其中每個(gè)GPU的效率發(fā)揮甚至可能不到10%，也就是會(huì)出現(xiàn)用的資源越多，算的越慢的情況。

浪潮的專業(yè)團(tuán)隊(duì)曾經(jīng)建設(shè)了一個(gè)超過2000個(gè)GPU的超大規(guī)模AI計(jì)算集群，并在訓(xùn)練“源”大模型系列時(shí)，實(shí)現(xiàn)了90%的擴(kuò)展效率。協(xié)同軟、硬件系統(tǒng)優(yōu)化能力，大幅提升訓(xùn)練效率，最大化地發(fā)揮GPU性能。

這些實(shí)打?qū)嵉募夹g(shù)細(xì)節(jié)和參數(shù)，也正是浪潮助力車企和自動(dòng)駕駛企業(yè)組建AI智算中心的底氣所在。

在AI算力、算法方面，浪潮所擁有的整體化技術(shù)優(yōu)勢，也讓其連續(xù)多年在AI服務(wù)器市場穩(wěn)居全球市占第一，并深獲互聯(lián)網(wǎng)頭部客戶的絕對認(rèn)可。

五、智能化助力自主品牌彎道超車

最后我們回到汽車行業(yè)本身來看。

汽車四化浪潮是中國汽車產(chǎn)業(yè)遇到的千載難逢的時(shí)代機(jī)遇。電動(dòng)化打破了傳統(tǒng)燃油車的技術(shù)壁壘，讓自主車型能夠與歐美大牌平起平坐。智能化是我國的優(yōu)勢領(lǐng)域，一旦在技術(shù)上實(shí)現(xiàn)領(lǐng)先，就能帶動(dòng)車型競爭力的大幅領(lǐng)先，最終帶動(dòng)整個(gè)中國汽車工業(yè)實(shí)現(xiàn)彎道超車。

從今年的汽車銷量來看，電動(dòng)化浪潮已經(jīng)帶動(dòng)比亞迪、廣汽、蔚來、理想等車企初步實(shí)現(xiàn)彎道超車。

下一步，各大車企和汽車智能化供應(yīng)商應(yīng)該進(jìn)一步加大投資力度，在算法和算力方面實(shí)現(xiàn)雙線布局，將我國龐大的市場優(yōu)勢轉(zhuǎn)化為數(shù)據(jù)優(yōu)勢，從而在自動(dòng)駕駛等智能化系統(tǒng)的研發(fā)上實(shí)現(xiàn)更大發(fā)展，最終助力整個(gè)汽車工業(yè)實(shí)現(xiàn)彎道超車

更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

自动驾驶算力之争 从天上卷到地上了

日期： 2023-01-01

來源：EETOP

相關(guān)內(nèi)容

自动驾驶算力之争从天上卷到地上了