進(jìn)入 2020 年,自動(dòng)駕駛技術(shù)的跨越式路線與漸進(jìn)式路線之間的陣營(yíng)劃分已經(jīng)十分明顯。對(duì)于自動(dòng)駕駛的技術(shù)進(jìn)展,WEVOLVER 發(fā)布的《2020 自動(dòng)駕駛技術(shù)報(bào)告》進(jìn)行了全面的闡釋。但最終自動(dòng)駕駛要完全實(shí)現(xiàn)無(wú)人化,其技術(shù)還需要進(jìn)行不斷的迭代和發(fā)展。
報(bào)告從感知、規(guī)劃、執(zhí)行三個(gè)層面表述了自動(dòng)駕駛汽車(chē)技術(shù)的最新發(fā)展?fàn)顩r,涉及了傳感器、數(shù)據(jù)處理、機(jī)器學(xué)習(xí)、SLAM 與傳感器融合、路徑規(guī)劃等多個(gè)領(lǐng)域,同時(shí)提供了多個(gè)自動(dòng)駕駛公司的案例,包括特斯拉、Volvo、Waymo 等。
感知
自動(dòng)駕駛汽車(chē)是在一個(gè)未知的動(dòng)態(tài)環(huán)境中運(yùn)行的,所以它需要事先構(gòu)建出環(huán)境地圖并在地圖中進(jìn)行自我定位,而執(zhí)行同步定位和映射過(guò)程(SLAM,即時(shí)定位和地圖構(gòu)建)的輸入則需要傳感器和 AI 系統(tǒng)的幫助。
報(bào)告指出,傳感器可分為有源傳感器和無(wú)源傳感器,各種傳感器都有其優(yōu)缺點(diǎn),沒(méi)有一種單一傳感器能夠適用于所有路況。通常情況下,想要可靠、安全地操控一輛自動(dòng)駕駛汽車(chē),需要同時(shí)使用多個(gè)傳感器。
一般情況下,自動(dòng)駕駛汽車(chē)包含的傳感器主要有五種類(lèi)型:
1、遠(yuǎn)程雷達(dá):信號(hào)能夠透過(guò)雨、霧、灰塵等視線障礙物進(jìn)行目標(biāo)檢測(cè)。
2、照相機(jī):一般以組合形式進(jìn)行短程目標(biāo)探測(cè),多應(yīng)用于遠(yuǎn)距離特征感知和交通檢測(cè)。
3、激光雷達(dá):多用于三維環(huán)境映射和目標(biāo)檢測(cè)。
4、短程/中程雷達(dá):中短程目標(biāo)檢測(cè),適用于側(cè)面和后方避險(xiǎn)。
5、超聲波:近距離目標(biāo)檢測(cè)。
前面提到,各類(lèi)傳感器均有其優(yōu)缺點(diǎn),而自動(dòng)駕駛汽車(chē)需要從技術(shù)上對(duì)傳感器進(jìn)行判斷、選擇,篩選的條件主要有以下幾個(gè)方面:
掃描范圍,決定了傳感器對(duì)被感知的物體做出反應(yīng)的時(shí)間;
分辨率,傳感器可以為自動(dòng)駕駛車(chē)輛提供的環(huán)境細(xì)節(jié);
視野/角度分辨率,決定自動(dòng)駕駛汽車(chē)需要多少傳感器來(lái)覆蓋感知的區(qū)域;
3D 環(huán)境下區(qū)分靜態(tài)對(duì)象和動(dòng)態(tài)對(duì)象的能力;
刷新率,決定傳感器信息更新的頻率;
在不同環(huán)境條件下的總體可靠性和準(zhǔn)確性;
成本、尺寸和軟件兼容性;
生成的數(shù)據(jù)量。
以下是 Waymo、Volvo-Uber、Tesla 的傳感器方案示意圖:
另外,關(guān)于無(wú)源傳感器和有源傳感器,報(bào)告中也作了詳盡的介紹:
無(wú)源傳感器
無(wú)源傳感器能夠探測(cè)環(huán)境中物體反射的現(xiàn)有能量,如光、輻射等。但在弱光環(huán)境下,由于沒(méi)有自己的傳播源,無(wú)源傳感器的性能將有所下降。并且在產(chǎn)生的數(shù)據(jù)方面,對(duì)比有源傳感器,無(wú)源傳感器產(chǎn)生的數(shù)據(jù)量更多,約 0.5-3.5 Gbps。
即便如此,無(wú)源傳感器仍具有多方面特點(diǎn),主要包括:
1.涵蓋整個(gè)視野寬度的高分辨率的像素和顏色;
2.在視野中保持恒定的幀頻;
3.兩個(gè)攝像頭可以生成一個(gè) 3D 立體視圖;
4.缺乏發(fā)射源減少了來(lái)自其他車(chē)輛的干擾的可能性;
5.技術(shù)成熟,成本低;
6.系統(tǒng)生成的圖像便于用戶(hù)理解和交互。
如果在自動(dòng)駕駛汽車(chē)上使用無(wú)源攝像頭傳感器套件,需要覆蓋汽車(chē)周邊的各個(gè)環(huán)境。這可以通過(guò)使用在特定時(shí)間間隔拍攝圖像的旋轉(zhuǎn)相機(jī)來(lái)實(shí)現(xiàn),或者通過(guò)軟件將 4-6 個(gè)相機(jī)的圖像拼接在一起。
此外,這些傳感器需要一個(gè)超過(guò) 100 分貝的高動(dòng)態(tài)范圍(場(chǎng)景中高光和陰影的成像能力),使它們能夠在各種光照條件下工作,并區(qū)分不同的對(duì)象。
有源傳感器
有源傳感器具有信號(hào)傳輸源,依靠 TOF 原理感知環(huán)境,ToF 能夠通過(guò)等待信號(hào)的反射返回來(lái)測(cè)量信號(hào)從源到目標(biāo)的傳播時(shí)間,信號(hào)的頻率決定了系統(tǒng)所使用的能量及其準(zhǔn)確性。因此,確定正確的波長(zhǎng)在選擇系統(tǒng)時(shí)起著關(guān)鍵的作用。
關(guān)于有源傳感器的類(lèi)型,報(bào)告主要介紹了以下三種:
超聲波傳感器:也稱(chēng)為聲納;聲音導(dǎo)航測(cè)距。在有源傳感器中,聲波的頻率最低(波長(zhǎng)最長(zhǎng)),因此聲波更容易被干擾,這也意味著超聲波傳感器很容易受到不利環(huán)境條件的影響,如下雨和灰塵。另外,其他聲波產(chǎn)生的干擾也會(huì)影響傳感器的性能,需要通過(guò)使用多個(gè)傳感器和依賴(lài)額外的傳感器類(lèi)型來(lái)緩解干擾。
雷達(dá):主要通過(guò)無(wú)線電波進(jìn)行測(cè)距。無(wú)線電波以光速傳播,在電磁波譜中頻率最低(波長(zhǎng)最長(zhǎng)),基于無(wú)線電波的反射特性,雷達(dá)傳感器可以探測(cè)到前方物體之外的東西。
不過(guò),雷達(dá)信號(hào)容易被具有相當(dāng)導(dǎo)電性的材料(如金屬物體)反射,并且其他無(wú)線電波的干擾也會(huì)影響雷達(dá)的性能,造成雷達(dá)傳感器無(wú)法對(duì)物體進(jìn)行探測(cè)。在確定被探測(cè)目標(biāo)的形狀方面,雷達(dá)的能力不如激光雷達(dá)。
激光雷達(dá):以脈沖激光的形式使用光。激光雷達(dá)傳感器能夠以每秒 50,000- 200,000 個(gè)脈沖的速度覆蓋一個(gè)區(qū)域,并將返回的信號(hào)編譯成一個(gè) 3D 點(diǎn)云,通過(guò)比較連續(xù)感知的點(diǎn)云、物體的差異檢測(cè)其運(yùn)動(dòng),由此創(chuàng)建一個(gè) 250 米范圍內(nèi)的 3D 地圖。
2
規(guī)劃
根據(jù)自動(dòng)駕駛汽車(chē)傳感器套件捕獲的原始數(shù)據(jù)和已有地圖,自動(dòng)駕駛系統(tǒng)需要通過(guò)同時(shí)定位和映射算法構(gòu)建和更新具體的環(huán)境地圖,跟蹤其具體定位,從而開(kāi)始規(guī)劃從一個(gè)點(diǎn)到另一個(gè)點(diǎn)的路徑。
SLAM與傳感器融合
SLAM 是一個(gè)復(fù)雜的過(guò)程,因?yàn)槎ㄎ恍枰貓D,而繪制地圖需要良好的位置估計(jì)。為了更準(zhǔn)確地執(zhí)行即時(shí)定位和地圖構(gòu)建,傳感器融合開(kāi)始發(fā)揮作用。
傳感器融合是將多個(gè)傳感器和數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)合起來(lái)以實(shí)現(xiàn)信息改進(jìn)的過(guò)程。它是一個(gè)多層次的過(guò)程,能夠處理數(shù)據(jù)間的聯(lián)系和相關(guān)性,對(duì)數(shù)據(jù)進(jìn)行組合,與使用單個(gè)數(shù)據(jù)源相比,能夠獲得更便宜、更高質(zhì)量、相關(guān)性更高的信息。
在自動(dòng)駕駛汽車(chē) AI 架構(gòu)中,主要有兩種方法:
1. 逐步處理。把整個(gè)駕駛過(guò)程拆解為一系列逐層連接的流水線,其中的每一步,比如感知、定位、地圖、路徑導(dǎo)航、運(yùn)動(dòng)控制,都分別由各自的具體軟件組件處理。
2. 端到端?;谏疃葘W(xué)習(xí)的解決方案,一次性處理所有這些功能。
通過(guò)傳感器的融合,自動(dòng)駕駛汽車(chē)獲得了數(shù)據(jù),不過(guò),如何從傳感器信號(hào)中提取有用的信息,并基于現(xiàn)有信息執(zhí)行任務(wù),則需要利用機(jī)器學(xué)習(xí)算法——CNN、RNN、DRL。
CNN(卷積神經(jīng)網(wǎng)絡(luò)):主要用于處理圖像和空間信息,提取感興趣的特征和識(shí)別環(huán)境中的對(duì)象。這些神經(jīng)網(wǎng)絡(luò)是由一個(gè)卷積層構(gòu)成的:一個(gè)過(guò)濾器的集合,它試圖區(qū)分圖像的元素或輸入數(shù)據(jù)來(lái)標(biāo)記它們。這個(gè)卷積層的輸出被輸入到一個(gè)算法中,該算法將它們結(jié)合起來(lái)預(yù)測(cè)圖像的最佳描述。最后的軟件組件通常稱(chēng)為對(duì)象分類(lèi)器,因?yàn)樗梢詫?duì)圖像中的對(duì)象進(jìn)行分類(lèi),例如一個(gè)路標(biāo)或另一輛汽車(chē)。
RNN(遞歸神經(jīng)網(wǎng)絡(luò)):主要用于處理視頻信息,在這些網(wǎng)絡(luò)中,先前步驟的輸出將作為輸入進(jìn)入到網(wǎng)絡(luò)中,從而允許信息和知識(shí)能夠在網(wǎng)絡(luò)中持久存在并被上下文化。
DRL(深度強(qiáng)化學(xué)習(xí)):DRL 方法允許軟件定義的“代理”學(xué)習(xí)在虛擬環(huán)境中使用獎(jiǎng)勵(lì)函數(shù)實(shí)現(xiàn)目標(biāo)的最佳可能操作。這些面向目標(biāo)的算法將學(xué)習(xí)如何實(shí)現(xiàn)目標(biāo),或如何在多個(gè)步驟中沿著一個(gè)特定的維度最大化。目前,深度強(qiáng)化學(xué)習(xí)在無(wú)人駕駛汽車(chē)中的應(yīng)用還處于起步階段。
這些方法不一定是孤立存在的。為了避免過(guò)度擬合,在深度學(xué)習(xí)中通常會(huì)進(jìn)行多任務(wù)訓(xùn)練網(wǎng)絡(luò)。當(dāng)機(jī)器學(xué)習(xí)算法被訓(xùn)練用于一個(gè)特定的任務(wù)時(shí),它會(huì)變得如此專(zhuān)注于模仿它所訓(xùn)練的數(shù)據(jù),以至于試圖進(jìn)行插值或外推時(shí),它的輸出會(huì)變得不現(xiàn)實(shí)。
通過(guò)在多個(gè)任務(wù)上訓(xùn)練機(jī)器學(xué)習(xí)算法,網(wǎng)絡(luò)的核心將專(zhuān)注于發(fā)現(xiàn)對(duì)所有目的都有用的通用特性,而不是專(zhuān)注于一個(gè)任務(wù),以便輸出更加實(shí)際有用的應(yīng)用程序。
利用傳感器提供的所有數(shù)據(jù)和這些算法,自動(dòng)駕駛汽車(chē)能夠探測(cè)到周?chē)奈矬w。接下來(lái),它需要找到一條路徑。
3
路徑規(guī)劃
車(chē)輛了解其環(huán)境中的物體及其位置后,可以使用 voronoi 圖(車(chē)輛與物體之間的最大距離)、占用網(wǎng)格算法或駕駛廊道算法來(lái)確定車(chē)輛的大尺度路徑。然而,這些傳統(tǒng)方法并不能夠滿足車(chē)輛在動(dòng)態(tài)環(huán)境下的移動(dòng)。
報(bào)告指出,部分自動(dòng)駕駛汽車(chē)不僅依靠機(jī)器學(xué)習(xí)算法來(lái)感知環(huán)境,還依靠這些數(shù)據(jù)來(lái)控制汽車(chē)。路徑規(guī)劃可以通過(guò)模仿學(xué)習(xí)的方式傳授給 CNN,在模仿學(xué)習(xí)中,CNN 試圖模仿駕駛員的行為。
通常情況下,這些機(jī)器學(xué)習(xí)方法會(huì)與經(jīng)典的運(yùn)動(dòng)規(guī)劃和軌跡優(yōu)化方法相結(jié)合,以確保路徑的魯棒性。此外,出于其他目的(例如減少燃料使用),汽車(chē)制造商還會(huì)在模型中提供最佳路徑參考。
車(chē)輛運(yùn)行過(guò)程中的神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理需要巨大的計(jì)算能力,由于汽車(chē)需要對(duì)新數(shù)據(jù)作出及時(shí)反應(yīng),因此,操作車(chē)輛所需的部分處理需要在車(chē)上進(jìn)行,而模型的改進(jìn)可以在云上完成。
目前,機(jī)器學(xué)習(xí)的最新進(jìn)展在于有效處理自動(dòng)駕駛汽車(chē)傳感器產(chǎn)生的數(shù)據(jù),減少計(jì)算成本。此外,芯片制造和微型化的進(jìn)步正在提高可安裝在自動(dòng)駕駛汽車(chē)上的計(jì)算能力。隨著網(wǎng)絡(luò)協(xié)議的進(jìn)步,汽車(chē)或許能夠依靠低延遲的基于網(wǎng)絡(luò)的數(shù)據(jù)處理來(lái)幫助它們進(jìn)行自主操作。
4
執(zhí)行
那么,車(chē)輛是如何行動(dòng)的呢?
在人類(lèi)駕駛的汽車(chē)中,汽車(chē)的轉(zhuǎn)向、剎車(chē)或信號(hào)等動(dòng)作通常由駕駛員控制。來(lái)自駕駛員的機(jī)械信號(hào)由電子控制單元(ECU)轉(zhuǎn)換成驅(qū)動(dòng)命令,再由車(chē)上的電動(dòng)或液壓執(zhí)行器執(zhí)行。
在(半)自動(dòng)駕駛汽車(chē)中,這種功能被直接與 ECU 通信的驅(qū)動(dòng)控制軟件取代。這些軟件能夠改變車(chē)輛的結(jié)構(gòu),減少部件的數(shù)量;尤其是那些專(zhuān)門(mén)用于為 ECU 將機(jī)械信號(hào)從駕駛員轉(zhuǎn)換為電信號(hào)的部件。
自動(dòng)駕駛汽車(chē)通常包含多個(gè) ECU,一般車(chē)輛大約有 15-20 個(gè),高端車(chē)型可能達(dá)到 100 個(gè)。
ECU 是一個(gè)簡(jiǎn)單的計(jì)算單元,有獨(dú)立的微控制器和內(nèi)存,以此處理接收到的輸入數(shù)據(jù),并將其轉(zhuǎn)換為其子系統(tǒng)的輸出命令,例如,轉(zhuǎn)換自動(dòng)變速箱。
一般來(lái)說(shuō),ECU 既可以負(fù)責(zé)控制車(chē)輛的操作,也可以負(fù)責(zé)安全功能,運(yùn)行信息娛樂(lè)和內(nèi)部應(yīng)用程序。并且,大多數(shù) ECU 支持單個(gè)應(yīng)用程序,如電子動(dòng)力轉(zhuǎn)向,能夠在本地運(yùn)行算法和處理傳感器數(shù)據(jù)。
挑戰(zhàn)一:系統(tǒng)復(fù)雜性
工程師需要為系統(tǒng)設(shè)計(jì)正確的電子體系結(jié)構(gòu),以便進(jìn)行傳感器融合,將決策同步分發(fā)到按指令行事的較低層子系統(tǒng),這對(duì)需求的增加和復(fù)雜性提出了挑戰(zhàn)。
理論上,在一種極端情況下,人們可以選擇一種完全分布式的架構(gòu),其中每個(gè)傳感單元處理其原始數(shù)據(jù)并與網(wǎng)絡(luò)中的其他節(jié)點(diǎn)通信。在光譜的另一端存在一個(gè)集中的架構(gòu),其中所有的遠(yuǎn)程控制單元(RCUs)都直接連接到一個(gè)中央控制點(diǎn),該控制點(diǎn)收集所有信息并執(zhí)行傳感器融合過(guò)程。
而在這個(gè)范圍的中間是混合解決方案,它將在更高抽象級(jí)別工作的中央單元與執(zhí)行專(zhuān)用傳感器處理,或與執(zhí)行決策算法的域相結(jié)合。這些域可以基于車(chē)輛內(nèi)部的位置,例如汽車(chē)前部和后部的域,它們控制的功能類(lèi)型,或者它們處理的傳感器類(lèi)型(例如照相機(jī))。
在集中式體系架構(gòu)中,來(lái)自不同傳感器的測(cè)量值是獨(dú)立的量,不受其他節(jié)點(diǎn)的影響。數(shù)據(jù)在系統(tǒng)的邊緣節(jié)點(diǎn)上沒(méi)有被修改或過(guò)濾,為傳感器融合提供了最大可能的信息,并且具有較低的延遲。這一架構(gòu)挑戰(zhàn)在于,大量的數(shù)據(jù)需要傳送到中央單元并在那里進(jìn)行處理。這不僅需要一個(gè)強(qiáng)大的中央計(jì)算機(jī),而且還需要一個(gè)高帶寬的重型線束。
分布式架構(gòu)可以用更輕的電氣系統(tǒng)實(shí)現(xiàn),但更復(fù)雜。盡管在這樣的架構(gòu)中,與帶寬和集中處理相關(guān)的需求大大減少,但它在驅(qū)動(dòng)和傳感階段之間引入了延遲,增加了對(duì)數(shù)據(jù)驗(yàn)證的挑戰(zhàn)。
挑戰(zhàn)二:動(dòng)力、熱量、重量和尺寸的增加
除了增加系統(tǒng)的復(fù)雜性之外,自動(dòng)化還會(huì)增加車(chē)輛部件的功耗、熱足跡、重量和尺寸。無(wú)論架構(gòu)是分布式的還是集中式的,auton - omous 系統(tǒng)的功耗需求都是巨大的,而在這之中,主要的驅(qū)動(dòng)因素是競(jìng)爭(zhēng)需求。
全自動(dòng)汽車(chē)的競(jìng)爭(zhēng)需求比目前生產(chǎn)的最先進(jìn)的汽車(chē)高出近 100 倍。對(duì)純電動(dòng)汽車(chē)來(lái)說(shuō),行駛里程容易受到這種動(dòng)力需求的負(fù)面影響。因此,Waymo 和福特等公司選擇專(zhuān)注于混合動(dòng)力汽車(chē),而 Uber 則使用全汽油 suv。然而,專(zhuān)家指出,全電動(dòng)最終會(huì)成為動(dòng)力系統(tǒng)的選擇,因?yàn)閮?nèi)燃機(jī)在為車(chē)載電腦發(fā)電方面效率低下。
增加的處理需求和更高的功率吞吐量會(huì)使系統(tǒng)升溫,但為了使電子元件正??煽康毓ぷ?,不管車(chē)外部條件如何,電子元件必須保持在一定的溫度范圍內(nèi),這就需要冷卻系統(tǒng)的存在。但是,冷卻系統(tǒng)進(jìn)一步增加車(chē)輛的重量和尺寸,特別是液體冷卻。另外,額外的組件、額外的布線和熱管理系統(tǒng)也會(huì)對(duì)車(chē)輛任何部分的重量、尺寸和熱性能造成壓力。
針對(duì)于此,自動(dòng)驅(qū)動(dòng)元件的供應(yīng)商正改變著產(chǎn)品,從減輕像 LIDARs 的大型元件重量,到構(gòu)建像 semicon - ductor 這樣的微型元件。同時(shí),半導(dǎo)體公司正在制造占地面積更小、熱性能更好、干擾更小的元件,發(fā)展各種硅元件,如 MOSFET、bipo - lar 晶體管、二極管和集成電路。
不僅如此,該行業(yè)還考慮使用新材料——氮化鎵(GaN)。與硅相比,氮化鎵可以更有效地傳導(dǎo)電子,從而能夠在給定的導(dǎo)通電阻和擊穿電壓下,制造出更小的器件。
一輛全自動(dòng)駕駛汽車(chē)所包含的代碼可能比迄今為止所開(kāi)發(fā)的任何軟件平臺(tái)或操作系統(tǒng)都要多,要自行處理所有的算法和過(guò)程需要顯著的計(jì)算能力和強(qiáng)大的處理。目前,GPU 的加速處理正成為行業(yè)的標(biāo)準(zhǔn)。