文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.199062
中文引用格式: 王金強,黃航,郅朋,等. 自動駕駛發(fā)展與關鍵技術綜述[J].電子技術應用,2019,45(6):28-36.
英文引用格式: Wang Jinqiang,Huang Hang,Zhi Peng,et al. Review of development and key technologies in automatic driving[J]. Application of Electronic Technique,2019,45(6):28-36.
0 引言
從20世紀70年代開始,自動駕駛技術在美國、英國、德國等發(fā)達國家就被開始進行研究,并在可行性和實用化方面取得了突破性的進展。2004年,美國國防高級研究計劃局(The Denfense Advanced Research Project Agency,DARPA)在Mojave沙漠組織的自動駕駛挑戰(zhàn)賽推動了自動駕駛領域的技術的快速發(fā)展。2007年,卡內(nèi)基梅隆大學在該比賽中取得第一名的優(yōu)秀成績[1],從此,全球?qū)W術界和工業(yè)界對自動駕駛技術開始投入大量的研究,以斯坦福大學、麻省理工學院和弗吉尼亞理工大學為代表的高校在技術領域的深耕為硅谷明星企業(yè)奠定了發(fā)展基礎。同時工業(yè)界更是取得了突破性的、革命性的進展,Google于2009年4月開啟了Waymo[2]自動駕駛研究計劃,隨后Uber[3]、特斯拉[4]、福特[5]、博世[6]、梅賽德斯奔馳[7]、豐田[8]等也相繼進軍自動駕駛領域。我國從20世紀80年代開始進行自動駕駛汽車的研究,1992年,國防科技大學成功研制出中國第一輛自動駕駛汽車ATB-1(AutonomousTestBed-1)。過去幾年,百度[9]、Pony.ai[10]等公司相繼快速步入了全球自動駕駛技術研發(fā)的前列,可以說自動駕駛技術再次引領了整個汽車技術的突破。在車輛智能化的分級中,工業(yè)界目前有兩套標準,一套是由美國交通部下屬的國家高速路安全管理局(National Highway Traffic Safety Administration,NHSTA)制定的,另一套是由國際汽車工程師協(xié)會(Society of Automotive Engineers,SAE)制定的。兩者的L0、L1、L2的分類都是相同的,不同之處在于NHTSA的L4被 SAE細分為L4和L5。國內(nèi)多采用SAE標準,如表1所示。
從自動駕駛誕生以來,社會各界對自動駕駛技術的爭議就沒停止過。然而,這項未來技術始終在困難中向前發(fā)展,其無疑正在成為當下最大的技術變革。它是一門非常復雜的交叉學科,包含了車輛控制、路徑規(guī)劃、感知融合、傳感器融合等眾多技術。尤其在人工智能技術的快速發(fā)展下,機器學習[11]、深度學習、強化學習[12]等前沿領域更是推動了自動駕駛感知、規(guī)劃和控制方面的快速變革,自動駕駛技術已經(jīng)掀起了一場交通變革的技術革命。
1 自動駕駛系統(tǒng)結構
自動駕駛是一個由激光雷達(LiDAR)、毫米波雷達(RADAR)、攝像機(Camera)、全球定位系統(tǒng)(GPS)、慣性測量單元(IMU)等多個傳感器和子系統(tǒng)組成的高級復雜性系統(tǒng)性工程,結構如圖1所示。
在技術功能上,自動駕駛的關鍵技術整體概述為感知(Perception)、規(guī)劃(Planning)和控制(Control)三部分,系統(tǒng)如圖2所示。
該系統(tǒng)實際上是一個分層結構,感知、規(guī)劃、控制模塊各自發(fā)揮不同的作用并相互影響。其中感知部分和車輛傳感器硬件交互與通信,規(guī)劃主要負責汽車的行為等的計算,控制則是對汽車元器件的電子化操作。本文將對自動駕駛車的發(fā)展過程與分級、感知、規(guī)劃和控制等關鍵技術進行相關綜述。
2 自動駕駛中的關鍵技術
2.1 感知
感知是指自動駕駛系統(tǒng)從環(huán)境中收集信息并從中提取相關知識的過程。它負責估計汽車的狀態(tài),并使用車載傳感器捕獲的數(shù)據(jù)與車輛控制系統(tǒng)和決策單元進行交互,同時利用道路網(wǎng)絡、交通規(guī)則、汽車動力學等的先驗信息進行規(guī)劃與控制車輛。通常包含環(huán)境感知和定位兩部分,其中,環(huán)境感知(Environmental Perception,EP)特指對于環(huán)境的場景理解能力,例如障礙物的類型、道路標志及標線、行人車輛的檢測、交通信號等數(shù)據(jù)的語義分類。定位(Localization)是對感知結果的后處理,通過定位功能從而幫助自動車了解其相對于所處環(huán)境的位置。
2.1.1 環(huán)境感知
為了確保自動車對車身周圍環(huán)境的正確理解和對應決策,自動駕駛系統(tǒng)的環(huán)境感知部分通常需要獲取大量周圍環(huán)境信息,具體來說包括:車道線檢測、紅綠燈識別、交通標識牌識別、行人檢測、車輛的檢測等。
激光雷達和相機的融合是實現(xiàn)行人檢測的一種方法,它主要包括空間融合[14]和時間融合??臻g融合主要是指建立激光雷達坐標系到圖像坐標系的坐標轉換關系,該坐標轉換關系能夠?qū)⒓す饫走_坐標系中的點映射到圖像坐標系中。時間融合主要是讓各個傳感器的輸出處在同樣的時間線上,以便于多傳感器融合。
車道線檢測的兩大主流方法是基于視覺的車道線檢測和基于雷達的車道線檢測[15]。基于雷達的車道線檢測直接從點云中檢測車道線,該方法對雷達的線束要求很高,32線及以下的激光雷達難以用于車道線檢測,因為點云太稀疏,車道線的特征不明顯。而64線及以上的激光雷達成本高昂,短期內(nèi)難以大規(guī)模推廣應用?;谝曈X的車道線檢測起步較早、發(fā)展較成熟、應用也很廣泛,但是基于視覺的方法檢測到的車道線位于圖像坐標系中,難以被自動駕駛系統(tǒng)的其他模塊使用。這時可使用多傳感器融合技術,先在圖像中檢測出車道線,然后將激光雷達生成的點投射到圖像上,找出落在車道線上的點在激光雷達坐標系中的坐標,通過這些坐標即可擬合出激光雷達坐標系中的車道線。
紅綠燈識別有兩種方式,一種是基于V2X[16],即智能網(wǎng)聯(lián)技術。該方式通過在紅綠燈上安裝信號發(fā)射器來不斷地向四周發(fā)射紅綠燈的狀態(tài)信息。自動車通過接收信號發(fā)射器發(fā)出的信號來判斷紅綠燈的狀態(tài)。該方法穩(wěn)定性好,可靠性高,但是需要為所有的紅綠燈部署信號發(fā)射器,并在所有自動車上安裝信號接收器,因此成本高昂,短期內(nèi)難以投入實際應用。另一種方式是基于人工智能的視覺算法,它也是目前業(yè)界使用最廣泛的一種方法,使用顏色[17]和形狀[18]信息來識別紅綠燈的方法通常情況下并不穩(wěn)健。為了增強其穩(wěn)健性,級聯(lián)分類器[19]被提出使用,它可能是第一次嘗試基于學習的方法。HoG和Gabor特征分類與SVM[20]也是一種獨特的解決方法,AdaBoost[21]和JointBoost[22]的組合使得視覺檢測發(fā)展有了新的突破。最近,端到端方法(不需要手工制作的特征)優(yōu)于大多數(shù)基于模型的方法。JOHN V等人[23]使用GPS數(shù)據(jù)和交通燈位置數(shù)據(jù)庫用于識別圖像中的感興趣區(qū)域,并且采用卷積神經(jīng)網(wǎng)絡(CNN)[24]來識別交通燈狀態(tài)。同時采用YOLO[25]在LISA[26]數(shù)據(jù)集上取得了良好的效果,使用LISA訓練集時AUC達到90.49%。但是,當使用來自其他數(shù)據(jù)集的訓練數(shù)據(jù)時,性能下降到58.3%。盡管如此,該方法仍然比以前的方法有所改進,并且表明還有很多工作要做。后來,基于機器學習的方法如SVM、級聯(lián)分類器[27]和LogitBoost[28]開始被廣泛地使用,例如文獻[29]。同時,傳統(tǒng)的基于視覺的紅綠燈檢測是使用神經(jīng)網(wǎng)絡直接對原始圖像進行檢測。該方式受環(huán)境影響較大,并且難以處理如圖3所示的場景。
在圖3所示的場景中,多個紅綠燈同時出現(xiàn)在圖像中,用于紅綠燈檢測的神經(jīng)網(wǎng)絡難以確定到底哪一個紅綠燈適用于當前車道中的當前位置。一種新的方式是結合高精度地圖進行紅綠燈檢測。該方式將紅綠燈的位置、大小等信息存放在高精度地圖中。在車輛行駛的過程中,根據(jù)車輛的位置從高精度地圖中找出適用于當前位置的紅綠燈的坐標,并使用坐標轉換將地圖中的坐標映射到圖像中,然后從圖像中剪切出感興趣區(qū)域(ROI),如圖4所示。對ROI使用目標檢測網(wǎng)絡進行紅綠燈檢測,能夠有效地降低環(huán)境的干擾,并且可以解決同一張圖像上存在多個紅綠燈的問題。
更進一步地,由于ROI內(nèi)幾乎只包含紅綠燈,因此可以將目標檢測網(wǎng)絡替換為規(guī)模更小并且運行速度更快的分類網(wǎng)絡,并且不會降低檢測精度。
交通標識牌識別的方式與紅綠燈檢測類似,可以直接使用深度神經(jīng)網(wǎng)絡對原始圖像進行交通標識牌檢測。也可以結合高精度地圖,將交通標志信息存放在高精度地圖中,在車輛行駛的過程中,直接根據(jù)車輛的位置從高精度地圖中獲取交通標志信息。
行人、車輛的檢測常用的方式有兩種,一種是直接使用激光雷達的數(shù)據(jù)進行目標檢測,例如Squeezeseg[30]。另一種是融合激光雷達和相機進行目標檢測。激光雷達能夠提供精確的位置和大小信息,基于圖像的深度學習更擅長目標類別的識別。一種可行的融合激光雷達和相機進行目標檢測的方式如下:
對激光雷達生成的點云數(shù)據(jù)使用地面過濾算法去除其中的地面點,例如文獻[31]。對去除地面點后的點云數(shù)據(jù)使用聚類算法得到一個個的簇。對圖像使用深度神經(jīng)網(wǎng)絡進行目標檢測得到目標的類別標簽,如yolo[32]。將簇通過坐標轉換映射到圖像上,根據(jù)圖像上映射的點計算矩形,遍歷LiDar檢測到的目標,如果目標和Vision檢測到的目標的矩形重合面積達到一定閾值,就根據(jù)該目標的分類結果進行判斷是否符合預先定義的三圍,如表2所示。符合則為候選目標,然后在候選目標中找到距離傳感器最近的目標即為同一目標,并將目標的類別標簽貼到對應的簇上面。通過這種方式可以得到目標的大小、位置和類別等信息。
2.1.2 定位
定位是一臺自動車的必備基礎,它需要告訴車輛相對于外界環(huán)境的精確位置。在城市復雜道路行駛場景下,定位精度要求誤差不超過10 cm,如果定位位置偏差過大,那么在城市道路行駛中,車輛輪胎就很容易在行駛過程中擦到路牙,剮蹭到護欄等,還會引發(fā)爆胎等車輛駕駛安全問題,嚴重的甚至會引發(fā)交通安全事故。
目前使用最廣泛的自動車定位方法是全球定位系統(tǒng)(Global Positioning System,GPS),但GPS的定位精度視器件成本,一般在幾十米到幾厘米級別之間,精度越高,GPS和慣性導航等傳感器的價格也就相對越昂貴。除GPS之外,目前還有基于點云地圖(如圖5所示)的雷達定位、基于雷達和攝像機融合定位、基于攝像機定位慣性導航系統(tǒng)(Inertial Navigation System,INS)四種定位方法。
基于上述四種方法,HATA A Y[33]提出了一種基于道路特征檢測的定位方法。該方法使用環(huán)壓縮分析和最小修剪方塊來分析由多層LIDAR(Velodyne HDL-32E)掃描形成的連續(xù)同心測量(或環(huán))之間的距離。同時使用蒙特卡洛定位(Monte Carlo Localization,MCL)算法通過將從多層激光雷達測量中提取的道路特征與網(wǎng)格圖匹配來估計汽車姿態(tài),該方法在橫向和縱向定位估計誤差均小于0.30 m。許謙[34]提出了一種基于感知目標的相對位置和自動駕駛車輛的絕對位置,它是一種基于遞推最小二乘法的GIS動態(tài)更新算法。把環(huán)境感知質(zhì)點和環(huán)境感知區(qū)域添加到GIS中,實現(xiàn)基于環(huán)境感知信息的GIS動態(tài)更新。應用遞推最小二乘法,估計環(huán)境感知質(zhì)點位置信息,減小了隨機誤差。VISWANATHAN A[35]提出了一種自駕車定位方法,該方法將地面全景圖像與一年中不同季節(jié)拍攝的衛(wèi)星圖像相匹配。他們使用LIDAR數(shù)據(jù)將自動駕駛汽車中的全景相機捕獲的地面圖像分割成地面/非地面區(qū)域,然后翹曲以獲得鳥瞰圖。BRUBAKER M A[36]提出了一種基于視覺里程計和路線圖的定位方法。他們使用OpenStreetMap,從中提取所有交叉點和所有可行駛道路(表示為分段線性段),將它們連接到感興趣的區(qū)域。然后,他們構建了這個路線圖的基于圖形的表示,以及汽車如何遍歷該圖的概率模型。使用這種概率模型和視覺里程測量,他們估計相對于路線圖的汽車位移來完成定位。融合GPS/INS的定位方法在GPS信號缺失、微弱的情況下也不容易做到高精度定位,如地下停車場,密集高樓的市區(qū)等場景。因此也只能適用于部分場景(例如開闊、信號良好環(huán)境下)的自動駕駛定位任務。
此外,地圖輔助類定位算法是另一類廣泛使用的自動車定位算法,即同步定位與地圖構建(Simultaneous Localization And Mapping,SLAM)[37],SLAM的目標即在構建地圖的同時使用該地圖進行定位,SLAM通過利用傳感器(包括視覺、激光雷達等)以及觀測到的環(huán)境特征,確定當前車輛的位置以及當前觀測目標的位置,這是一個利用以往的先驗概率分布和當前的觀測值來估計當前位置的過程,通常使用的方法包括:貝葉斯濾波器(Bayesian Filter,BF)[38]、卡爾曼濾波(Kalman Filter,KF)[39]以及粒子濾波(Particle Filter,PF)[40]等,這些方法都是基于概率和統(tǒng)計原理的定位技術。
SLAM是機器人定位領域的研究熱點,在特定場景下的低速自動駕駛定位的應用過程中,也有較多現(xiàn)實的實例,如園區(qū)自動擺渡車、自動清潔掃地車、甚至是掃地機器人、Boston Dynamics制造的機械大狗等場景,都廣泛使用了SLAM技術。在此類特殊場景的應用中,并不需要在定位的同時實時建圖,只需要事先使用傳感器如激光雷達、視覺攝像頭等對運行環(huán)境區(qū)域進行SLAM地圖的構建,并將構建好的地圖存儲下來,在實際定位的時候,使用3D激光雷達的掃描數(shù)據(jù)和保存在本地的地圖進行點云匹配,確定自動車在地圖中的具體位置,這類方法被統(tǒng)稱為掃描匹配方法(Scan Matching,SM),掃描匹配方法最常見的方法是迭代最近點法(Iterative Closest Point,ICP)[41],該方法基于當前掃描和目標掃描的距離度量來完成點云配準。除此以外,正態(tài)分布變換(Normal Distributions Transform,NDT)[42]也是進行點云配準的常用方法,它是基于點云特征直方圖來實現(xiàn)配準的一種算法。
2.2 規(guī)劃
規(guī)劃是指自動車為了到達某一目的地而做出決策和計劃的過程。對于自動駕駛車輛而言,這個過程通常包括從起始地到達目的地,同時要避免障礙物,并且不斷優(yōu)化行車路線軌跡和行為,以保證乘車的安全舒適。規(guī)劃層通常又被細分為任務規(guī)劃(Mission Planning,MP)、行為規(guī)劃(Behavioral Planning,BP)和動作規(guī)劃(Motion Planning,MP)三層。分層結構設計源于美國2007年舉辦的DAPRA城市挑戰(zhàn)賽,從參賽隊伍已發(fā)表的論文來看,在比賽中多數(shù)參賽隊都將自動車的規(guī)劃模塊分為上述三層結構設計。
2.2.1 任務規(guī)劃
任務規(guī)劃通常也被稱為路徑規(guī)劃或者路由規(guī)劃(Route Planning,RP),通常情況下在DUC中提供了路由網(wǎng)絡定義文件(RNDF)作為先驗信息[45],其中包含相對頂層、全局的路徑規(guī)劃,例如起點到終點的路徑選擇等。
系統(tǒng)通常簡化為有向網(wǎng)絡圖(Directed Graph Network,DGN),該圖能夠表示道路和道路之間的連接情況、通行規(guī)則、道路的路寬等各種信息,這個有向網(wǎng)絡圖也被稱為路網(wǎng)圖(Route Network Graph,RNG),如圖6所示。
圖6中的V表示路口;a表示有向邊的權重,包含路徑長度、限速等信息。自動車的路徑規(guī)劃問題可轉化為在路網(wǎng)圖中,為了讓車輛達到某個目標地(通常來說是從A地到B地),基于某種方法選取最優(yōu)(即代價最?。┞窂降倪^程,即一個有向圖搜索問題。處理該問題的成熟算法有很多,例如迪杰斯特拉算法[44]、A*算法[45]等。ARNAY R[46]使用Dijkstra生成一條全局路徑,該路徑被擴展用于構建自動駕駛車輛“Verdino”的軌跡。BACHA A[47]使用Dijkstra為自動駕駛汽車構建一條全局路徑,以便向停車位導航并倒車。KALA R[48]使用Dijkstra生成全局和本地路徑,僅在計算機模擬中進行測試。
另外一種技術是基于插值曲線的技術,通過該插值過程在先前已知的點集的范圍內(nèi)插入新的點集。該技術采用先前已知的一組點(例如,描述道路地圖的航路點)生成描繪更平滑路徑的新點集。用于自動駕駛汽車的路徑規(guī)劃的最常用的基于內(nèi)插曲線的技術是樣條曲線。HU X使用三次樣條曲線進行路徑規(guī)劃。它們都構成了從車道地圖獲得的一組航路點的中心線,生成一系列參數(shù)三次樣條,其使用弧長和偏移到中心線來表示可能的路徑候選,避免了靜態(tài)和移動障礙[49]。然后,所有這些候選者都被轉換為笛卡爾坐標。考慮到靜態(tài)安全性、舒適性和動態(tài)安全性的總成本,該方法選擇最佳路徑同時還確定了最佳路徑的適當加速度和速度,包括單車道道路和具有靜止和移動障礙物的多車道道路。
2.2.2 行為規(guī)劃
行為規(guī)劃有時也被稱為決策制定(Decision Maker,DM),其主要的任務是根據(jù)任務規(guī)劃的目標和對當前環(huán)境的感知(例如:其他車輛、行人的位置和行為,當前的交通規(guī)則等),做出下一步自動車需要執(zhí)行的決策和動作,可以把這一層模塊所起的作用理解為車輛的駕駛員的決策系統(tǒng),駕駛員根據(jù)目標和當前的交通情況,決定是跟車還是超車,是停車等行人通過還是繞過行人等。
行為規(guī)劃實現(xiàn)的一種方法是使用包含大量動作短語的復雜有限狀態(tài)機(Finite State Machine,F(xiàn)SM)。有限狀態(tài)機即從一個簡單的起始狀態(tài)出發(fā),根據(jù)不同的駕駛場景跳轉到不同的動作狀態(tài),同時將要執(zhí)行的動作傳遞給下層的動作規(guī)劃層。圖7是一個簡單的有限狀態(tài)機。
如圖7所示,每個狀態(tài)都是對車輛動作的一個決策過程,狀態(tài)和狀態(tài)之間存在一些跳轉條件,某些狀態(tài)可以自循環(huán)(比如上圖中的循跡狀態(tài)和等待狀態(tài))。
通過不同復雜程度的有限狀態(tài)機(FSM)在DUC車輛上做出決定來響應特定的感知駕駛環(huán)境來決定行動[50-52]是一種經(jīng)典的處理過程。部分研究工作試圖改善決策結構中的組織,從而管理更大的規(guī)則集[53],以保證遵守規(guī)則集。雖然有限狀態(tài)機FSM是目前自動車上采用的主流行為決策方法,但有限狀態(tài)機FSM仍然存在著很多的局限性:
(1)要實現(xiàn)復雜的行為決策,需要人工設計大量有效的狀態(tài);
(2)車輛有可能會碰到有限狀態(tài)機沒有考慮過的狀態(tài),因此狀態(tài)機的擴展也是問題;
(3)如果有限狀態(tài)機沒有設計死鎖保護,車輛甚至可能陷入某種死鎖狀態(tài)。
2.2.3 動作規(guī)劃
通過規(guī)劃一系列的執(zhí)行動作以達到某種目的(例如避障)的處理過程被稱為動作規(guī)劃。常用兩個指標來考量動作規(guī)劃算法的性能:計算效率(Computational Efficiency,CE)和完整性(Completeness)。所謂計算效率,即完成一次動作規(guī)劃的計算處理效率,動作規(guī)劃算法的計算效率在很大程度上取決于配置空間(Configuration Space,CS)。如果一個動作規(guī)劃算法能夠在問題有解的情況下在有限時間內(nèi)返回一個解,并且能夠在無解的情況下返回無解,那么稱該動作規(guī)劃算法是完整的。
自動車的動作規(guī)劃也可描述為:在給定一個初始配置(Start Configuration,SC),一個目標配置(Goal Configuration,GC)以及若干的約束條件(Constraint)的情況下,在配置空間中找出一系列的動作到達目標配置。這些動作的執(zhí)行結果就是將自動車從初始配置轉移至目標配置,同時滿足約束條件。在自動車這個應用場景中,初始配置通常是自動車的當前狀態(tài)(當前的位置、速度和角速度等),目標配置則來源于動作規(guī)劃的上一層——行為規(guī)劃層,而約束條件則是車輛的運動學限制(最大轉角、最大加速度等)。
顯然,在高維度的配置空間來進行動作規(guī)劃,其計算量是非常巨大的,為了確保規(guī)劃算法的完整性,不得不搜索幾乎所有可能路徑,這就形成了連續(xù)動作規(guī)劃中的“維度災難”問題。目前動作規(guī)劃中解決該問題的核心理念是將連續(xù)空間模型轉換成離散模型,具體的方法可以歸納為兩類:組合規(guī)劃方法(Combinatorial Planning,CP)和基于采樣的規(guī)劃方法(Sampling-Based Planning,SBP)。
運動規(guī)劃的組合方法通過連續(xù)的配置空間找到路徑,而無需借助近似值。由于這個屬性,它們可以被稱為精確算法。組合方法通過對規(guī)劃問題建立離散表示來找到完整的解,如在DARPA城市挑戰(zhàn)賽(Darpa Urban Challenge)中,CMU的自動車(BOSS)就使用了這類動作規(guī)劃算法,他們首先使用路徑規(guī)劃器生成備選的路徑和目標點,如圖8所示,然后通過優(yōu)化算法選擇最優(yōu)的路徑。另一種離散化的方法是網(wǎng)格分解方法(Grid Decomposition Approaches,GDA),在將配置空間網(wǎng)格化以后,使用離散圖搜索算法(如A*等)找到一條優(yōu)化路徑。
基于采樣的方法由于其概率完整性而被廣泛使用,最常見的算法如PRM(Probabilistic Roadmaps)、RRT(Rapidly-Exploring Random Tree)[56]等。在自動車的應用中,狀態(tài)采樣方法需要考慮兩個狀態(tài)的控制約束,同時還需要一個能夠有效地查詢采樣狀態(tài)和父狀態(tài)是否可達的方法。通常情況下,運動規(guī)劃背后的核心思想是通過將連續(xù)空間模型轉換為離散模型來克服這一挑戰(zhàn)[57]。一般情況下存在兩種方法解決:(1)組合規(guī)劃,其構建精確代表該變換的離散表示原始問題;(2)基于抽樣的計劃,利用碰撞檢查模塊對從配置空間抽取的樣本進行離散搜索。
2.3 控制
控制是將規(guī)劃轉化為行動的執(zhí)行過程,主要通過向硬件提供必要的輸入來執(zhí)行規(guī)劃信息,并產(chǎn)生期望的運動。一般情況下,控制器根據(jù)硬件的力矩和能量來映射現(xiàn)實世界中的交互。
2.3.1 經(jīng)典控制
反饋控制是控制領域中最常見的控制器結構,是指通過測量的系統(tǒng)響應并主動補償與所需行為的任何偏差。經(jīng)典的反饋控制的最常見形式是比例-積分-微分(Proportional-Integral-Derivative Controller,PID)控制器。PID控制器是過程控制行業(yè)中使用最廣泛的控制器。PID控制的概念相對簡單。它不需要系統(tǒng)模型,控制律基于誤差信號。
控制是指自動駕駛車輛精準地執(zhí)行規(guī)劃好的動作、路線的能力,及時地給予車輛執(zhí)行機構合適的油門、方向、剎車信號等,以保障自動車能按預期行駛??刂葡到y(tǒng)內(nèi)部會存在測量反饋,控制器通過比較車輛的測量和預期期望來輸出相應的控制動作。
自動車反饋控制模塊中常用的車輛控制模型為自行車模型[53]。在該模型中,車輛姿態(tài)(Pose)是處于一個二維的平面坐標系內(nèi),并且可以由車輛所處的位置(position)以及車身和坐標平面的夾角(heading)來完全描述。同時假設車輛前后輪由一個剛性(rigid)不變的軸連接,其中車輛的前輪可以在一定的角度范圍內(nèi)自由轉動,而車輛的后輪保持和車身的平行關系不能轉動。前輪的轉動對應實際車輛控制中方向盤的轉動。一般情況下車輛的自行車模型所代表的車輛姿態(tài)如圖9所示。
由于制動機構的延遲性,在高速運動場景下,會給控制本身帶來非常大的延遲影響,而PID由于內(nèi)部不存在系統(tǒng)模型,故PID不能對延遲建模。為了解決這一問題,基于模型預測的控制方法也被廣泛地研究。
2.3.2 模型預測控制
模型預測控制(Model Predictive Control,MPC)[56]是指借助車輛運動模型來預測未來一個時間段的運動,通過不斷優(yōu)化控制參數(shù)來擬合這一系列運動的方法,通常來說,模型預測的時間段較短。模型預測控制在工業(yè)過程控制應用中取得了巨大成功,主要歸功于其簡單的概念和處理具有輸入約束和非線性的復雜過程模型的能力,模型預測控制由以下四部分組成:
(1)預測模型:基于當前的狀態(tài)和控制輸入來預測未來一段時間內(nèi)的狀態(tài)的模型,在自動車系統(tǒng)中,通常是指車輛的運動學/動力學模型。
(2)反饋校正:對模型施加了反饋校正的過程,使預測控制具有很強的抗擾動和克服系統(tǒng)不確定性的能力。
(3)滾動優(yōu)化:滾動地優(yōu)化控制序列,以得到和參考軌跡最接近的預測序列。
(4)參考軌跡:即設定的軌跡。
圖10是模型預測控制(MPC)的基本結構圖,由于模型預測控制基于運動模型進行優(yōu)化,在PID控制中面臨的控制時延問題可以在建立模型時考慮進去,所以基于模型預測控制在自動車控制中具有較高的應用價值。
模型預測控制也已廣泛適用于汽車應用[55-56]。整個車輛系統(tǒng)的操作必須在整個操作范圍內(nèi)是最佳的,以便提高燃料經(jīng)濟性,排放和安全性能。然而,在汽車系統(tǒng)中應用模型預測控制器遇到的挑戰(zhàn)與過程控制行業(yè)面臨的挑戰(zhàn)不同。汽車中的過程的采樣周期是幾毫秒,并且由于空間限制,可用的計算資源量受到限制。因此,在推動MPC在汽車行業(yè)中的普及應用中,處理器速度和內(nèi)存的進步以及新算法的開發(fā)非常重要,因此在包括牽引力控制、制動和轉向、車道保持等方面的使用中具有深遠意義[57-60]。
3 結論
自動駕駛技術的發(fā)展為交通出行提供新的方式,尤其近年來隨視覺處理和機器學習的快速發(fā)展,以傳感器為基礎的感知技術得到了快速發(fā)展,相對于視覺處理,在規(guī)劃和控制領域相對比較緩慢。本文綜述了自動駕駛的三個關鍵技術以及目前的發(fā)展狀況,并闡述了相關問題。此外也存在很多挑戰(zhàn),技術上,惡略條件下的精準感知還有待完善,例如雨雪天氣以及道路施工等場景。法律上,目前只有部分城市出臺了關于自動駕駛車輛道路測試的相關指導文件,而且還僅限于測試。不過,隨著技術的發(fā)展以及法律的完善,自動駕駛會逐漸進入我們的生活中。
參考文獻
[1] URMSON C,ANHALT J,BAGNELL D,et.al.Autonomous driving in urban environments:boss and the urban challenge[J].Journal of Field Robotics,2008,25(8):425-466.
[2] WAYMO.We′re building the world′s most experienced driver[EB/OL].[2018-05-22].https://waymo.com/
[3] Uber.Uber:our road to self-driving vehicles[DB/OL].[2018-05-22].https://www.uber.com/blog/our-road-to-self-driving-vehicles.
[4] Tesla.Full self-driving hardware on all cars[EB/OL].[2018-05-22].https://www.tesla.com/autopilot.
文獻[5]-[60]略
作者信息:
王金強,黃 航,郅 朋,申澤邦,周慶國
(蘭州大學 信息科學與工程學院,甘肅 蘭州730000)