駕駛員在要變道時,就會注意確保沒有車輛出現(xiàn)在盲區(qū),而這種意識對于自動駕駛系統(tǒng)而言也非常重要。因此,自動駕駛技術需要依賴強大的感知中樞,而該中樞預計可以識別環(huán)境中所有相關的主體,包括預測道路上其他車輛的精確“姿態(tài)和形狀”。
現(xiàn)在,自動駕駛汽車系統(tǒng)可以利用最常見的傳感模式之一——激光雷達的數(shù)據(jù)來觀察周圍情況。據(jù)外媒報道,自動駕駛汽車技術公司Argo AI、微軟和卡內基梅隆大學(CMU)的研究人員合作,推出了一個全新的網(wǎng)絡架構,可以通過部分激光雷達的觀測信息估計車輛的形狀和姿態(tài)。
現(xiàn)在用于預測姿態(tài)和形狀的SOTA法通常會首先估計局部點云的姿態(tài),然后在部分輸入信息中加入該姿態(tài),再預測形狀。不過,此種編碼—姿態(tài)解碼以及編碼-形狀解碼架構會導致形狀估計誤差,最終的性能很差。此外,部分輸入的信息被冗余編碼兩次。
因此,為何不使用一個共享式編碼網(wǎng)絡以估計姿態(tài)和形狀呢?
研究人員采用該策略,將編碼合并到一個過程中,以減少冗余,并在共享式編碼網(wǎng)絡中實現(xiàn)穩(wěn)定的姿態(tài)和形狀估計。
訓練該共享式編碼網(wǎng)絡可分為兩部分。首先,對編碼器和補全解碼器進行形狀補全訓練。接下來,凍結編碼器,并采用凍結編碼器產(chǎn)生的代碼對姿態(tài)解碼器進行訓練。凍結是通過逐步凍結隱藏層來加速神經(jīng)網(wǎng)絡訓練的常用技術。與基線網(wǎng)絡相比,用此種方法訓練的姿態(tài)估計器的精度得到顯著提高。
未來,Argo AI會在追蹤等下游模塊中利用該形狀估計模型,并在實時系統(tǒng)中采用該種新型架構。