駕駛員在要變道時(shí),就會(huì)注意確保沒有車輛出現(xiàn)在盲區(qū),而這種意識(shí)對(duì)于自動(dòng)駕駛系統(tǒng)而言也非常重要。因此,自動(dòng)駕駛技術(shù)需要依賴強(qiáng)大的感知中樞,而該中樞預(yù)計(jì)可以識(shí)別環(huán)境中所有相關(guān)的主體,包括預(yù)測(cè)道路上其他車輛的精確“姿態(tài)和形狀”。
現(xiàn)在,自動(dòng)駕駛汽車系統(tǒng)可以利用最常見的傳感模式之一——激光雷達(dá)的數(shù)據(jù)來觀察周圍情況。據(jù)外媒報(bào)道,自動(dòng)駕駛汽車技術(shù)公司Argo AI、微軟和卡內(nèi)基梅隆大學(xué)(CMU)的研究人員合作,推出了一個(gè)全新的網(wǎng)絡(luò)架構(gòu),可以通過部分激光雷達(dá)的觀測(cè)信息估計(jì)車輛的形狀和姿態(tài)。
現(xiàn)在用于預(yù)測(cè)姿態(tài)和形狀的SOTA法通常會(huì)首先估計(jì)局部點(diǎn)云的姿態(tài),然后在部分輸入信息中加入該姿態(tài),再預(yù)測(cè)形狀。不過,此種編碼—姿態(tài)解碼以及編碼-形狀解碼架構(gòu)會(huì)導(dǎo)致形狀估計(jì)誤差,最終的性能很差。此外,部分輸入的信息被冗余編碼兩次。
因此,為何不使用一個(gè)共享式編碼網(wǎng)絡(luò)以估計(jì)姿態(tài)和形狀呢?
研究人員采用該策略,將編碼合并到一個(gè)過程中,以減少冗余,并在共享式編碼網(wǎng)絡(luò)中實(shí)現(xiàn)穩(wěn)定的姿態(tài)和形狀估計(jì)。
訓(xùn)練該共享式編碼網(wǎng)絡(luò)可分為兩部分。首先,對(duì)編碼器和補(bǔ)全解碼器進(jìn)行形狀補(bǔ)全訓(xùn)練。接下來,凍結(jié)編碼器,并采用凍結(jié)編碼器產(chǎn)生的代碼對(duì)姿態(tài)解碼器進(jìn)行訓(xùn)練。凍結(jié)是通過逐步凍結(jié)隱藏層來加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練的常用技術(shù)。與基線網(wǎng)絡(luò)相比,用此種方法訓(xùn)練的姿態(tài)估計(jì)器的精度得到顯著提高。
未來,Argo AI會(huì)在追蹤等下游模塊中利用該形狀估計(jì)模型,并在實(shí)時(shí)系統(tǒng)中采用該種新型架構(gòu)。