即使這是一個(gè)它從未見(jiàn)過(guò)的環(huán)境,系統(tǒng)也應(yīng)該能夠順利應(yīng)對(duì)
麻省理工學(xué)院(MIT)正在研究一種新方法,通過(guò)模仿人類司機(jī)的駕駛方式,讓自動(dòng)駕駛汽車在不熟悉的區(qū)域行駛。
在蒙特利爾舉行的2019機(jī)器人和自動(dòng)化國(guó)際會(huì)議上,關(guān)于此項(xiàng)研究的論文顯示,這種被稱為“變分端到端導(dǎo)航和定位”的技術(shù)使用最基本的地圖和攝像機(jī)來(lái)分析和導(dǎo)航一個(gè)新位置,也就是說(shuō),在程序里本來(lái)是沒(méi)有編寫這個(gè)新位置的詳細(xì)數(shù)據(jù)信息。
自動(dòng)駕駛汽車的發(fā)展表明,提升自動(dòng)駕駛能力的任務(wù)是多么困難,并揭示了人類和機(jī)器智能之間的巨大鴻溝——不僅在計(jì)算能力方面,而且在雙方如何解決問(wèn)題方面也是如此。
舉例來(lái)說(shuō),只需要一張粗略的地圖和他們的眼睛,人類就能很容易地在陌生、復(fù)雜的地方找到路。
夸張一點(diǎn)來(lái)說(shuō),就像一個(gè)人可以從倫敦的特拉法加廣場(chǎng)走到利物浦街站,而他只需注意沿途的酒吧就能完成任務(wù)。
可以看到,人類可以利用非?;镜男畔?,然后將其應(yīng)用于非常復(fù)雜的情況。
人們通過(guò)一張簡(jiǎn)單的地圖就有可能將其與他們周圍所看到的事物聯(lián)系起來(lái)。看似無(wú)關(guān)的數(shù)據(jù)也可以根據(jù)情況被忽略或綜合到導(dǎo)航中。
而即使是在熟悉的區(qū)域,自動(dòng)駕駛汽車也往往依賴非常復(fù)雜的傳感器陣列來(lái)生成詳細(xì)的地圖和數(shù)據(jù)庫(kù),用于定位、繪制地圖、目標(biāo)檢測(cè)、路徑規(guī)劃和轉(zhuǎn)向控制。
對(duì)于像舊金山這樣的大城市來(lái)說(shuō),需要生成的地圖容量可能有4TB那么大。
MIT研究小組表示,設(shè)計(jì)“變分端到端導(dǎo)航和定位”的目的是模仿人類方式,從人類司機(jī)那里學(xué)習(xí),然后只用一個(gè)簡(jiǎn)單的地圖和攝像機(jī)提供的信息來(lái)適應(yīng)新的情況。
這個(gè)想法背后的依據(jù),是機(jī)器能夠?qū)δ:牡貓D信息進(jìn)行糾正,然后添加細(xì)節(jié)并確定車輛的位置,這樣系統(tǒng)就可以更新它到預(yù)期目的地的路線。
為了教會(huì)計(jì)算機(jī),該研究小組讓一名人類駕駛員操控一輛自動(dòng)駕駛版本的豐田普銳斯,同時(shí)用幾個(gè)攝像頭和一個(gè)GPS收集郊區(qū)街道、道路結(jié)構(gòu)和障礙物的數(shù)據(jù)。
與更傳統(tǒng)的依賴非常復(fù)雜的機(jī)器推理和數(shù)據(jù)庫(kù)的方法不同,MIT的方法是從視覺(jué)線索中學(xué)習(xí)。這意味著當(dāng)車輛進(jìn)入一個(gè)新的區(qū)域時(shí),除了一張基本的地圖,它不需要任何其他詳細(xì)的指導(dǎo)。
在計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的丹妮拉?魯斯(Daniela Rus)領(lǐng)導(dǎo)下,MIT團(tuán)隊(duì)開(kāi)發(fā)的這種端到端導(dǎo)航系統(tǒng)的不同之處在于,就像人類一樣,它是專門為尋找目的地而設(shè)計(jì)的,而不是專注于沿著設(shè)計(jì)路線走。
它利用的是從人類駕駛員那里學(xué)到的知識(shí),然后運(yùn)用統(tǒng)計(jì)方法來(lái)預(yù)測(cè)一個(gè)完整的概率分布,這使得車輛在特定時(shí)間點(diǎn)所有可能的轉(zhuǎn)向命令都會(huì)被考慮到。
MIT表示,這一預(yù)測(cè)基于一種名為卷積神經(jīng)網(wǎng)絡(luò)(CNN)的機(jī)器學(xué)習(xí)模型,一種讓車輛通過(guò)與人類司機(jī)培訓(xùn)期間收集的圖像駕駛來(lái)學(xué)習(xí)的方法。
“一開(kāi)始,在一個(gè)T型路口,汽車可以有多種轉(zhuǎn)向選擇?!濒斔菇忉屨f(shuō),“這個(gè)模型也從考慮所有這些方向開(kāi)始,但是當(dāng)它看到越來(lái)越多人類司機(jī)的數(shù)據(jù)時(shí),它看到的是左轉(zhuǎn)或右轉(zhuǎn),但是沒(méi)有人直走?!?/p>
通過(guò)這種方式,自動(dòng)駕駛汽車就能知道如何處理包括T型路口在內(nèi)的不同類型的道路。
“變分端到端導(dǎo)航和定位”還允許汽車考慮其他可見(jiàn)的線索,如標(biāo)志、道路線和其他標(biāo)記,以確定它所處的道路類型并預(yù)測(cè)十字路口狀況,以及在特定情況下如何駕駛。
此外,它還可以分析街道模式,以幫助確定自己的位置。具體來(lái)說(shuō),當(dāng)車輛“看”到的道路與地圖上的線路高概率匹配時(shí),表明系統(tǒng)對(duì)位置進(jìn)行了正確定位。
這樣,一個(gè)4TB大小的城市地圖就可以減少到40GB。
此外,當(dāng)數(shù)據(jù)不匹配時(shí),該系統(tǒng)的適應(yīng)性也要高得多,能夠處理傳感器故障和噪聲輸入。
“我們的目標(biāo)是實(shí)現(xiàn)車輛在新環(huán)境下的自主導(dǎo)航?!濒斔贡硎?,“如果我們訓(xùn)練一輛自動(dòng)駕駛汽車在城市環(huán)境中行駛,比如在劍橋的街道上,系統(tǒng)也應(yīng)該能夠在樹(shù)林中順利地行駛,即使這是一個(gè)它從未見(jiàn)過(guò)的環(huán)境。