《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > MIT用19個神經(jīng)元實現(xiàn)自動駕駛控制

MIT用19個神經(jīng)元實現(xiàn)自動駕駛控制

2020-10-31
來源:量子位

  打造一個自動駕駛控制系統(tǒng)需要多少個神經(jīng)元?

  MIT的科學家告訴你,最少只要19個!方法是向線蟲這種初等生物學習。

20201030071437378.jpg

  最近,來自MIT CSAIL、維也納工業(yè)大學、奧地利科技學院的團隊已經(jīng)開發(fā)了一種基于線蟲大腦的新型AI系統(tǒng)。研究成果登上了最近的《自然·機器智能》雜志。

  他們發(fā)現(xiàn),具有19個控制神經(jīng)元的單個算法,通過253個突觸將32個封裝的輸入特征連接到輸出,可以學習把高維輸入映射到操縱命令。

  這種新的AI系統(tǒng)用少量人工神經(jīng)元控制車輛轉(zhuǎn)向。而基于LSTM的神經(jīng)網(wǎng)絡打造同樣的自動駕駛系統(tǒng),網(wǎng)絡結構則要復雜得多。

  

20201030071437459.gif

  △實現(xiàn)的車輛控制系統(tǒng)

  為何能做到這么少的神經(jīng)元數(shù)量,論文共同一作MIT CSAIL博士后Ramin Hasani解釋說:

  與以前的深度學習模型相比,每個單元內(nèi)信號的處理都遵循不同的數(shù)學原理。

  他們從秀麗隱桿線蟲這種生物受到啟發(fā),在2018年提出了一種神經(jīng)元回路策略(Neuronal Circuit Policies,NCP)。

  

20201030071438160.png

  NCP方法是重新利用生物神經(jīng)回路模型的功能,創(chuàng)建可解釋的控制智能體,管理虛擬和現(xiàn)實世界的強化學習(RL)測試平臺。

  該方法對線蟲的TW神經(jīng)回路進行建模,這個回路主要負責線蟲對外部機械觸摸刺激的反射反應,通過掌握其突觸和神經(jīng)元參數(shù),作為控制基本強化學習任務的策略。

  為了測試這種新的數(shù)學模型,團隊選擇了一項特別重要的測試任務——讓自動駕駛汽車保持在車道上。神經(jīng)網(wǎng)絡接收攝像機拍攝的道路圖像,然后自動決定是向左還是向右轉(zhuǎn)。

 

20201030071438959.jpg

  諸如自動駕駛之類的復雜任務,往往需要具有數(shù)百萬個參數(shù)的深度學習模型。但是,用NCP方法能夠?qū)⒕W(wǎng)絡規(guī)模減少兩個數(shù)量級。

  而這個19神經(jīng)元極簡自動駕駛系統(tǒng)僅使用了7.5萬個訓練參數(shù),參數(shù)數(shù)量降低了2個數(shù)量級。

  NCP方法構建的自動駕駛系統(tǒng)也需要,但是僅用于從攝像機傳入的視覺數(shù)據(jù),并從中提取出結構特征。它與車輛的實際轉(zhuǎn)向無關。

  后面的神經(jīng)網(wǎng)絡來確定攝像機圖像的哪些部分重要,然后將信號傳遞到網(wǎng)絡的NCP控制系統(tǒng)。

  

20201030071438141.png

  系統(tǒng)的控制部分將感知系統(tǒng)中的數(shù)據(jù)轉(zhuǎn)換為轉(zhuǎn)向命令,僅包含19個神經(jīng)元。

  兩個子系統(tǒng)堆疊在一起并同時接受訓練,訓練數(shù)據(jù)集是波士頓地區(qū)人類駕駛汽車視頻,包括圖像與汽車轉(zhuǎn)向操作的關聯(lián)數(shù)據(jù)。

  將它們一起輸入網(wǎng)絡,直到系統(tǒng)學會自動將圖像與適當?shù)霓D(zhuǎn)向系統(tǒng)連接起來,可以獨立處理新情況。

  除了結構簡單外,用NCP設計的自動駕駛系統(tǒng)相比傳統(tǒng)模型,還有兩大優(yōu)勢:可解釋性和魯棒性。

  系統(tǒng)的可解釋性能讓我們我們看到網(wǎng)絡將注意力集中在什么方面。

  從視頻中可以看出,神經(jīng)網(wǎng)絡專注于圖像的非常具體的部分,比如路邊和地平線。研究人員表示,這種行為是在AI系統(tǒng)中是獨一無二的。

20201030071439968.gif

  此外,可解釋性細化到了每個神經(jīng)元。我們還能看到哪個神經(jīng)元(視頻中亮起部分)在駕駛決策中的作用。我們可以了解單個神經(jīng)元的功能及其行為。

  為了測試對比與傳統(tǒng)模型和NCP模型的魯棒性,研究人員還給輸入圖像加入了擾動,并評估了智能體對噪聲的處理能力。結果NCP表現(xiàn)出了對輸入偽像的強大抵抗力。

  除了可解釋性和魯棒性,NCP模型還有其他優(yōu)勢。比如減少訓練時間,減少在相對簡單的系統(tǒng)中實現(xiàn)AI的不確定性。

  Ramin Hasani博士還表示,NCP不僅能應用自動駕駛中,它能模仿學習意味著更廣泛的應用,比如倉庫的自動化機器人等等。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。