蓋世汽車訊 據(jù)外媒報道,日本綜合性研究機構RIKEN腦科學中心的Andrea Benucci及其同事開發(fā)出一種創(chuàng)建人工神經(jīng)網(wǎng)絡的方法,可以學習更快、更準確地識別物體。該研究重點關注未被注意到的眼球運動,并表示眼球運動在穩(wěn)定識別物體方面發(fā)揮著重要作用。這些發(fā)現(xiàn)可以應用于機器視覺,例如,使自動駕駛汽車更容易學習識別道路上的重要特征。
圖片來源:RIKEN
頭部和眼睛一整天都在不停移動,但人類不會因此看不清物體,即使視網(wǎng)膜上的物理信息不斷變化。使這種感知穩(wěn)定性成為可能的是運動命令的神經(jīng)副本(neural copies)。 每次移動時,這些副本都會發(fā)送到整個大腦,并被認為可以讓大腦解釋自身的運動并保持感知穩(wěn)定。
除了穩(wěn)定的感知之外,有證據(jù)表明,眼球運動及其運動副本也可能有助于穩(wěn)定地識別世界上的物體,但具體是如何發(fā)生的還不得而知。Benucci開發(fā)出一個卷積神經(jīng)網(wǎng)絡(CNN),在眼睛移動時優(yōu)化視覺場景中的對象分類,或可解決上述問題。
首先,該神經(jīng)網(wǎng)絡經(jīng)過訓練,可將60,000張黑白圖像分為10個類別。盡管該網(wǎng)絡在這些圖像上表現(xiàn)良好,但當使用模擬眼睛移動時自然改變的視覺輸入的移位圖像進行測試時,其性能急劇下降到偶然水平。然而,在使用移位圖像訓練網(wǎng)絡后,只要還包括導致移位的眼球運動的方向和大小,分類顯著提高。
特別的是,將眼球運動及其運動副本添加到網(wǎng)絡模型中,系統(tǒng)能夠更好地應對圖像中的視覺噪聲。Benucci表示:“這一進步將有助于避免機器視覺中的危險錯誤。憑借更高效、更強大的機器視覺,像素更改(也稱為‘對抗性攻擊’)會減少錯誤率,例如,自動駕駛汽車將停車標志標記為燈桿,或軍用無人機錯誤將醫(yī)院大樓分類為敵方目標。”
Benucci解釋說:“模仿眼球運動及其傳出副本意味著‘強制’機器視覺傳感器具有受控類型的運動,同時通知負責處理關于自生運動相關圖像的視覺網(wǎng)絡,將使機器視覺更加強大,并且類似于人類的視覺體驗?!?/p>
來源:蓋世汽車
作者:劉麗婷