《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 业界动态 > 我国新研究有望让机器人具备人眼级视觉能力

我国新研究有望让机器人具备人眼级视觉能力

2026-02-15
來源:IT之家

2 月 14 日消息,2 月 10 日,北京航空航天大學(xué)研究團(tuán)隊在《自然-通訊》發(fā)表研究稱,其開發(fā)的視覺系統(tǒng)在運動處理速度上較現(xiàn)有主流光流技術(shù)快四倍,有望顯著提升自動駕駛車輛、工業(yè)機器人和手術(shù)機器人等系統(tǒng)的反應(yīng)速度。

該成果源自神經(jīng)形態(tài)工程。不同于傳統(tǒng)芯片將存儲與運算分開,神經(jīng)形態(tài)硬件仿照大腦結(jié)構(gòu)將二者融合,從而提高運算效率并降低能耗。長期以來,這一方向被視為彌合機器與人類感知差距的重要路徑。

據(jù)外媒 TechSpot 報道,團(tuán)隊負(fù)責(zé)人高碩(音譯)從大腦的外側(cè)膝狀體獲得靈感。外側(cè)膝狀體位于視網(wǎng)膜與視覺皮層之間,既負(fù)責(zé)傳遞信息,也負(fù)責(zé)篩選信號。由于能夠?qū)r間與空間變化高度敏感,人類視覺系統(tǒng)可優(yōu)先處理快速變化的對象。研究團(tuán)隊嘗試將這種選擇性注意機制在芯片中實現(xiàn)。

傳統(tǒng)機器人視覺依賴攝像頭拍攝連續(xù)靜態(tài)幀,并通過光流算法追蹤像素亮度變化來判斷運動,但該方法處理一幀圖像可能耗時超過 0.5 秒。對于高速行駛的自動駕駛車輛而言,這種延遲意味著在感知空窗期內(nèi),車輛就可能前進(jìn)數(shù)米。

研究人員開發(fā)的神經(jīng)形態(tài)模塊可直接檢測光強隨時間變化的區(qū)域,僅對發(fā)生變化的部分分配算力,實現(xiàn)實時運動識別。

在模擬駕駛和機器人操作測試中,該系統(tǒng)將延遲減少約 75%,并在復(fù)雜運動場景下將追蹤精度提升一倍。

1b17c528-be50-48c2-b83e-e9eb899d60a4.png

該系統(tǒng)仍依賴傳統(tǒng)光流算法進(jìn)行最終圖像解析,且在多重運動交錯場景中表現(xiàn)有限,不過整體性能已明顯優(yōu)于傳統(tǒng)方案,顯示未來機器視覺響應(yīng)速度可能接近甚至超過人類。

1e6bb124-ad49-444d-883c-10818a6d25b2.png

▲ a. 示例應(yīng)用場景。b. 所提出的神經(jīng)形態(tài)運動提取硬件流水線與傳統(tǒng)光流流水線的并排視圖。c. 兩種方法的處理時間和準(zhǔn)確性比較。

熟悉該研究的專家認(rèn)為,這項技術(shù)有望擴展機器人安全運行的環(huán)境范圍,從道路到家庭場景。在家庭中,機器人需識別手勢與細(xì)微表情,更快的視覺反饋將使人機互動更加自然。

下一階段挑戰(zhàn)在于擴大神經(jīng)形態(tài)硬件規(guī)模,并在保持速度與精度的同時整合進(jìn)現(xiàn)有 AI 系統(tǒng)。如果順利推進(jìn),受生物啟發(fā)的視覺架構(gòu)可能改變機器人理解動態(tài)世界的方式與速度。

2.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。