如果你見過一個孩子玩拼圖,見過他使勁兒想把某一塊拼圖放到合適的位置,那么以下視頻會給你似曾相識的感覺。視頻中的機器人也在玩拼圖,在經(jīng)歷了若干次失敗后,最終順利完成了——全靠自己的摸索,并無特定的程序幫忙。
之前的深度學習能力已成功提升了(機器人的)語言、圖像識別能力;加州大學伯克利分校的研究者們研發(fā)了一種新算法,使機器人通過練習和試錯,自己學會完成任務;這兩種深度學習技術頗為相似。研究者們說它們這種方式與人類學習方式更為接近。
在這個視頻中,我們看到機器人Willow Garage PR2學習怎樣玩樂高玩具、學會完成各種不同的簡單任務,包括開瓶蓋、組裝玩具飛機、插入鞋楦等。
當機器人離開工廠,進入更為嘈雜、充滿未知數(shù)的環(huán)境之中,如家庭、辦公室時,這些能力對他們至關重要。當然這也是“Rosie”和“杰森” (電影《摩登家庭》人物)一直以來的夢想;要實現(xiàn)這一夢想,機器人首先要學會觀察環(huán)境、學會適應變化、掌握許多技能;最理想的是:每一種新環(huán)境機器人都能 適應,不用重寫程序。
“重點是,機器人面對一種新事物時,我們不用為它重新編程?!痹擁椖款I導者之一,加州大學伯克利分校教授Pieter Abbeel 說,“寫入一個程序,告訴機器人怎樣學習,機器人使用同一個程序?qū)W習完成我們交給它的所有新任務?!?/p>
另一個關鍵是:機器人能閱讀分析海量數(shù)據(jù)。
BRETT,全稱叫做“消滅枯燥工作的伯克利機器人”,能通過攝像頭記錄其周邊環(huán)境,每次嘗試(任務)后給自己的表現(xiàn)打分;嘗試某個任務時,它的神經(jīng)網(wǎng)絡(92000個神經(jīng)元)會判斷任務完成與否——神經(jīng)系統(tǒng)不停地計算、工作,直至機器人找到解決辦法。
雖然這一技術與語言認知能力的技術類似,但實現(xiàn)前者的難度更大。
“在一個事先沒有預設好的3D環(huán)境中行動,(對機器人)是一個全新的挑戰(zhàn),”博士研究生Chelsea Finn說?!皼]有明確的方向指引、沒有案例告知怎樣解決問題,沒有類似于語言和圖像識別程序那樣的解決方案?!?/p>
BRETT像大多數(shù)機器人一樣,行動緩慢;但如果給它一點提示(如任務開始、結束階段的協(xié)助),10分鐘之內(nèi)它就能學會完成一項新工作;如果沒有任何幫助,它完成任務的時間則會延長到3個小時左右。
研究團隊希望未來幾年內(nèi)使機器人的表現(xiàn)更出色。隨著計算機程序處理大數(shù)據(jù)的能力加強,而且數(shù)據(jù)庫容量擴大,(機器人)完成復雜任務指日可待。
“讓我們的機器人學會打掃房間、洗熨衣服,我們還有很長的路要走?!盇bbeel說。“但初步結果顯示,掌握了深度學習能力,對于機器人從零開始到學會完成復雜任務,有革命性的作用。未來5到10年內(nèi),我們也許將親眼見證機器人學習能力的驚人變化?!?/p>