布朗大學(xué)計算機(jī)科學(xué)助理教授斯特弗尼?特里克斯正在解決一個棘手的問題:機(jī)器人的抓握能力。她建立了一個機(jī)器學(xué)習(xí)模型,使機(jī)器人能夠自動學(xué)習(xí)操縱對象,并且能夠從中產(chǎn)生許多樣本數(shù)據(jù),有了這些數(shù)據(jù),其他研究人員可以用它來訓(xùn)練機(jī)器人的抓握能力。
一開始,特里克斯言語之間就充滿著活力與激情,她慢慢陳述著在抓捏物體上,機(jī)器人所面臨的普遍問題。
“大多數(shù)的機(jī)器人在大部分時間能夠抓取物體,但是這也是有一定前提條件的。如果你去到機(jī)器人實(shí)驗(yàn)室,并把一個陌生的從沒看到過的物體放在機(jī)器人面前,該機(jī)器人基本上是無法抓起這個東西的,因?yàn)樗摹季S’里沒有這個物體的信息,也沒有針對該物體做過訓(xùn)練?!?/p>
這真的是一個實(shí)際問題,因?yàn)闄C(jī)器人要抓起這些物體,它們就必須明白具體的任務(wù),以及從傳感器信息庫中知道關(guān)于該物體的相關(guān)信息。例如它的形狀,它所在的位置等等。而這些問題也是機(jī)器人手臂必須被解答的問題,通常還包括,要想抓起這些物體,那么機(jī)器人手臂應(yīng)該調(diào)整到什么位置才能夠準(zhǔn)確地抓起該物體呢?
研究人員對機(jī)器人進(jìn)行編程之后,它可以拿起特定的物體,這其中都是有一部分規(guī)律可循的,但是這些編程好的程序通常只能幫助機(jī)器人抓捏起一小部分的物體。目前,要想使得機(jī)器人能夠自主地抓起某些不熟悉的物體或者移動它們,還是有很大難度的,有類似能力的機(jī)器人還在開發(fā)當(dāng)中。
而特里克斯所構(gòu)建的機(jī)器學(xué)習(xí)模型可以讓她的實(shí)驗(yàn)室機(jī)器人在錯誤中進(jìn)行學(xué)習(xí),經(jīng)過反復(fù)試驗(yàn),直到它能成功地抓起物體。在嘗試和錯誤的交替過程中,可以產(chǎn)生一系列的關(guān)于該物體的圖片信息庫,以及夾持器與物體之間也可以在磨合中更加熨帖。
機(jī)器人不斷練習(xí)所產(chǎn)生的附屬產(chǎn)品就是數(shù)據(jù)庫,它可以成為機(jī)器學(xué)習(xí)的樣本數(shù)據(jù),用來訓(xùn)練其他機(jī)器人來抓捏同樣的物體。但在特里克斯實(shí)驗(yàn)室中,她的巴克斯特機(jī)器人卻不能夠產(chǎn)生足夠多的樣本數(shù)據(jù)。
為了解決這個問題,特里克斯推出了一個“百萬挑戰(zhàn)計劃”,她想要招募全世界的實(shí)驗(yàn)室,針對400臺巴克斯特機(jī)器人來進(jìn)行研究,讓這些閑置的機(jī)器人可以根據(jù)她所研發(fā)的機(jī)器學(xué)習(xí)模型來運(yùn)行,讓它們對上百萬個物體進(jìn)行抓取實(shí)驗(yàn),最終得到一份詳細(xì)的數(shù)據(jù)。
為什么樣本訓(xùn)練數(shù)據(jù)很重要
近年來,機(jī)器學(xué)習(xí)的應(yīng)用技術(shù)如自動駕駛汽車以及圖像識別的應(yīng)用技術(shù)都得到了迅猛的發(fā)展,都是因?yàn)樵谶@些領(lǐng)域有大量的樣本數(shù)據(jù)可以用來訓(xùn)練這些機(jī)器學(xué)習(xí)模型。而機(jī)器人抓取能力的滯后,最主要原因在于樣本數(shù)據(jù)的缺少,從而無法訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
使用標(biāo)記的數(shù)據(jù)來訓(xùn)練機(jī)器學(xué)習(xí)模型最便于理解的例子就是圖像識別。圖像識別的精度已經(jīng)提高了90%。如此進(jìn)步可以歸因于機(jī)器學(xué)習(xí)的應(yīng)用以及龐大的樣本數(shù)據(jù)庫。數(shù)以百萬計的標(biāo)記圖片集已經(jīng)在學(xué)術(shù)研究中被廣泛使用了,如谷歌,F(xiàn)acebook和其他在線圖像存儲器。
神經(jīng)網(wǎng)絡(luò)是如何工作的
神經(jīng)網(wǎng)絡(luò)是一個由幾個簡單高度互連的處理元件組成的計算機(jī)系統(tǒng),可以通過對外部輸入的動態(tài)回應(yīng)來處理信息。它主要是通過處理大量的被標(biāo)記的數(shù)據(jù),從而來獲得理解不同情形的能力。
一張鳥的圖像中,鳥是特定的鳥,在一張汽車圖像中,汽車也是特定的汽車。大量的圖像樣本可通過機(jī)器學(xué)習(xí)軟件來進(jìn)行處理,如Torch和Tensorflow,然后讓它在神經(jīng)網(wǎng)絡(luò)上運(yùn)行,就能夠?qū)ζ溥M(jìn)行訓(xùn)練來識別照片中的物體了。
在這種情況下,輸入的信息主要就是大量的被標(biāo)記的圖像,緊接著系統(tǒng)就能輸出關(guān)于該圖片的許多識別標(biāo)簽,例如所輸入的圖片到底有沒有汽車。而還有一個隱藏的部分就是整個處理過程,通常包含神經(jīng)元,以及根據(jù)算法而來的機(jī)器學(xué)習(xí)軟件處理程序,也可被稱為該圖像的中間值。
緊接著系統(tǒng)會對這些樣本數(shù)據(jù)進(jìn)行重新處理,從而可以測試出該模型在推測圖片標(biāo)簽上的準(zhǔn)確性。然后再對結(jié)果進(jìn)行比對,如果有錯誤就更正過來,并將其反饋到神經(jīng)網(wǎng)絡(luò)中,算法程序就可以根據(jù)所反饋的內(nèi)容做出相關(guān)判斷。這樣的糾錯過程會如此往復(fù)直到出現(xiàn)正確的預(yù)測。
自動駕駛汽車也是以同樣的方式來學(xué)習(xí)駕駛的。當(dāng)有人在駕駛某一輛特定的汽車時,可以將路面的情況,以及各個轉(zhuǎn)彎的角度用3D視頻的方式記錄下來,形成樣本數(shù)據(jù)庫。
該日志可以輸入到機(jī)器學(xué)習(xí)系統(tǒng)當(dāng)中,從而可以訓(xùn)練算法正確地將相關(guān)信息輸入到視頻中去。這個過程會重復(fù)進(jìn)行,直到調(diào)整到一個適用于車輛操作的駕駛模式。
用來訓(xùn)練圖像識別系統(tǒng)的樣本信息量是很巨大的。而自動駕駛汽車有大量的數(shù)據(jù)集。谷歌研發(fā)的自動駕駛汽車已經(jīng)行駛了一百萬英里,特斯拉也行駛了近10億英里,有了這些數(shù)據(jù),可以提供更全的駕駛經(jīng)驗(yàn)。而訓(xùn)練機(jī)器人的抓握能力時,卻沒有這些數(shù)據(jù)的支持。
“百萬挑戰(zhàn)計劃”
如果特里克斯的“百萬挑戰(zhàn)計劃”可以成功,將會獲得大量的數(shù)據(jù),終將有一天可以讓機(jī)器人有更準(zhǔn)確的抓握能力。