IBM公司和美國(guó)麻省理工學(xué)院(MIT)宣布,將聯(lián)合創(chuàng)建“激發(fā)大腦多媒體機(jī)器理解實(shí)驗(yàn)室(BM3C)”,旨在使人工智能可以像人一樣看和聽。
人們?cè)谟^看棒球賽時(shí),很容易就能將投手和投球區(qū)土墩區(qū)別開,甚至能預(yù)測(cè)下個(gè)投球是弧線球還是快球,但目前仍沒有機(jī)器能領(lǐng)會(huì)這些對(duì)人類來說非常簡(jiǎn)單的任務(wù),IBM和MIT的科學(xué)家希望改變這一現(xiàn)狀。
據(jù)美國(guó)《基督教科學(xué)箴言報(bào)》20日?qǐng)?bào)道,他們將聯(lián)合創(chuàng)建BM3C開展相關(guān)研究,讓機(jī)器能像人一樣看、聽和解讀所看到的事物,而且這一項(xiàng)目會(huì)持續(xù)多年。
該實(shí)驗(yàn)室是IBM大力推進(jìn)人工智能發(fā)展的多個(gè)合作計(jì)劃中的最新一項(xiàng)。目前,有很多科研團(tuán)隊(duì)正在從事讓機(jī)器“像人一樣思考,甚至在某些方面超過人類”的研究。
此前,MIT的其他研究團(tuán)隊(duì)已在計(jì)算機(jī)預(yù)測(cè)和理解方面取得了進(jìn)步。比如,今年6月,計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室(CSAIL)的科學(xué)家宣布,他們通過向機(jī)器展示600個(gè)小時(shí)來自YouTube的視頻和電視節(jié)目片段,教會(huì)了它預(yù)測(cè)人如何打招呼——通過握手還是擁抱,準(zhǔn)確率為43%;而人類實(shí)驗(yàn)者的準(zhǔn)確率為71%。2015年有報(bào)道稱,MIT的另外兩名研究人員制造出了“數(shù)據(jù)科學(xué)機(jī)器(DSM)”,能在無人幫助的情況下發(fā)現(xiàn)數(shù)據(jù)模式并挑選出相關(guān)的數(shù)據(jù)點(diǎn)。
盡管如此,教機(jī)器像人一樣看和聽目前還無人做到。科技博客TechCrunch的德溫·寇德威解釋說,問題在于人類的視線和聲音命令跨越多個(gè)認(rèn)知規(guī)則:人類首先需要發(fā)現(xiàn)物體,然后建立它們之間的關(guān)系,并憑直覺獲得物理規(guī)則,諸如此類,而這些事情我們的大腦尤其擅長(zhǎng)。
由于人類思維已掌握了這些技能,研究人員計(jì)劃基于真實(shí)的事情,在虛擬的神經(jīng)網(wǎng)絡(luò)上對(duì)機(jī)器視覺建模。他們預(yù)計(jì),機(jī)器視覺系統(tǒng)可能會(huì)對(duì)教育、娛樂、健康等產(chǎn)業(yè)產(chǎn)生巨大影響。