國(guó)外科技網(wǎng)站Venturebeat發(fā)布文章稱,人工智能在過(guò)去一年里有著強(qiáng)勁的發(fā)展,給人們帶來(lái)越來(lái)越多的益處。而未來(lái),機(jī)器視覺(jué)將會(huì)是人工智能的下一個(gè)前沿領(lǐng)域。隨著該類技術(shù)的發(fā)展,明年將會(huì)出現(xiàn)新型人工智能驅(qū)動(dòng)的設(shè)備。
機(jī)器為什么需要視覺(jué)呢?視覺(jué)是主要的感官。機(jī)器要能夠理解人類,提供他們所需的支持,那么它們必須能夠在視覺(jué)范疇進(jìn)行觀察和表現(xiàn)。具體形式可以是一個(gè)幫助盲人“看見(jiàn)”和理解周遭世界的小攝像頭,又或者能夠準(zhǔn)確區(qū)分流浪貓、在移動(dòng)的樹(shù)枝和竊賊的家庭監(jiān)控系統(tǒng)。
正當(dāng)電子設(shè)備在人們的日常生活中變得日益重要,我們也發(fā)現(xiàn)越來(lái)越多的設(shè)備應(yīng)用因?yàn)闆](méi)有足夠強(qiáng)大的視覺(jué)功能而失敗,如無(wú)人機(jī)在空中發(fā)生碰撞,機(jī)器人吸塵機(jī)吸掉不該吸的東西。
隨著研究人員應(yīng)用專門(mén)的神經(jīng)網(wǎng)絡(luò)來(lái)幫助機(jī)器識(shí)別和理解現(xiàn)實(shí)世界的圖像,機(jī)器視覺(jué)在過(guò)去幾年取得了巨大的進(jìn)步。如今的計(jì)算機(jī)在視覺(jué)識(shí)別上能夠做到各種各樣的事情,從識(shí)別網(wǎng)絡(luò)上的貓到在諸多的照片中識(shí)別特定的面孔。不過(guò),該類技術(shù)還有很長(zhǎng)的路要走。
當(dāng)前,機(jī)器視覺(jué)在走出數(shù)據(jù)中心,應(yīng)用于各類用途,從無(wú)人機(jī)的自動(dòng)駕駛到食品整理。
基本的圖像分類已經(jīng)簡(jiǎn)單多了,但在從復(fù)雜的場(chǎng)景中提取要義或者信息,機(jī)器則面臨著一系列的新問(wèn)題。錯(cuò)視問(wèn)題便是機(jī)器視覺(jué)仍長(zhǎng)路漫漫的一個(gè)很好的例證。
舉例來(lái)說(shuō),當(dāng)人看到兩張面對(duì)面的臉的輪廓圖像時(shí),他們看到的不僅僅是抽象的形狀。他們的大腦會(huì)進(jìn)行進(jìn)一步的解讀,讓他們能夠識(shí)別圖像的多個(gè)部分,看到兩張臉,又或者看到一個(gè)花瓶。
但對(duì)于機(jī)器來(lái)說(shuō),這樣的圖像是非常難以理解的?;镜?a class="innerlink" href="http://ihrv.cn/tags/分類器" title="分類器" target="_blank">分類器分辨不了兩張臉和花瓶,它看到的會(huì)是諸如短柄斧、吊鉤、避彈衣甚至吉他的物體。該系統(tǒng)并不能確定那些物體是在該圖像當(dāng)中,這說(shuō)明這類圖像的識(shí)別對(duì)于機(jī)器而言極具挑戰(zhàn)性。
另外,正如復(fù)雜的圖像,現(xiàn)實(shí)世界也十分凌亂。在當(dāng)中正常航行可不是光開(kāi)發(fā)算法分析數(shù)據(jù)就能夠?qū)崿F(xiàn)的,它需要對(duì)真實(shí)場(chǎng)景有清楚的了解,進(jìn)而能夠相應(yīng)作出行動(dòng)。
機(jī)器人和無(wú)人機(jī)面臨著大量這樣的障礙,克服這些挑戰(zhàn)對(duì)于參與人工智能革命的人來(lái)說(shuō)便是重中之重。
隨著神經(jīng)網(wǎng)絡(luò)、專門(mén)的機(jī)器視覺(jué)硬件等技術(shù)的持續(xù)普及,機(jī)器視覺(jué)和人類視覺(jué)之間的鴻溝正在快速縮小。不久之后,甚至可能會(huì)出現(xiàn)視覺(jué)能力更勝人類的機(jī)器人,它們能夠執(zhí)行各類錯(cuò)綜復(fù)雜的任務(wù),能夠完全自動(dòng)化地運(yùn)作。