吳甘沙
馭勢(shì)科技聯(lián)合創(chuàng)始人、董事長(zhǎng)兼CEO
4月17日下午,湛廬特別邀請(qǐng)圣塔菲研究所客座教授、《AI 3.0》一書作者梅拉妮·米歇爾,中國(guó)科學(xué)院自動(dòng)化研究所復(fù)雜系統(tǒng)管理與控制國(guó)家重點(diǎn)實(shí)驗(yàn)室主任王飛躍,馭勢(shì)科技聯(lián)合創(chuàng)始人、董事長(zhǎng)兼CEO吳甘沙,清華大學(xué)計(jì)算機(jī)系副教授、智源青年科學(xué)家劉知遠(yuǎn)等國(guó)內(nèi)外知名科學(xué)家和創(chuàng)業(yè)者,以及特別嘉賓達(dá)闥云端機(jī)器人小姜,一起探討AI 3.0時(shí)代的新商機(jī)和新生態(tài)。
這次全智能場(chǎng)景發(fā)布會(huì)第一次采用了演播室和戶外智能場(chǎng)景雙現(xiàn)場(chǎng)形式,在無(wú)人駕駛汽車和云端智能機(jī)器人的烘托下,全面展示了中國(guó)人工智能領(lǐng)域的創(chuàng)新實(shí)力和前沿進(jìn)展。幾位科學(xué)家、企業(yè)家跨界深度交流,共同探討了人工智能發(fā)展現(xiàn)狀,以及透視當(dāng)下AI發(fā)展的關(guān)鍵問(wèn)題,并對(duì)產(chǎn)業(yè)布局和政策提出了可供參考的建議,助力未來(lái)的想象與開創(chuàng)。
以下為馭勢(shì)科技聯(lián)合創(chuàng)始人、董事長(zhǎng)兼CEO吳甘沙的演講精華內(nèi)容
1、無(wú)人駕駛是人工智能頂上的皇冠
在科學(xué)技術(shù)飛速發(fā)展的今天,人工智能被廣泛應(yīng)用在多個(gè)尖端領(lǐng)域,比如無(wú)人駕駛、生命科學(xué)探索及醫(yī)藥制造等。除了商業(yè)應(yīng)用,人工智能還創(chuàng)造了打敗排名世界第一的人類棋手柯潔的輝煌戰(zhàn)績(jī)。在所有這些任務(wù)中,自動(dòng)駕駛被譽(yù)為人工智能頂上的皇冠,這是為什么呢?在吳甘沙老師看來(lái),無(wú)人駕駛獲得這一贊譽(yù)的關(guān)鍵在于mission critical AI。
那么什么是mission critical AI呢?通俗來(lái)講,就是關(guān)鍵任務(wù)人工智能。它與我們通常所說(shuō)的人工智能的差別主要在于準(zhǔn)確率。在傳統(tǒng)的人臉識(shí)別技術(shù)中,我們說(shuō)其準(zhǔn)確率為92%或95%,事實(shí)上,兩者之間并沒(méi)有多大區(qū)別。而在自動(dòng)駕駛這樣的關(guān)鍵任務(wù)中,我們需要確保其準(zhǔn)確率達(dá)到100%,或者說(shuō)無(wú)限接近100%。這就好比我們給出了100萬(wàn)張不同的試卷,由人工智能來(lái)答,它只能有一張?jiān)嚲砩铣鲥e(cuò),其他都必須得滿分。
就目前投入應(yīng)用的無(wú)人駕駛技術(shù)而言,它所搭載的人工智能實(shí)現(xiàn)的是一個(gè)非常簡(jiǎn)單的閉環(huán),這個(gè)閉環(huán)主要包括五個(gè)部分。第一個(gè)部分是感知,而這個(gè)感知是通過(guò)傳感器來(lái)實(shí)現(xiàn)的。這些傳感器能幫助車輛“眼觀六路、耳聽八方”。第二個(gè)部分是認(rèn)知,用于幫助車輛判斷周圍物體的運(yùn)動(dòng),識(shí)別道路標(biāo)志等。第三個(gè)部分是車輛導(dǎo)航和定位,導(dǎo)航是知道車輛往哪里去,定位是明確車輛在哪里。而目前無(wú)人駕駛采用的定位技術(shù)誤差只有幾厘米。第四個(gè)部分是決策和規(guī)劃,主要是車輛的中央處理器根據(jù)車輛周圍的情況確定下一步的動(dòng)作。第五個(gè)部分是控制,就是將中央處理器的指令轉(zhuǎn)變?yōu)榭刂栖囕v底盤的動(dòng)作。
2、今天的無(wú)人駕駛建立在笨鳥式的人工智能之上
無(wú)人駕駛的前景非常吸引人,但就當(dāng)前的發(fā)展情況而言,實(shí)現(xiàn)的難度非常大。目前的人工智能,吳甘沙老師稱其為笨鳥式人工智能,因?yàn)樗峭ㄟ^(guò)大量的數(shù)據(jù),通過(guò)蠻力式的計(jì)算,通過(guò)歷史的記憶,比如高精地圖,整合形成的。車輛需要將沿路的道路記憶輸入進(jìn)去,其中還會(huì)遇到數(shù)據(jù)不全或算力不足等問(wèn)題,這種情況下,人們就必須做出取舍,通過(guò)設(shè)計(jì)大量冗余去彌補(bǔ)單個(gè)部件的不可靠性。
就現(xiàn)在汽車安裝的傳感器來(lái)說(shuō),有基于激光的,有基于攝像頭的,有基于毫米波雷達(dá)的,有基于超聲波的。這些傳感器每一種都有其優(yōu)缺點(diǎn),在應(yīng)用過(guò)程中,我們需要對(duì)其進(jìn)行組合。而這種組合跟我們追求的終極的人工智能是有很大差別的。
所謂的笨鳥式人工智能,意味著要在現(xiàn)有基礎(chǔ)上實(shí)現(xiàn)非常可靠的無(wú)人駕駛,需要積累幾十億公里的數(shù)據(jù)。目前,谷歌的無(wú)人駕駛汽車積累的數(shù)據(jù)也不過(guò)幾千萬(wàn)公里。而幾十億公里,相當(dāng)于一個(gè)人類司機(jī)幾百萬(wàn)年的駕齡。
很多人通常認(rèn)為無(wú)人駕駛?cè)斯ぶ悄芤呀?jīng)得到了大規(guī)模應(yīng)用,而實(shí)際情況是我們的科學(xué)家和制造者還在研究開發(fā)的過(guò)程中,目前的人工智能和我們理想中的職能還有很大的差距。我們都傾向于稱目前階段的、仍有許多局限的人工智能為專用人工智能或領(lǐng)域人工智能,即AI2.0,與其相對(duì)的則是通用人工智能,即AI3.0。AI3.0是人工智能未來(lái)發(fā)展的必然趨勢(shì),而這也是梅拉妮·米歇爾在《AI3.0》這本書中重點(diǎn)介紹的。
今天的無(wú)人駕駛在識(shí)別一輛車時(shí),是靠著大量的勞動(dòng)力對(duì)后臺(tái)數(shù)據(jù)一一進(jìn)行標(biāo)注實(shí)現(xiàn)的,可以說(shuō),沒(méi)有人工就沒(méi)有智能?!禔I3.0》中描述了一個(gè)場(chǎng)景,是一個(gè)推著嬰兒車的孕婦牽著一條狗出現(xiàn)在路邊。當(dāng)人類看到這個(gè)場(chǎng)景時(shí),我們可能產(chǎn)生無(wú)數(shù)種解讀,比如通過(guò)孕婦的表情去判斷,她臉上的表情是驚詫還是平靜;比如觀察孕婦周圍有沒(méi)有人,這個(gè)人有沒(méi)有可能對(duì)她們采取下一步動(dòng)作。人類,即使是小孩都可以輕松對(duì)這一場(chǎng)景進(jìn)行準(zhǔn)確、迅速的判斷,但對(duì)人工智能來(lái)說(shuō)就很難。
解讀這一場(chǎng)景實(shí)際上需要大量的認(rèn)知技能,比如解讀人與人之間的眼神交流或是博弈關(guān)系。在目前的人工智能中,我們是需要對(duì)機(jī)器捕捉到的圖片進(jìn)行標(biāo)注,來(lái)告訴人工智能圖片中包含哪些信息的。想要讓機(jī)器看到這樣的場(chǎng)景就自動(dòng)產(chǎn)生正確的解讀,實(shí)際是需要下一代更通用的人工智能去解決的問(wèn)題。
在無(wú)人駕駛?cè)斯ぶ悄馨l(fā)展的當(dāng)下,我國(guó)的發(fā)展速度與國(guó)外尤其是美國(guó)相比是不算太晚的。而在算法能力方面,兩者間也不存在代際的差別,相反,我們還具備一些國(guó)外沒(méi)有的優(yōu)勢(shì)。目前應(yīng)用的人工智能2.0,是由應(yīng)用驅(qū)動(dòng)、需求驅(qū)動(dòng)和場(chǎng)景驅(qū)動(dòng)的。在這些方面,我國(guó)具有得天獨(dú)厚的優(yōu)勢(shì)。
梅拉妮在《AI3.0》中講到,無(wú)人駕駛?cè)斯ぶ悄艿陌l(fā)展過(guò)程可以分為0~5級(jí),共計(jì)6個(gè)階段。就技術(shù)發(fā)展而言,國(guó)內(nèi)的無(wú)人駕駛處在4級(jí),嚴(yán)格來(lái)講,4級(jí)的標(biāo)準(zhǔn)是完全脫離司機(jī)的操控,但因?yàn)橄嚓P(guān)法律法規(guī)的限定,我們現(xiàn)在都需要在車上配備安全員。特斯拉的auto pilot(自動(dòng)駕駛)功能則屬于2級(jí),其本質(zhì)上是一種輔助駕駛,主要功能是幫助司機(jī)減負(fù),實(shí)際的責(zé)任人還是司機(jī)本身。而3級(jí)則意味著責(zé)任人由司機(jī)轉(zhuǎn)變?yōu)轳{駛系統(tǒng),這個(gè)系統(tǒng)可以在它完整的能力覆蓋范圍內(nèi)自動(dòng)駕駛,在必要時(shí)尋求司機(jī)的干預(yù)。再繼續(xù)往上看,就到了5級(jí),當(dāng)前的科學(xué)家普遍認(rèn)為5級(jí)是一個(gè)可望而不可及的目標(biāo),需要借助AI3.0,即通用的人工智能才能實(shí)現(xiàn),它可以實(shí)現(xiàn)的場(chǎng)景是“隨叫隨到”。
3、實(shí)現(xiàn)真正的無(wú)人駕駛,我們要從AI2.0跨入AI3.0
在無(wú)人駕駛領(lǐng)域,除了數(shù)據(jù)積累以外,人們遇到的難題還有很多,其中一些是可解的,比如它的發(fā)展受限于木桶效應(yīng);另一些則是很難解的,比如“9010原則”。梅拉妮在《AI3.0》中解釋說(shuō),“9010原則”是指無(wú)人駕駛實(shí)際上已經(jīng)走完了90%的道路,但是剩下10%的道路還需要我們花費(fèi)90%的時(shí)間和努力。
想要破解無(wú)人駕駛?cè)斯ぶ悄芪磥?lái)發(fā)展的種種難題,關(guān)鍵在于我們對(duì)人的認(rèn)知及在相關(guān)科學(xué)理論方面能否取得突破。那為什么是對(duì)人的認(rèn)知的突破呢?因?yàn)閺谋举|(zhì)上講,我們對(duì)人腦的工作機(jī)制還不甚了解?;蛟S,我們?cè)谀X科學(xué)、認(rèn)知科學(xué)方面取得的進(jìn)展,才是促進(jìn)通用人工智能發(fā)展的密鑰。
在《AI3.0》中,梅拉妮將現(xiàn)在人們關(guān)心的人工智能領(lǐng)域的各個(gè)熱門領(lǐng)域進(jìn)行了清晰的梳理,比如無(wú)人駕駛、機(jī)器學(xué)習(xí)、視覺(jué)識(shí)別等,它明確地指出了人工智能目前的發(fā)展階段,還暢想了未來(lái)人工智能領(lǐng)域即將發(fā)生的巨變。對(duì)于想要了解人工智能行業(yè)的大眾讀者和相關(guān)領(lǐng)域的創(chuàng)業(yè)者和管理者而言,《AI3.0》超越了一般圖書,能為他們提供極具權(quán)威性、專業(yè)性、前沿性和啟發(fā)性的知識(shí)與見解。
第三波人工智能的爆發(fā)即將來(lái)臨,未來(lái)世界的潮水會(huì)涌向哪里?《AI3.0》,立足前沿,深度思考,超脫技術(shù),是每一個(gè)渴望摸準(zhǔn)時(shí)代的脈搏、站立潮頭的現(xiàn)代人都不能錯(cuò)過(guò)的新銳之作。