《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 阿里達(dá)摩院王剛:數(shù)據(jù)驅(qū)動(dòng)是解決無(wú)人駕駛難題的關(guān)鍵技術(shù)路徑

阿里達(dá)摩院王剛:數(shù)據(jù)驅(qū)動(dòng)是解決無(wú)人駕駛難題的關(guān)鍵技術(shù)路徑

2021-11-17
來(lái)源:麻省理工科技評(píng)論

10 月 28 日至 29 日,由杭州未來(lái)科技城(海創(chuàng)園)管委會(huì)指導(dǎo),DeepTech 主辦的世界科技青年論壇暨 “35 歲以下科技創(chuàng)新 35 人”(TR35)全球-亞太區(qū)線下發(fā)布儀式,在杭州未來(lái)科技城成功舉辦。

在 TR35 全球-亞太區(qū)線下發(fā)布儀式現(xiàn)場(chǎng),一眾頂尖科學(xué)家、青年科技人才、科技創(chuàng)業(yè)人士對(duì)世界科技前沿技術(shù)和熱點(diǎn)問(wèn)題進(jìn)行了探討、交流。

阿里巴巴集團(tuán)副總裁、達(dá)摩院自動(dòng)駕駛實(shí)驗(yàn)室負(fù)責(zé)人王剛以《無(wú)人駕駛從技術(shù)到產(chǎn)品再?gòu)漠a(chǎn)品到技術(shù)》為主題,分享了他對(duì)無(wú)人駕駛的看法。一般來(lái)說(shuō),人們對(duì)技術(shù)到產(chǎn)品的流程非常熟悉,但是從產(chǎn)品到技術(shù)卻不是很了解,此次分享,王剛便為大家詳細(xì)闡述了其中的邏輯區(qū)別。

64ed-897dc370ae0da943046886e7d8877693.jpg

圖 | 阿里巴巴集團(tuán)副總裁、達(dá)摩院自動(dòng)駕駛實(shí)驗(yàn)室負(fù)責(zé)人王剛

瞄準(zhǔn)末端無(wú)人駕駛,服務(wù) “最后三公里” 需求

在大家的普遍認(rèn)知里,無(wú)人駕駛或許離我們還很遙遠(yuǎn),但事實(shí)上,末端無(wú)人駕駛市場(chǎng)卻大有可為。

王剛指出,阿里達(dá)摩院致力于解決 “最后三公里” 的包裹配送需求,瞄準(zhǔn)的市場(chǎng)正是末端無(wú)人駕駛,并在規(guī)?;彤a(chǎn)品化方面取得極大進(jìn)展。目前,達(dá)摩院已經(jīng)在全國(guó) 22 個(gè)省和 71 個(gè)城市開(kāi)展了常態(tài)化物流服務(wù),累計(jì)服務(wù)接近 200 多個(gè)大學(xué)校園和社區(qū),配送單量超過(guò)一百萬(wàn)單。

當(dāng)然,相比于快遞市場(chǎng)或者對(duì)物流市場(chǎng)來(lái)講,這樣的數(shù)字并不值一提,但就無(wú)人駕駛領(lǐng)域而言,這個(gè)數(shù)字已經(jīng)實(shí)現(xiàn)了一個(gè)極大的突破,客觀上也佐證了達(dá)摩院的產(chǎn)品化能力。目前,該產(chǎn)品已輻射了全國(guó)大部分地取,東北到哈爾濱、南到廣州、西到成都,產(chǎn)品穩(wěn)定性值得肯定。

話(huà)題回歸到無(wú)人駕駛,王剛指出,目前我們針對(duì)的只是末端 “最后三公里” 的場(chǎng)景,而作為無(wú)人駕駛領(lǐng)域的從業(yè)者,其實(shí)每個(gè)人最想解決的是 “所有場(chǎng)景里都能夠自動(dòng)駕駛” 的難題。

王剛表示,“我覺(jué)得前面做的一切事情,包括產(chǎn)品化和規(guī)?;?,都是幫助我們從技術(shù)路徑上實(shí)現(xiàn)目標(biāo),所以我們做末端三公里并不只是一個(gè)業(yè)務(wù)決策,更多的是技術(shù)決策?!?/p>

從數(shù)據(jù)里找規(guī)律,重新定義無(wú)人駕駛技術(shù)路徑

縱觀過(guò)去幾十年人工智能的發(fā)展,幾乎所有成功的經(jīng)驗(yàn)都是基于統(tǒng)計(jì)學(xué)習(xí)。而統(tǒng)計(jì)學(xué)習(xí)的本質(zhì)就是從數(shù)據(jù)里面找到規(guī)律,如果沒(méi)有數(shù)據(jù),再聰明的科學(xué)家也很難找到辦法讓機(jī)器變得更聰明。

在王剛看來(lái),數(shù)據(jù)驅(qū)動(dòng)無(wú)疑是解決無(wú)人駕駛目前問(wèn)題的最佳技術(shù)路徑之一。

基于這樣的認(rèn)識(shí)和了解,王剛提出,在當(dāng)前條件下無(wú)人駕駛需要解決兩個(gè)問(wèn)題:一是如何獲取海量數(shù)據(jù);二是如何利用數(shù)據(jù)。

那么我們?cè)撊绾潍@取海量數(shù)據(jù)呢?

據(jù)王剛介紹,其在三年前確定業(yè)務(wù)和技術(shù)方向的時(shí)候,就考慮過(guò)是否學(xué)習(xí)谷歌依靠測(cè)試車(chē)解決 robot taxi 問(wèn)題。但由于交通場(chǎng)景的復(fù)雜性,測(cè)試數(shù)據(jù)和場(chǎng)景都顯得過(guò)于片面,最終放棄了這個(gè)想法。

接下來(lái),王剛想到先通過(guò)垂直場(chǎng)景解決業(yè)務(wù)問(wèn)題,再利用其產(chǎn)生的價(jià)值去推動(dòng)汽車(chē)規(guī)?;?,從而推動(dòng)更多車(chē)輛的部署,當(dāng)有更多車(chē)輛部署的時(shí)候,數(shù)據(jù)的采集就變成了一件自然而然的事,進(jìn)而推進(jìn)技術(shù)發(fā)展。

“時(shí)至今日,經(jīng)過(guò)不斷的技術(shù)研發(fā)和產(chǎn)品化、規(guī)?;膶?shí)驗(yàn),我們初步看到了曙光,在未來(lái)幾年的技術(shù)發(fā)展里,我們會(huì)從傳統(tǒng)的路測(cè)驅(qū)動(dòng)走向產(chǎn)品驅(qū)動(dòng),即從產(chǎn)品再到技術(shù)。” 王剛表示。

阿里達(dá)摩院計(jì)劃在兩到三年內(nèi)部署一萬(wàn)輛車(chē)的規(guī)模,覆蓋中國(guó)所有的大學(xué)還有大型的園區(qū)、社區(qū),并將今天的累計(jì)一百萬(wàn)訂單發(fā)展成每天配送一百萬(wàn)訂單。王剛表示,這一百萬(wàn)訂單的背后會(huì)積累非常多有意思,對(duì)技術(shù)帶來(lái)非常大改變的數(shù)據(jù)。比如末端場(chǎng)景中經(jīng)常出現(xiàn)的行人、非機(jī)動(dòng)車(chē)等,相比更容易檢測(cè)、預(yù)測(cè)的卡車(chē)和轎車(chē),這類(lèi)交通參與者才是無(wú)人駕駛里面最頭痛的問(wèn)題。

而在達(dá)摩院構(gòu)建的場(chǎng)景下,一輛車(chē)日均可檢測(cè) 4000 萬(wàn)個(gè)障礙物,每天與行人和非機(jī)動(dòng)車(chē)進(jìn)行超過(guò) 5000 次的交互。隨著更多的車(chē)輛被部署后,其產(chǎn)生的數(shù)據(jù)將是難以想象的。

獲取數(shù)據(jù)之后,最重要的節(jié)點(diǎn)就是掌握利用數(shù)據(jù)的方法。

王剛表示,“數(shù)據(jù)是一個(gè)石油,但是怎么樣提煉出來(lái)是另外一個(gè)同樣重要的問(wèn)題。” 而實(shí)現(xiàn)這樣的人工智能無(wú)外乎三個(gè)方向。

第一個(gè)方向是學(xué)習(xí)人腦。不過(guò)王剛也表示,人腦是非常復(fù)雜的結(jié)構(gòu),很難做到徹底了解,因此不宜在這個(gè)方向投入太多的資源。第二個(gè)方向是自動(dòng)化學(xué)習(xí),即通過(guò)仿真虛擬化場(chǎng)景提高人工智能能力,而不過(guò)度依賴(lài)人工的經(jīng)驗(yàn)和能力。第三個(gè)方向是小樣本學(xué)習(xí)能力,同樣受人的啟發(fā)。

達(dá)摩院自動(dòng)駕駛實(shí)驗(yàn)室在自動(dòng)化學(xué)習(xí)上做了很多努力,且擁有了獨(dú)屬于自身的差異化競(jìng)爭(zhēng)優(yōu)勢(shì),分別表現(xiàn)在硬件和工程上。王剛說(shuō)道,“比如我們做了無(wú)人駕駛?cè)溌返淖詣?dòng)化學(xué)習(xí),包括最困難的決策規(guī)劃、控制以及定位,而不僅僅是常見(jiàn)的感知和圖象識(shí)別,這就是我們工程上的差異化?!?/p>

將智能仿真和強(qiáng)化學(xué)習(xí)相結(jié)合

那么如何將智能仿真和強(qiáng)化學(xué)習(xí)結(jié)合在一起呢?

王剛表示,谷歌作為世界上最好的 AI 公司之一,其實(shí)已經(jīng)做了類(lèi)似的探索,那就是阿爾法圍棋(AlphaGo)。作為第一個(gè)戰(zhàn)勝?lài)迨澜绻谲姷娜斯ぶ悄軝C(jī)器人,AlphaGo 由谷歌旗下 DeepMind 公司戴密斯·哈薩比斯(Demis Hassabis)領(lǐng)銜的團(tuán)隊(duì)開(kāi)發(fā),其主要工作原理正是 “深度學(xué)習(xí)”。

但之所以這樣的方法沒(méi)有大規(guī)模應(yīng)用在機(jī)器人和無(wú)人駕駛領(lǐng)域,在于其中仍有迫切需要解決的問(wèn)題。

首先是如何仿真場(chǎng)景,因?yàn)樵趪孱I(lǐng)域,仿真是非常容易的,把棋盤(pán)畫(huà)出來(lái)就可以了,而無(wú)人駕駛卻需要構(gòu)造交通場(chǎng)景,這就需要工程上的投入。

其次,從算法上來(lái)講 AlphaGo 是離散空間,而無(wú)人駕駛場(chǎng)景卻是連續(xù)空間,所以達(dá)摩院也研發(fā)出了基于連續(xù)空間的蒙特卡洛樹(shù)搜索算法,從而讓該方法在連續(xù)空間里同樣得以實(shí)現(xiàn)。

在王剛看來(lái),積累數(shù)據(jù)和用好數(shù)據(jù)都是為了去更好地解決自動(dòng)駕駛問(wèn)題。他表示,“目前我們已經(jīng)基本解決了末端的低速問(wèn)題,不僅能滿(mǎn)足業(yè)務(wù)需求,還極大地降低了成本。在未來(lái),我和團(tuán)隊(duì)將圍繞更泛化的場(chǎng)景做進(jìn)一步的研發(fā),并基于當(dāng)前的經(jīng)驗(yàn)以及數(shù)據(jù)去攻克更大的挑戰(zhàn)?!?/p>

最后文章空三行圖片.jpg


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà):010-82306118;郵箱:aet@chinaaet.com。