與其他駕駛公司不同,特斯拉售出的所有車都是數(shù)據(jù)收割機,能夠形成大體量的數(shù)據(jù)集。特斯拉采用模仿學習的機器學習技術,且認為在提供足夠多的數(shù)據(jù)的情況下自己能夠成功訓練出表現(xiàn)出色的自動駕駛技術。特斯拉正在通過一系列工作搭建自身的訓練流程,它在自動駕駛上的發(fā)展手段有可能會在某時間點實現(xiàn)瞬間的技術突破從而給汽車行業(yè)的發(fā)展帶來顛覆性影響。
2018 年 11 月,國外科技媒體 The Information 曝料,稱特斯拉使用的是名為「模仿學習」(imitaTIon learning)的機器學習技術:
「與其他自動駕駛公司不同,特斯拉售出的所有車都是數(shù)據(jù)收割機,即使 Autopilot 處于關閉狀態(tài),車輛傳感器也能照常工作。
因此,Autopilot 團隊手中有用不完的數(shù)據(jù),他們能從中發(fā)現(xiàn)人類駕駛員在不同場景下的駕駛方式,并對其進行模仿。
在取其精華,去其糟粕后,這部分信息就成了車輛在特定場景下行駛的輔助附加因素,它們能教會車輛如何轉彎或躲避障礙物?!?/p>
The InformaTIon 在文中轉述了那些模仿學習「信徒」的理念:特斯拉工程師相信,只要給神經(jīng)網(wǎng)絡灌入足夠多的駕駛數(shù)據(jù),就能讓 Autopilot 學會大多數(shù)情況下的轉向、剎車和加速操控。
他們甚至認為,未來連代碼都不用寫了,在特定場景下,自動駕駛系統(tǒng)就知道該怎么做。
這些工程師并不是盲目樂觀,因為他們提出這些觀點幾個月后,谷歌旗下的 DeepMind 就用模仿學習讓 AI 成了《星際爭霸》頂級高手。
而在此前,這款游戲是 AI「修仙」路上的一座高峰。
就連 Google Brain(谷歌 X 實驗室重要項目)機器學習工程師 Alex Irpan 都為此感到吃驚:
「我們一直覺得這種長期任務是模仿學習的死穴,此前我甚至認為它根本玩不轉《星際爭霸》,誰知道結果如此出人意料。我們的擔憂在于,如果 AI 犯了錯,它會發(fā)現(xiàn)自己處于沒有人類習慣可模仿的尷尬境地。」
Irpan 推測認為,只要數(shù)據(jù)量夠了,DeepMind 的 AI 就能成功跨過這個坎:
「如果你的數(shù)據(jù)集非常大,囊括了不同級別的技巧,比如將所有玩過《星際爭霸》的玩家操作都記錄在內(nèi),那么你的數(shù)據(jù)就足夠讓 AI 學會如何在作出錯誤判斷后成功翻盤了?!?/p>
在今年 4 月特斯拉的 Autonomy Day 發(fā)布會上,特斯拉 AI 主管 Andrej Karpathy 親口證實了模仿學習的存在。
事實上,他還透露稱,模仿學習已經(jīng)在一定程度上用到了量產(chǎn)版的 Autopilot 上。
Karpathy 還堅信,當下靠手工編碼的任務,未來靠模仿學習會更加出色。
顯然,如果一切順利,特斯拉也能像 DeepMind 一樣在自動駕駛行業(yè)橫掃一切。
更重要的是,業(yè)內(nèi)根本沒有什么競爭對手。
因為除了特斯拉,誰也沒有 60 萬輛在路上勤勞采集數(shù)據(jù)的車輛,而這些車輛每天在各種路況下能累積 2000 萬英里的行駛里程。
即使強如 Waymo,手上也沒有如此體量的數(shù)據(jù)集,因為 Waymo 的測試車保有量只有特斯拉車隊的 0.1%。
怎樣拿到真正有價值的數(shù)據(jù)?
雖然能采集數(shù)據(jù)的車輛眾多,但想從這些隨機上傳的數(shù)據(jù)中找到有用的部分并不容易。因此,特斯拉需要找到捕捉各種不同駕駛習慣的新方式。
對大多數(shù)公司來說,手動采集是最直接的方式。
特斯拉工程師可以在系統(tǒng)中植入上傳觸發(fā)器,只要某些數(shù)據(jù)符合要求,就會自動保存并上傳,比如無保護左轉。
他們也確實這么做了:當車輛的視覺神經(jīng)網(wǎng)絡探測到了交通信號燈,或駕駛員向左打了方向盤,車輛就會記錄下這個片段,隨后通過 Wi-Fi 回傳。
不過,那些工程師們想不到的行為怎么辦?如果神經(jīng)網(wǎng)絡犯了錯誤怎么辦?
在這樣的情況下,Autopilot 的介入是最理想的觸發(fā)器。Musk 表示,特斯拉的方法是「將這一切看作錯誤的輸入」。
如果 Autopilot 的介入被視為錯誤,那么隨后人類駕駛員的動作就是正確行為最好的示范。
這樣一來,Autopilot 的介入就能持續(xù)提供有用的訓練數(shù)據(jù)了。
當然,在駕駛員操作模式下我們也能采集訓練數(shù)據(jù)。為此,特斯拉專門設計了一個「影子模式」。
The InformaTIon 在文章中對其進行了一番描述:
業(yè)內(nèi)也有不少評價,認為特斯拉所謂「影子模式」對新 Autopilot 軟件的開發(fā)價值不大,畢竟特斯拉本來就能在不影響車輛行駛的情況下運行各種測試軟件。
Autopilot 的工程師完全可以拿測試軟件的表現(xiàn)與車輛實際表現(xiàn)進行對比。在「影子模式」下,Autopilot 團隊則能對人類與 Autopilot 在相同場景下的反應進行對比。
用模仿學習訓練的神經(jīng)網(wǎng)絡可以在車載計算機上被動運行,同時輸出它眼中的最佳選擇。如果人類駕駛員有不同反應,就能觸發(fā)這個片段的數(shù)據(jù)上傳。
一旦出現(xiàn)「意見相左」,神經(jīng)網(wǎng)絡的抉擇就會被判錯,而駕駛員的操作則成為正確示范。
除了在人與計算機意見相左時保存數(shù)據(jù),特斯拉還能在神經(jīng)網(wǎng)絡「懷疑」自己時保存數(shù)據(jù)。
當下,市場上已經(jīng)有了不少試圖量化神經(jīng)網(wǎng)絡不確定性的技術,當這個數(shù)值超過某個閥值,就會觸發(fā)數(shù)據(jù)的保存和上傳。
因此,從廣義上來講,特斯拉共有三種采集有價值數(shù)據(jù)的方法:
手動設定觸發(fā)器;
Autopilot 介入;
被動運行的神經(jīng)網(wǎng)絡,如「影子模式」。
鑒于特斯拉的硬盤每天都能接收 2000 萬英里數(shù)據(jù),因此想采集大型數(shù)據(jù)集(包括不同的駕駛習慣和糾錯示范)并不難。
不過,對 Waymo 這樣兩年才跑 2000 萬英里的公司來說,這種方案不太實際了。
如果 DeepMind 手上只有數(shù)百個玩家的數(shù)據(jù),它的 AI 還能制霸《星際爭霸》嗎?
恐怕沒有希望。
這并不是小看他們,現(xiàn)實是當下的神經(jīng)網(wǎng)絡對數(shù)據(jù)的胃口實在是太大了。
對人來說,一個小時內(nèi)學會玩《星際爭霸》并非難事,但想在同樣時間內(nèi)訓練出同樣水平的神經(jīng)網(wǎng)絡,就得有數(shù)百萬甚至上億個千變?nèi)f化的例子打基礎。
同樣的,即使神經(jīng)網(wǎng)絡能從龐大的駕駛數(shù)據(jù)中學到一些駕駛的精髓,想與人類媲美也得將錯誤率拉低到 0.1% 以下。
鑒于邊際效益會隨著數(shù)據(jù)的增多而遞減,因此,只有真正海量的數(shù)據(jù)庫才能解決問題。
不過,海量的數(shù)據(jù)庫不是我們想搭就能搭起來的。舉例來說,如果我們想要 1 萬個極端情況的示例,前提是得累計 100 億英里的行駛里程。
對特斯拉來說,是有希望實現(xiàn)的。因為隨著新車的持續(xù)交付,未來 17 個月就能搞定 100 億英里。
而 Waymo 現(xiàn)在的車隊規(guī)模,實現(xiàn)這一目標得 800 年。
這就是特斯拉的自動駕駛解決之道:
對那些無法人工編碼的駕駛任務進行模仿學習,配合計算視覺與行為預測的深度學習,以及那個無所不包的海量數(shù)據(jù)集。
一日千里的進步切合實際嗎?
Musk 相信,特斯拉將在 2020 年底解決全自動駕駛問題。不過,業(yè)界普遍認為 Musk 定的時間點有些激進。
在他們看來,自動駕駛技術的開發(fā)是人工處理的過程。
按照這種理解,開發(fā)自動駕駛軟件需要工程師不斷對代碼進行修改,因此人的速度就是天花板,即使添加更多工程師也快不了多少。
但現(xiàn)在還是這種思路嗎?
DeepMind 為了攻克《星際爭霸》,花了三年時間研究。不過,用上了模仿學習后,將 AI 訓練到人類級別只用了三天。
為什么能這么快?
因為訓練流程已經(jīng)能自己寫出《星際爭霸》的對戰(zhàn)代碼,而前三年人類的工作主要是為了標定這個訓練流程,特別是神經(jīng)網(wǎng)絡架構和數(shù)據(jù)集。
火箭工程師們走的也是這個路子,火箭前期的設計與建造會花費他們大量時間,幾年之內(nèi)甚至一點成功都見不到。
不過,當萬事俱備,十秒鐘的倒計時后就能見證奇跡。從時間的維度看,前幾年毫無作為,最后幾秒突然爆發(fā)。
事實上,研究和工程的進展都被隱藏在了幕后。
顯然,現(xiàn)在的特斯拉正在通過一系列工作搭建自己的訓練流程。
舉例來說,特斯拉全新的計算硬件還沒火力全開,為新硬件設計的神經(jīng)網(wǎng)絡也還在開發(fā)與測試中,他們正在為未來積聚力量。
至于今年 4 月展示的那版全自動駕駛軟件,據(jù)說只是三個月神經(jīng)網(wǎng)絡訓練的結果,軟件開發(fā)對應的場景也相當單一。
而就在一年之前,特斯拉才剛剛掌握高速上的車道保持功能,當時特斯拉還推了一個 OTA 升級包修復了車輛在車道線間反復搖擺的漏洞。
Karpathy 指出,那次的升級,特斯拉「重寫了很多東西」。從那時起,Karpathy 的團隊和 Autopilot 部門的其他技術專家們一直在為 Autopilot 打地基,特別是計算視覺。
如果特斯拉不推送升級包,公眾就看不到他們努力的結果。
至于一些城市駕駛功能是否適合部署,則純粹是二進制而非增量問題,最終一切都得由特斯拉來決斷,外部是根本看不到其中的漸進發(fā)展過程的。
自動駕駛經(jīng)濟模型
全自動駕駛汽車,不但能徹底顛覆 Uber、滴滴、Lyft 與傳統(tǒng)出租車公司苦心建造的王朝,還能讓傳統(tǒng)的私人擁車制分崩離析。
美國汽車協(xié)會的數(shù)據(jù)顯示,購買并使用一輛新車,每英里平均要花掉 0.62 美元。而投資機構 ARK 預計,自動駕駛出租車的生產(chǎn)與運營成本僅為 0.26 美元/英里。
如果套用 ARK 的經(jīng)濟模型:
「只要自動駕駛出租車公司將價格定在 0.45 美元/英里,比小型轎車稍低(擁車成本為 0.47 美元/英里),那么自動駕駛出租車每英里依然能盈利 0.19 美元。
假設一輛車每年運營 12.7 萬英里(幾乎是當下傳統(tǒng)出租車運營里程的 1.8 倍),每英里收費 0.45 美元,一年利潤就有 2.62 萬美元。
如果有 100 萬輛這樣的自動駕駛出租車,就意味著能每年凈賺 262 億美元?!?/p>
但別被 100 萬輛車嚇住了,這個數(shù)量級的出租車根本不夠用:
假設用戶的出行需求維持在當下的水平,每輛自動駕駛出租車就能代替 8-9 輛常規(guī)汽車(平均每年行駛 1.35 萬英里)。鑒于全球常規(guī)乘用車保有量約為 10 億輛,因此自動駕駛出租車必須有 1.1 億-1.25 億輛才夠用。
所以,自動駕駛行業(yè)的成長空間還很大。
不過,ARK 投資的模型中有些假設需要進行調(diào)整。
比如它將自動駕駛出租車的造價定在了 5 萬美元一輛,這可比現(xiàn)在最便宜的 Model 3(3.9 萬美元)要貴上不少。
即使 Model 3 毛利只有 5%,也能從造價中再減掉 2000 美元。對特斯拉 Network 來說,這才是更合理的數(shù)字。
對自動駕駛出租車年運營里程的假設,它應該和 Uber 與傳統(tǒng)出租車差不多,即一年 7 萬英里。
需要注意的是,即使是自動駕駛汽車,也會有空駛時間。
按 Uber 的水平看,車上有乘客的時間占到車輛運營總時間的 64%。
也就是說,每年單輛車凈利潤 4200 美元才更合理,100 萬輛自動駕駛出租車則能凈賺 42 億美元。
當然,毛利與價格是緊密掛鉤的,而 0.45 美元/英里的定價已經(jīng)相當?shù)土?。如前所述,私家乘用車平均每英里要的價格是 0.62 美元。
如果打車費用定在 0.6 美元/英里,相同的特斯拉車型每年能凈賺 1.08 萬美元。
無論怎么計算,自動駕駛出租車都會成為成本大殺器:
首先,這些車輛的性質意味著它們的成本會分攤到很多乘客身上。
其次,自動駕駛汽車不需要司機。
另外,我們還得關注車輛壽命。
一輛傳統(tǒng)燃油車,20 萬英里后的維保成本會迅速攀高。電動車在這方面有優(yōu)勢,比如當下特斯拉電池組使用 50 萬英里沒有問題。
這也就意味著,普通用戶得駕駛 37 年才能耗盡特斯拉電池組的壽命。而 100 萬英里使用壽命的特斯拉新車也正在開發(fā)中。
簡言之,自動駕駛出租車能解鎖電動車潛在的有形資產(chǎn):電動車的電池組壽命不會輕易被浪費。
不過,自動駕駛出租車和電動汽車之間的協(xié)同作用在最初可能并不明顯。在這樣的情況下,只要延長車輛壽命周期,才能轉化為相當可觀的經(jīng)濟價值。
如果電池和電動機的提升和改進,能為電動車增加 20 萬英里的壽命,在經(jīng)濟上就相當于讓一輛車變兩輛車。
這對汽車廠商來說,少賣車等于是革了他們的命。從消費者角度考慮,一輛車開上 30 年恐怕也會是一個噩夢,畢竟在這么長時間的跨度里,汽車在各項功能上都會有脫胎換骨的提升。
但對自動駕駛汽車來說,這根本不是問題。這也是華爾街巨鱷們(麥肯錫、瑞銀、摩根斯坦利等)普遍長期看好自動駕駛出租車的原因,其市場規(guī)模將達數(shù)千億甚至上萬億美元。
如果自動駕駛汽車真能如約部署,不但會讓司機們丟了飯碗,還會逐步吞掉整個汽車行業(yè)。
不過,即使到了現(xiàn)在,也有人懷疑這項技術的可行性:特別是近期和中期深度學習能否與人類的視覺、行為預測和駕駛能力所匹敵。
這個問題目前誰也回答不了,但我們依然能從這個趨勢中看出一些端倪:
首先,如果深度學習能在近期和中期解決這些問題,特斯拉將成為自動駕駛技術的正名人。
其次,如果特斯拉實現(xiàn)了全自動駕駛,從外人的眼光來看,特斯拉像開了外掛一樣,佛擋殺佛。
總之,特斯拉在自動駕駛上的新「套路」讓我們重新認識了技術進步。
前期的緩慢開發(fā)并不意味著后續(xù)的拖沓,一個花費數(shù)年時間搭建的神經(jīng)網(wǎng)絡可能在幾天內(nèi)就能完成訓練。而自動駕駛,有可能僅需一個 OTA 的時間,就如期而至了