近日,大疆創(chuàng)新的YY 碩(楊碩)在知乎上發(fā)表了一篇文章引起了大家極大的關注。此文介紹了作者本人去卡內(nèi)基梅隆大學機器人學院攻讀機械工程和機器人學的博士學位之前的心路歷程。經(jīng)授權,機器之心對此文進行了轉(zhuǎn)載。
在完成 RoboMaster 2018 總決賽和參與 Mavic 2 發(fā)布會后,我離開了在大疆創(chuàng)新的崗位,8 月 27 日開始在卡內(nèi)基梅隆大學的機器人學院攻讀機械工程和機器人學的博士學位。
讀博士這件事,想法一直都有。2015 年碩士畢業(yè)前去西雅圖參加 ICRA2015,順路跟著導師李澤湘到他年輕時的好基友沈向洋先生家做客。導師站在沈向洋先生的豪宅前開玩笑地說:「看一下以后奮斗的目標?!苟淞艘蝗?,我印象最深的是他書房里最顯眼的位置掛著的博士學位證書。Doctor of Philosophy in Robotics,這是這位人生贏家最讓我羨慕的地方。2016 年,帶領大疆的智能導航團隊保障 Phantom 4 順利發(fā)布以后,我覺得我已經(jīng)清楚了解了多旋翼的控制和智能導航相關的技術,這個領域不再有開創(chuàng)性的研究問題需要被探索了,我就有了去讀博士的想法,找一些更有挑戰(zhàn)性的機器人學問題去探索。2016 年中我開始做大疆創(chuàng)新在我心中最牛逼最激動人心的新項目——RoboMaster,為此把讀博士的夢想耽擱了兩年。2018 年終于是個好時機讓我開啟人生的下一階段了。
這是一個非常瘋狂的想法,但是我能夠感受到內(nèi)心的召喚,愿意為此突破一些障礙。比如后來每次有人和我談起沈向洋作為華人圈最成功的高管的種種事跡的時候,我首先想到的總是我站在他的博士學位證書前感受到的羨慕和向往。比如在刷朋友圈的時候看到科技新聞,相比起成功融資、成功上市的企業(yè)家的新聞,我還是從心底更佩服那些在科研工作上做出成果的科學家的新聞。尤其是現(xiàn)在這個時代,機器人學的未來該何去何從,尚未有定論,亟待科學家們的探索,這是需要探索和夢想的年代。雖然我在公司里有一些進展順利的項目,但是科學上的挑戰(zhàn)不多,而且公司里面專心科研的機會非常少,還是要回到學術機構(gòu)才能比較高效專心地展開工作。
另外在大疆的樹蔭下待久了,容易滋生自己很牛逼的心態(tài)。因為導師和大疆的成功,我也狐假虎威地跟著老板們接觸了一些以前只在新聞上看過的名人,也接待了很多學術界和工業(yè)界的傳奇人物來參訪大疆。但是這都不是我自己的能力所能達到的,我想靠自己的科研學術能力去讓別人認可我。很多人年輕時都懷抱著改變世界的理想,我比較幸運的是已經(jīng)和一些很厲害的人參與了一件改變世界的事情,因此對這個理想早已釋懷。比起改變世界來說,做好自己更難。
2016 年底抱著試一試的心態(tài)我開始了第一次申請。由于 RoboMaster 和公司其他項目繁重,我沒考 TOEFL 和 GRE,只改了改簡歷、寫了寫文書申請了加州大學伯克利分校(加州大學伯克利分??梢圆恍枰峤?TOEFL 和 GRE 成績)。因為我的研究生導師在加州大學伯克利分校有很強的影響力,所以 2017 年 2 月我拿到錄取通知,可以在 17 年秋季入學。
和大疆的同事以及妻子商量以后,覺得 17 年不是一個去讀博士的好時機,他們都以為我 16 年只是隨便申申,所以并沒有準備好。我的工作交接不出去給別人,老婆也沒做好跟我一起去美國的準備。所以我和伯克利溝通了一下之后,把 offer 推遲到了 18 年再入學。
在拿到伯克利的錄取前后,我也受邀到卡內(nèi)基梅隆大學的機器人學院介紹大疆的無人機技術和 RoboMaster 這個機器人教育項目。所以 2017 年的 3 月,我首先在卡內(nèi)基梅隆大學機器人學院做了一次 seminar,然后去加州大學伯克利分校參加給博士學生組織的校園開放日。
兩個地方給我的感覺是截然不同的。3 月的加州伯克利陽光溫暖和煦,四處充滿著生機,加州大學伯克利分校作為世界科技中心的主要學術機構(gòu)之一,人們都在興奮地討論人工智能、自動駕駛和區(qū)塊鏈;而 3 月的賓州匹茲堡冷風刺骨,街道透出衰敗的氣息,卡內(nèi)基梅隆大學作為銹帶區(qū)復興的唯一希望,人們顯得更加謹小慎微。雖然有不少科技公司在匹茲堡開設分支辦公室,但大部分卡內(nèi)基梅隆大學的學生都會在畢業(yè)之后去硅谷,而加州大學伯克利分校的學生們已經(jīng)在宇宙中心了,我想這讓他們的學術科研以及生活的方方面面都有不同的思考。
兩相比較下來,我發(fā)現(xiàn)我更想去卡內(nèi)基梅隆大學讀博士。
卡內(nèi)基梅隆大學機器人學院的很多教授和學生非常熱情地歡迎了我。他們知道我是做什么的,我在大疆的工作已經(jīng)幫助到了很多機器人學院的人,甚至有人知道 DJI SDK 是我主導并架構(gòu)的項目。在機器人學院負有盛名的 Field Robotics Center,遍地都是大疆 M100 和 M600 飛行器,至少三個科研和創(chuàng)業(yè)項目以大疆飛行器為核心。一個機器人學院的學生驕傲地給我展示了他的工作,他在 M100 上增加了激光雷達,通過調(diào)用 DJI SDK 中控制飛行器的 API,實現(xiàn)自動橋梁巡檢,他說奧巴馬離任總統(tǒng)之前來卡內(nèi)基梅隆參觀的時候也看過他的項目。在機器人學院的官網(wǎng)上,一臺由 M100 改造的空中機器人和很多其他卡內(nèi)基梅隆造出來的著名機器人被展示在了一起。
而在另一邊的加州大學伯克利分校,人們對我的態(tài)度不慍不火,很少有人聽說過大疆這家公司。拋開多旋翼飛行器不說,我參觀了很多伯克利的實驗室,但是沒有看到什么特別令人驚奇的機器人項目。
他人的態(tài)度不應該作為做出選擇的依據(jù),既然我決定離開國內(nèi)的人脈圈和大疆優(yōu)越的環(huán)境去讀博士,就應該做好從零開始的心理準備。我這樣說,只是結(jié)合我的觀察和感受,思考了這樣一個問題:兩個地方人的態(tài)度,反映了他們思維方式和做事方式的不同。
加州大學伯克利分校的計算機專業(yè)和卡內(nèi)基梅隆大學的計算機專業(yè)都很強,不分伯仲。兩個學校的計算機專業(yè)對自己學校機器人方向的研究卻有著不同的影響。在我看來,伯克利的計算機專業(yè)和硅谷周圍偏軟件互聯(lián)網(wǎng)的環(huán)境吸收走了資源,一些本可以研究機器人的優(yōu)秀人才都去做純軟件方面的科研工作了,工作的目的多半也是為了到硅谷創(chuàng)業(yè)。計算機科學非常契合人們對個人英雄主義的追求,一個人單槍匹馬發(fā)明了一個算法或者一個軟件工具解決了一個重要的計算機科學問題、開辦了一家公司,這是非常常見的,而且很容易受到媒體和社會的關注。在伯克利參加校園開放日的時候,有一個 session 是教授們輪流上臺講自己的 research 來吸引學生,好幾個教授在介紹的過程中都會說啊你看我這個工作已經(jīng)創(chuàng)了業(yè)融了資,或者說啊我這個工作雖然充滿了蛋疼的數(shù)學但也是能創(chuàng)業(yè)的……
和計算機科學領域的研究不同,機器人是綜合性學科,不能用計算機科學領域的思路去研究,鮮有人能單槍匹馬做一個機器人出來,大家必須一起合作。后來沈向洋在他的一篇文章里也談到了這一點:
…… 麻省理工大學每個人都是一頭虎,而卡內(nèi)基梅隆大學出來的都是一群狼。我們很少單打獨斗,都是一個團隊一起做一個大項目,卡內(nèi)基梅隆大學最出名的都是大項目。所以卡內(nèi)基梅隆大學成功的地方是培養(yǎng)了很多大的 IT 公司 CTO 級別的人物,很多學生在工業(yè)界更加成功。
做大項目就意味著成果不那么容易出,而且大家需要花很多時間進行工作的討論和同步。另外機器人相關的大項目一定需要工程師和科學家的協(xié)作,由工程師制作基本的機器人平臺,機器人科學家在上面進行科研探索??▋?nèi)基梅隆大學有非常完善的工程師和科學家協(xié)作的制度,甚至進行教學工作的教授就分研究型和工程型兩類。機器人學院雖然架構(gòu)在計算機學院下面,但是計算機學院并沒有非常強勢地把控機器人學院的研究方向,機器人學院在人類做機器人的歷史上功名赫赫,能夠持續(xù)地吸引優(yōu)秀的人才。更重要的是,機器人學院跨學科交叉的制度吸收了很多 ECE 和 meche 的學生一起進行科研。
因為卡內(nèi)基梅隆大學的協(xié)作制度和做大項目的能力,他們和工業(yè)界的聯(lián)系非常緊密。他們能很快把握工業(yè)界的動向,很快地把一些工業(yè)界的產(chǎn)品用到科研當中,比如大疆的 Matrice 飛行器。而加州大學伯克利分校則沒有這樣的協(xié)作機制,機器人項目也基本僅由最強勢的 EECS 專業(yè)把控,很少能組織起背景豐富的交叉型團隊。
這么說并沒有輕看伯克利的意思,相反我相信伯克利可以讓精英更精英。我只是認為,機器人是狼群做的事情。獨立去做研究的話,和辛湜、賈揚清這樣優(yōu)秀的伯克利學生比起來,我在工業(yè)界淺嘗輒止的背景和編程能力,更像一匹狼,在伯克利應該是很難做出什么成績的。所以我想再申請一次,去卡內(nèi)基梅隆大學。
另外,一些和學術不相關的東西也影響著我。匹茲堡作為上世紀美國工業(yè)重鎮(zhèn)的歷史總是讓我時不時聯(lián)系起我的家鄉(xiāng)——中國的工業(yè)老城山西太原。太原和匹茲堡一樣在國家發(fā)展的過程中有重要的地位;一樣是受益于煤炭和鋼鐵;一樣也在國家發(fā)展進入新階段以后城市的發(fā)展出現(xiàn)了停滯。我能在匹茲堡的街道上嗅出一些在太原街上也有的氣息,讓我感覺很熟悉。
4 月份我回太原的家里探親,整理小時候看過的百科全書時隨手翻了翻,在某一頁赫然看到一個機器人被注明是卡耐基梅隆大學的機器人學院所研發(fā)。我這才驚訝地發(fā)覺,雖然現(xiàn)在完全不記得,但是可能十幾年前當我立志想做一個科學家的時候,曾經(jīng)被機器人學院所激勵過。
2017 年 4 月 11 日,王小波逝世 20 周年。我買了張佳瑋非常推崇的《萬壽寺》來看,又從前言里了解到,王小波曾在匹茲堡大學陪他的妻子讀書,他當時的好朋友、也在匹茲堡大學學習的丁學良后來成為了香港科技大學的社會科學教授,我在香港科技大學讀書的時候也聽過丁學良教授的課。想必匹茲堡這個地方深深影響了他們寫作的方式和對世界的看法。
作為一個懷念并堅持童年理想的人,一個喜歡歷史、社科和文學的人,很容易被這些冥冥之中的聯(lián)系牽引起來。大家都想去硅谷,但我很想在匹茲堡這個地方多待一待,看看機器人產(chǎn)業(yè)如何讓這個老城復興。
2017 年 6 月,在參加完 ICRA2017 之后,我寫了這篇文章《未來的機器人未來》。其實有些讀者應該很明顯地看出我在這篇文章里表達的個人傾向了。如果去伯克利的話,多半是會按照深度神經(jīng)網(wǎng)絡和增強學習的方法去做一些東西,但是我更想跟隨傳統(tǒng)的路線。17 年的申請季,我重新申請了卡內(nèi)基梅隆大學。
在寫《未來的機器人未來》前后,我也一直在了解深度神經(jīng)網(wǎng)絡和增強學習,一方面是了解這個研究領域,一方面也為 2018 年舉辦 RoboMaster AI 挑戰(zhàn)賽做準備。在《RoboMaster AI 挑戰(zhàn)賽科研思路淺談》這篇文章里我講了一些自己的思路和想法,遺憾的是,半年過去,我、我的 RoboMaster 團隊、RoboMaster AI 挑戰(zhàn)賽的參賽學生,都沒有實現(xiàn)出增強學習控制的機器人。我自己做深度增強學習,有一種說不清道不明的失敗感:算法非常難收斂、variance 很大、極其 sensitive,隨便改個參數(shù)結(jié)果會大相徑庭、修改參數(shù)沒有什么理論依據(jù)。最近有一篇文章《呵,我復現(xiàn)一篇深度強化學習論文容易嗎》,很好地描述了復現(xiàn)一些深度增強學習的痛苦之處。讓我感到特別不適的是,機器人系統(tǒng)的精髓——能量的轉(zhuǎn)化和系統(tǒng)的建?!谏疃仍鰪妼W習里毫無用處。機器人上電和磁轉(zhuǎn)化為動能、力帶來的運動對外產(chǎn)生力,我們面對的是一個復雜但是一切可知的系統(tǒng)。但是在深度增強學習里這些都用不到,我們調(diào)整參數(shù)或者調(diào)整神經(jīng)網(wǎng)絡的層,參考依據(jù)居然不是牛頓運動定律。進入 2018 年,圈內(nèi)出現(xiàn)的質(zhì)疑聲越來越多,比如《【AI 幽靈】超 90% 論文算法不可復現(xiàn),你為何不愿公開代碼?》、《這里有一篇深度強化學習勸退文》、《深度學習勸退文》。感覺世界上除了伯克利 BAIR 實驗室的人,其他人都復現(xiàn)不出深度增強學習算法。
雖有質(zhì)疑,但是每隔一段時間,伯克利和 OpenAI 都還是能拿出一些看起來效果非常驚艷的工作。不過,因此強行說 DRL 就能做出傳統(tǒng)方法做不出來的東西,就有點不合適了。比如說最近 OpenAI 的新作像人手一樣:OpenAI 用打 DOTA 算法,教機械手「盤核桃」,如果用傳統(tǒng)方法來做,也是能做的,總計算量也差不多:用外部攝像頭計算出木塊的位姿,然后根據(jù)牛頓運動定律和歐拉方程列出動力學微分方程,再解個優(yōu)化問題算出連續(xù)轉(zhuǎn)動的施力點,接著計算每個手指提供施力的角度和方向,然后移動每根手指(后面這幾步,在我導師的書 A Mathematical Introduction to Robotic Manipulation 里都明確地寫了該怎么做)。這些過程中要解一些非常繁瑣的優(yōu)化問題,但是如果能拿到 OpenAI 訓練神經(jīng)網(wǎng)絡所用的計算量,解優(yōu)化問題也不是太麻煩的事情。而且大家一說傳統(tǒng)方法就覺得是有模型的,所以不容易擴展。但其實從物體的外形計算出合適的施力點這個過程,在傳統(tǒng)的方法里本來就是無模型的凸優(yōu)化問題(可參見 @ 戴泓楷的工作),不見得比 DRL 的方法差到哪里去。所以現(xiàn)在業(yè)外人士,包括業(yè)內(nèi)人士的態(tài)度都變成了:方法 A 做出了不錯的效果,推測覺得方法 B 做不到,就說明方法 B 完全不能用,方法 A 是人類的未來。但是就沒有人用方法 B 做過同樣的事情啊,連對比都沒有。而且 OpenAI 這個機械手盤核桃,讀了論文發(fā)現(xiàn)實驗中 50 次平均成功 13 次,這么低的成功率為什么能被用來證明方法 A 就好到是人類的未來呢……
我應該還會繼續(xù)關注這個領域,但是不想也不再有機會去伯克利去弄明白這件事。17 年人工智能的浪潮繼續(xù)高漲,大量的申請人想擠進 BAIR 實驗室去做深度學習,伯克利的秘書說 17 年的申請人數(shù)量是 16 年的好多倍,我放棄了 offer 就拿不到了。不過好在后來順利拿到了卡內(nèi)基梅隆大學的 offer。
我將加入卡內(nèi)基梅隆大學機器人學院的 Biorobotics lab,跟隨 Howie Choset 教授進行科研,繼續(xù)沿用比較傳統(tǒng)的機器人學家分析問題的方法和思路。非常巧合的是,前兩天在 Mavic 2 宣傳文里我談到的給 Mavic Pro 頒發(fā)「年度空中救援機器人」的組織,同時也把「年度地面救援機器人」頒發(fā)給了 Howie Choset 教授團隊做的機器蛇(https://www.zdnet.com/article/snakebot-named-ground-rescue-robot-of-the-year/ )這種機器人在狹小空間內(nèi)搜索救援有非常大的優(yōu)勢,同時也能引出很多有價值的科研問題和方向。
基于我在工業(yè)界的背景和卡內(nèi)基梅隆機器人學院緊密結(jié)合工業(yè)界的傳統(tǒng),未來我會繼續(xù)研究可以適用于多旋翼飛行器和地面機器人的通用控制和規(guī)劃技術,同時也會關注機器人系統(tǒng)架構(gòu)的標準化工作。我希望能夠通過博士期間的學習和科研工作,回答一些更大的問題:機器人應該盡量模仿生物還是超越生物?是否存在顯性表現(xiàn)群體智能涌現(xiàn)的算法?真正的機器人學習是怎樣的范式?我不想盲從人工智能熱潮,我相信真正的人工智能、超越人類智能的智能,應該是從我們對物理世界的規(guī)律、能量轉(zhuǎn)化的利用和現(xiàn)實世界抽象的數(shù)學中涌現(xiàn)出來的。
雖然卡內(nèi)基梅隆的很多人已經(jīng)認識我,但是就像卡內(nèi)基梅隆大學博士田淵棟學長說的那樣:
不要在優(yōu)越感中停止自己的腳步。名利于人最可怕的莫過于此,分明剛剛啟程,但歡呼聲讓你覺得已然沖線,本來要萬里長征,卻變成了百米短跑,接受完了鮮花之后,就再也看不見遠處的風景。其實境界到了或是未到,只有自己知道。跋山涉水,風餐露宿,鼓掌的是別人,度化的是自己。
我需要不斷讓自己做好「雄關漫道真如鐵,而今邁步從頭越」的心理準備。也希望未來在卡內(nèi)基梅隆不會得到太多科研和教育以外的關注。
對于年輕的科研工作者來說,在哪里展開科研工作的博士階段是一個非常重要的選擇,我不知道自己關于伯克利還是卡內(nèi)基梅隆的選擇有沒有做對,多年以后回頭再看也許會后悔,可能那個時候大家都已經(jīng)轉(zhuǎn)向了深度增強學習的研究,深度增強學習也在工業(yè)界得到了廣泛的應用,但是至少最開始的時候我有一個我自己堅持的想法,沒有隨波逐流。
我在大疆從事的最令我自豪的工作之一——RoboMaster,之后會繼續(xù)以顧問和裁判長的身份參與,幫助這項比賽走向國際。過去幾年中有很多高中生、大學生在參加完 RoboMaster 的比賽、冬令營和夏令營之后也受到卡內(nèi)基梅隆和其他一些美國大學的青睞,未來我會繼續(xù)在美國幫助他們,也會給 RoboMaster 圈子里的同學繼續(xù)提供職業(yè)發(fā)展的建議和咨詢。
過去的五年,我在大疆經(jīng)歷了一段英雄輩出的時代,得以有幸和一些全國甚至全世界最優(yōu)秀的工程師合作,并向他們學習了很多經(jīng)驗,沒有和他們共事的經(jīng)歷也沒有我現(xiàn)在能夠得到的讀博士的機會;同時在大疆也得到很好的平臺和資源專心做機器人教育事業(yè),通過 RoboMaster 機甲大師賽幫助了新一代工程師的成長,并且為他們的故事所感動,去讀博士不是這項事業(yè)的結(jié)束,而是另一種形式的延續(xù)。我相信大疆創(chuàng)新在未來依然是中國最有競爭力的消費電子、機器人和制造業(yè)企業(yè)。公司內(nèi)一些正在孕育的新技術和新項目一定會在接下來的很多年中持續(xù)刷新人們對中國制造和創(chuàng)新的看法。RoboMaster 作為我口中的「大疆下一個創(chuàng)新」、被媒體描述成「大疆第二次創(chuàng)業(yè)」的項目,也會持續(xù)開花結(jié)果,帶給人們緊張激烈的機器人比賽,也帶給下一代年輕人更開闊的未來和可能性。我深深感謝過去經(jīng)歷的這一切,感謝合作過的每一個人,我們都會在世界各地繼續(xù)努力,「聚是一團火,散是滿天星」。
我也非常感謝我的妻子 @Lexi M。在別人都已經(jīng)安頓下來的年紀,還要換個生活方式繼續(xù)挑戰(zhàn)自我,這對我的家庭也是一個巨大的挑戰(zhàn)。妻子從一開始就非常支持我去走上這條新的道路,給我出主意,并且愿意為了我調(diào)整自己的職業(yè)發(fā)展方向、經(jīng)歷離別和生活方式的改變。人生得一知己足矣,而對我來說我同時得到的是知己、朋友、親人和愛人,對此感激不盡,只能用一生的努力去報答。
最后,用我非常欣賞的哈爾濱工業(yè)大學機器人隊的隊訓作為結(jié)尾,希望在未來的幾年自己能夠一直被這句話所激勵:極限尤可突破,至臻亦不可止。