仿佛一夜之間,人工智能(AI)就在各個領域“安營扎寨”。從手機助手到下棋機器人,從自動駕駛汽車到工業(yè)機器人,從醫(yī)生助理到家庭生活服務助手等等,我們正進入一個新的AI時代。
人工智能時代的來臨給創(chuàng)新帶來什么樣的變革?我們應該如何來進行創(chuàng)新?如何避免AI帶來的“機器誤導”?哪些是AI領域的難點?日前記者采訪了微軟亞洲研究院副院長張益肇博士。
AI和“隱形革命”
“說說看,你最喜歡的技術是什么?在你每天的工作和娛樂中都要用到的,并且在你生活中幾乎不可或缺的技術是什么?如果你認真地思考一下,很多你最心怡的技術沒準已經(jīng)不再是由塑料、金屬和玻璃制成的實體了。”張益肇引用同事Allison Linn的話開場。
人們最心怡的技術已經(jīng)從手中握著的實體變成賴以生存的、無處不在的隱形服務。張益肇說,我們正進入一個“隱形革命”時代。當感應器越來越便宜,即使你感受不到它的存在,它也可以收集大量數(shù)據(jù),并通過分析了解很多信息,提供如影隨形的服務。很多創(chuàng)新我們感受到的不是機器的“物理”變化,而是機器的“智能”變化。比如,對于一個騎自行車的人,它會提示你何時有可能發(fā)生意外,并杜絕意外的發(fā)生;再如,一個居住在北京的市民很容易知道幾天之后是不是會有霧霾,幾公里之外有沒有污染源;又如,一個醫(yī)生需要學習幾年的醫(yī)學知識,它可能只需要幾分鐘就能讀完,并給出你診療建議;再比如,一個盲人,它能夠告訴你周邊路況,應該如何通過馬路。
張益肇認為,下一代開天辟地、改變生活的技術創(chuàng)新,一定會遠遠超越鍵盤、屏幕、手機、相機、手表等硬件的范疇,而是更多地從云中獲得計算能力——成千上萬的計算機在云系統(tǒng)內(nèi)運轉,讓律師很容易找到案件的問題所在,讓科學家能夠預測下一次致命疾病的爆發(fā)、甚至田間農(nóng)作物的收成。
在張益肇看來,“隱形革命”依賴于機器學習等人工智能技術,隨著計算機掌握的數(shù)據(jù)越來越多,它能夠把事情做得越來越好。隱形革命有三個關鍵支撐:算法、數(shù)據(jù)和計算能力。AI并不是今天才存在,之所以能夠在今天這樣的節(jié)點迅速興起,開始滲透到各個領域,有幾個重要的因素。
一方面,機器學習的技術越來越成熟。作為機器學習的新領域,深度學習的進展來自于計算能力的提高。雖然基礎算法沒有巨大改變,但是由于結構過于復雜,以前的計算能力無法對神經(jīng)網(wǎng)絡進行訓練;而最新的系統(tǒng)可以計算出更加復雜的深度神經(jīng)網(wǎng)絡。比如,用深度學習做計算機視覺訓練,從原來二十幾層左右已經(jīng)可以做到一百五十二層,甚至在微軟亞洲研究院內(nèi)部已經(jīng)開始了上千層的學習和訓練。
另一方面,除了機器學習的算法和基礎設備越做越強之外,更重要的是數(shù)據(jù)源越來越豐富和多元化,從而可以做更多分析。過去研究人員要進行分析,尋找數(shù)據(jù)源需要大量的時間,有很多的障礙,現(xiàn)在數(shù)據(jù)已經(jīng)越來越豐富。
好的體驗需要軟硬結合
在采訪張益肇之前,記者還了解到很多微軟正在研發(fā)的“黑科技”,包括“全息瞬移”(Holoportation)、“觸前傳感”(Pre-TouchSensing)等,這些前沿技術能夠讓人們在虛擬與現(xiàn)實之間來回“穿越”,無需觸碰屏幕,手指手勢就可以實現(xiàn)人機交互。
一方面,微軟在強調(diào)創(chuàng)新變得越來越“隱形”,更多是借助云計算、數(shù)據(jù)、算法的能力進行相對“后臺”、“后端”服務的創(chuàng)新;另一方面又在進行大量傳感器、全息系統(tǒng)等這些相對“前端”的研發(fā)。這透露著什么樣的信息?
“事實上,我們今天的感知系統(tǒng)還遠遠沒有達到精準描述和再現(xiàn)這個世界的程度?!睆堃嬲卣f,從數(shù)據(jù)收集和感知維度上看,我們現(xiàn)在依然缺乏很多維度的“觸角”,而往往感受世界的視角不同決定和影響了我們對世界的判斷。正因為如此,微軟會投入大量的精力來進行“前端”傳感的研究,包括前面提及的“全息瞬移”、“觸前傳感”等。好的體驗需要“軟件和硬件”緊密結合,專注于傳感技術的傳感器公司可能無法涵蓋廣泛的體驗,這就需要我們彼此的深入合作。而且作為一個提供平臺的公司,微軟很想把人工智能的技術以平臺的方式讓更多人使用。如果我們不做全息眼鏡Holo Lens,我們的平臺就很難更好地理解前端的變化。
張益肇拉開袖口露出手環(huán)說:“我這個手環(huán)上有超過10個感應器,包括GPS(定位)、加速器(感知動作)、陀螺儀(Gyroscope,感知更加細微的動作)、皮膚電反應(GSR,Galvanic Skin Response,感應皮膚濕度)、溫度計、藍牙等,通過收集我的數(shù)據(jù)與云上數(shù)據(jù)、模型算法的分析判斷,遠遠勝過醫(yī)生在見面五分鐘內(nèi)對我的了解?!蔽覀兿M院罂梢詫⑦@些信息規(guī)范化,為醫(yī)生提供參考,與醫(yī)院進行配合。目前微軟已經(jīng)在和美國一家很大的醫(yī)院進行合作,研究如何把云上的智能和醫(yī)生、護士相配合,幫助他們更好地維護病人的健康。
目前許多業(yè)界巨頭包括IBM、微軟、谷歌等都加大了對AI的推動力度。微軟去年宣布了“微軟牛津計劃”,后升級為“微軟認知服務”,開放其AI技術平臺,開發(fā)者們就算沒有人工智能的知識背景也能輕松開發(fā)出屬于自己的智能應用。這套認知服務包括視覺、語音、語言、知識和搜索五大類共二十一項API。有了這些API之后,開發(fā)者不需要自己再花很多時間去開發(fā)這個技術,直接用幾行Code就可以調(diào)用技術并生成App。張益肇說:“我們不可能想出世界上所有應用場景的可能性,所以最好的辦法就是把它平臺化,做成服務,希望大家給我們更多的反饋。”
智能手環(huán)
未來的世界是AI+HI
業(yè)內(nèi)正積極推動AI技術發(fā)展、掃清應用障礙。張益肇認為,數(shù)據(jù)的來源依然是很大的難題,無論是數(shù)據(jù)質(zhì)量還是數(shù)據(jù)數(shù)量以及收集數(shù)據(jù)的成本,都面臨很多挑戰(zhàn)。以手寫體的識別為例,需要去找很多人提供白板上的圖片,才可以慢慢學習每個人的筆跡,相對簡單但工作量很大。而醫(yī)療數(shù)據(jù)因為涉及個人隱私,進行數(shù)據(jù)共享和開放也面臨一定的難度。盡管已經(jīng)有很多對數(shù)據(jù)進行匿名和保護的技術,但是開放數(shù)據(jù)更多的挑戰(zhàn)還在于觀念和管理層面。
從AI應用推動的角度來看,張益肇認為,AI的應用非常廣泛,涵蓋了各種不同的領域。在中國其實有很多的機會,比如目前中國在醫(yī)療健康、輔助功能等領域就有很大的AI需求。他舉了“Seeing AI”項目研究的例子,這個項目可以通過計算機視覺技術將圖像轉換成文字描述,再將文字轉化成語音,就可以幫助盲人“看”世界。此外,張益肇基于自己正在做的醫(yī)療研究的AI應用表示,在中國有很多胃癌患者,一方面是治療需求比較大,另一方面數(shù)據(jù)也比較多,所以通過AI技術可以推動這個領域的研究。
另外,能源利用和環(huán)境保護也對AI有很大的需求。目前中國是世界第一的能源使用大國。如何有效減碳、增進能源使用率越來越重要,因為中國城市化很快,尤其是個人的住宅,能源的使用很難控制,經(jīng)常造成能源浪費,用智能判斷的方法來進行樓宇的能源控制、住宅的隔熱與溫控等,都能大幅提高效率。
此外,空氣污染也是一大挑戰(zhàn)。微軟創(chuàng)投加速器最近孵化的一家公司專門做遠距離的感應器,通過無人機的方式來感應污染、監(jiān)測煤氣泄露等。過去煤氣公司探測煤氣泄漏,需要派人到現(xiàn)場,通過感應器感應哪一戶的廚房在漏氣,很危險?,F(xiàn)在用無人機的方式就變得更安全,也更高效。
當人工智能的應用越來越普遍,人們的決策越來越依賴機器智慧,一旦機器預測發(fā)生錯誤,是否會將人類帶到更大的“災難深淵”?
在張益肇看來,人工智能犯錯與人也會犯錯誤一樣,人類通常避免犯錯誤的方法是多人合作來降低錯誤的幾率。例如美國的太空梭,他們的做法是同時有三個完全獨立的電腦做判斷,理想狀況是三臺電腦做出一模一樣的決定;如果沒有三個相同的決定,就選擇兩個投票的決定。因為這三臺電腦的算法都是由不同的團隊開發(fā)的,相對而言同時出錯的幾率就比較小,在未來也可以用這個方法降低AI應用的錯誤率。未來人工智能將通過“AI”和“HI”(人類智能)結合、搭配,彼此取長補短來更好地發(fā)揮AI的作用,就像《星際大戰(zhàn)》里小機器人主要做輔助和繁瑣的事情,但最終決定還是由人來決策一樣。以后AI發(fā)展應該往這個方向來做。