《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 業(yè)界動(dòng)態(tài) > 微軟人工智能計(jì)劃 華人頂起半邊天

微軟人工智能計(jì)劃 華人頂起半邊天

2016-06-27

  在亞洲研究院內(nèi),90%以上的科研人員是華人,像聶再清團(tuán)隊(duì)一樣的研究小組有20多個(gè),其中很多都從事與人工智能相關(guān)的核心技術(shù)和應(yīng)用研究。

  “為微軟孵化顛覆性科技并創(chuàng)造新的業(yè)務(wù)?,F(xiàn)在我們部門建立了幾個(gè)團(tuán)隊(duì),專注于新業(yè)務(wù)”

  人工智能

  今年的微軟Build大會(huì)上,微軟CEO薩提亞.納德拉展示了一款能夠訂購(gòu)達(dá)美樂Pizza的機(jī)器人。方法很簡(jiǎn)單,只需要對(duì)著你的移動(dòng)設(shè)備說“想吃Pizza”,約定時(shí)間內(nèi),Pizza就被送到你的手里——不用點(diǎn)開某個(gè)叫餐軟件,甚至不必打字。就像是有個(gè)人坐在后臺(tái),隨時(shí)待命。

  沒有人坐在后臺(tái)待命,是讀取和深度學(xué)習(xí)達(dá)美樂點(diǎn)餐全流程的虛擬機(jī)器人完成了所有操作。微軟給這個(gè)黑科技項(xiàng)目取了一個(gè)并不花哨的名字——“機(jī)器人智能”(Bot Intelligence)。整個(gè)項(xiàng)目展示只有短短5分鐘,但對(duì)微軟而言,意義重大。

  掌管微軟整體技術(shù)研究的執(zhí)行副總裁沈向洋表示,“機(jī)器人智能”是機(jī)器人架構(gòu)(Bot Framework)的核心部分,嵌入了深度學(xué)習(xí)、語(yǔ)義理解等人工智能技術(shù),第三方開發(fā)者能夠通過機(jī)器人架構(gòu)這個(gè)平臺(tái)來創(chuàng)建不同功能的機(jī)器人。

  它直接關(guān)系到微軟的未來——不僅僅是訂購(gòu)Pizza,微軟希望,不同企業(yè)可以像達(dá)美樂那樣利用微軟的平臺(tái)更簡(jiǎn)單地制作并運(yùn)行自己的智能機(jī)器人。彭博社撰文指出,這是一個(gè)嶄新的市場(chǎng),以至于Gartner和Forrester等調(diào)研公司還沒有摸清楚它的規(guī)模,這很可能會(huì)非常龐大。

  這項(xiàng)終極目標(biāo)是要讓機(jī)器替代人類的技術(shù)背后,集結(jié)了微軟眾多科學(xué)家的智慧,尤其是幾年來在人工智能領(lǐng)域的研發(fā)成果。每年微軟都有接近100億美元投入在研發(fā)上,其中很大一部分集中在人工智能。據(jù)沈向洋介紹,在全球微軟有1000多名研究人員,至少有三分之一都在研究人工智能。在這龐大的科學(xué)家隊(duì)伍中,華人面孔的科學(xué)家,成為微軟人工智能戰(zhàn)略背后的核心研發(fā)力量。

  “(微軟CEO納德拉展示的)這個(gè)Pizza機(jī)器人的大腦,就是我們做的。”38歲的聶再清說。他是微軟亞洲研究院資深研究員,帶領(lǐng)著一個(gè)有8個(gè)研究員的小組,過去十余年都在主攻大數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)?!昂?jiǎn)單說,(我們的工作)就是讓機(jī)器能夠理解用戶的自然語(yǔ)言并構(gòu)建知識(shí)圖譜?!彼f道。

  這個(gè)研究小組的成果,促成了Pizza機(jī)器人和其背后“機(jī)器人智能”技術(shù)的誕生,也讓不同企業(yè)利用微軟的平臺(tái)制作并運(yùn)行自己的機(jī)器人,成為了可能。

  今年3月,聶再清代表亞洲研究院,在美國(guó)華盛頓州雷德蒙微軟總部一年一度的Techfest(微軟技術(shù)大會(huì))上,展示了這項(xiàng)成果。他僅用了幾行代碼,制作出一個(gè)能夠用于企業(yè)內(nèi)部預(yù)訂會(huì)議的機(jī)器人。當(dāng)時(shí),納德拉坐在不到5米遠(yuǎn)的看臺(tái)上,在他旁邊的是微軟執(zhí)行副總裁、研發(fā)集團(tuán)CEO沈向洋。

2016062509.jpg

  “這是我見到過的最簡(jiǎn)單的代碼?!蔽④汣EO納德拉對(duì)一旁的沈向洋說道,他希望在一個(gè)月后的Build大會(huì)上加入這個(gè)研究的展示,不過展示形式可能要換換,比如,不是用于預(yù)訂會(huì)議的機(jī)器,而是用簡(jiǎn)單的代碼寫出一個(gè)可以訂購(gòu)Pizza的智能點(diǎn)餐機(jī)器人。

  “通常為機(jī)器人添加新功能或場(chǎng)景需要一整套的工序,現(xiàn)在只需要幾步,有了‘機(jī)器人智能’的機(jī)器人架構(gòu)平臺(tái)就能幫助開發(fā)者構(gòu)建一個(gè)機(jī)器人的大腦,哪怕你對(duì)軟件工程的知識(shí)一竅不通?!彼榻B道。

  講述“Pizza機(jī)器人”這段誕生過程時(shí),聶再清坐在北京中關(guān)村一棟30層高的寫字樓辦公室里。這里是微軟亞洲研究院,微軟全球范圍內(nèi)1000多名科學(xué)家和專家中的五分之一,聚集于此。

  在亞洲研究院內(nèi),90%以上的科研人員是華人,像聶再清團(tuán)隊(duì)一樣的研究小組有20多個(gè),其中很多都從事與人工智能相關(guān)的核心技術(shù)和應(yīng)用研究,涵蓋了從大數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理到在線搜索等人工智能核心技術(shù)的方方面面。3月在美國(guó)高調(diào)上線并引發(fā)軒然大波的微軟人工智能助手Tay的原型,即在中國(guó)有4000萬用戶的語(yǔ)音助手“微軟小冰”,正是這些研究團(tuán)隊(duì)的另一項(xiàng)成果。

  研發(fā)團(tuán)隊(duì)

  身為微軟全球執(zhí)行副總裁、掌管這個(gè)全球最大高科技公司研究事務(wù)的沈向洋博士,也起步于位于北京的這個(gè)研究院。沈向洋曾擔(dān)任微軟亞洲研究院院長(zhǎng),是聶再清的上司。

  1999年,沈在北京加入微軟亞洲研究院,成為這個(gè)研究院第一名研究員,主攻視覺識(shí)別。那一年,李開復(fù)任亞洲研究院院長(zhǎng),在他的帶領(lǐng)下,微軟實(shí)驗(yàn)室開始拼音輸入程序的研發(fā)。李開復(fù)和沈向洋不僅都畢業(yè)于卡內(nèi)基梅隆大學(xué),且都師從1994年的圖靈獎(jiǎng)獲得者拉吉.瑞迪。從1999年開始,直到今日,人工智能都是整個(gè)微軟亞洲研究院的主攻方向之一。

  現(xiàn)在沈向洋的辦公室位于美國(guó)華盛頓州的雷德蒙總部,從窗外望出去,能隱約看到雷德蒙大學(xué)的操場(chǎng)。19年前,Windows95在這里正式發(fā)布。那曾是微軟最輝煌的時(shí)期,Windows幾乎占據(jù)了90%的市場(chǎng)份額,直到2007年,雅虎和谷歌帶來的全新商業(yè)模式——這種通過廣告賺錢,而對(duì)用戶而言一切免費(fèi)的模式與微軟截然不同,也讓微軟第一次正視自己已經(jīng)錯(cuò)失了搜索的機(jī)會(huì)。

2016062510(1).jpg

  美國(guó)華盛頓州雷德蒙德的微軟總部

  那是一次輸在策略的賽跑。事實(shí)上,2007年沈向洋在亞洲研究院任院長(zhǎng)時(shí),這里的自然語(yǔ)言研究及機(jī)器學(xué)習(xí)已小有成果——這兩者正是搜索技術(shù)往前發(fā)展的核心。正因如此,當(dāng)年年底,當(dāng)時(shí)任微軟CEO的史蒂夫.鮑爾默決定要在微軟內(nèi)部打造一支搜索團(tuán)隊(duì)時(shí),選中了沈向洋。

  鮑爾默當(dāng)時(shí)給團(tuán)隊(duì)打氣說:“我調(diào)了一個(gè)最懂技術(shù)的人,叫沈向洋,又調(diào)了一個(gè)最懂產(chǎn)品的人,叫納德拉?!苯酉聛淼膸啄?,沈陸續(xù)從亞洲研究院帶了54個(gè)研究員到必應(yīng)(Bing)。這些研究員最后都成為了搜索團(tuán)隊(duì)里面的技術(shù)骨干。

  又過了六年后,納德拉成為了微軟的掌舵人,把公司帶向云計(jì)算,而沈向洋這位出生于南京的中國(guó)人,則成為了微軟創(chuàng)新理念的重要布道者。他所帶領(lǐng)的研發(fā)團(tuán)隊(duì)時(shí)刻都在為微軟尋找下一個(gè)“偉大的點(diǎn)子”。

  這兩年,如何讓研發(fā)團(tuán)隊(duì)這個(gè)微軟重要且寶貴的資產(chǎn)支持企業(yè)未來的發(fā)展藍(lán)圖,一直是納德拉和沈向洋反復(fù)討論的話題。為此,沈向洋更改了研發(fā)部門的一些規(guī)劃與制度。微軟在全球擁有11個(gè)研究院和實(shí)驗(yàn)室,在研究院里,研究工作以研究領(lǐng)域?yàn)閱挝华?dú)立運(yùn)行,同時(shí)研究組之間、研究組與產(chǎn)品部門之間又保持密切合作。

  過去,研究小組不是一個(gè)真正的產(chǎn)品研發(fā)團(tuán)隊(duì),而是以基礎(chǔ)研究為主,較少考慮市場(chǎng)因素,現(xiàn)在沈向洋希望研究團(tuán)隊(duì)也參與產(chǎn)品的研發(fā)?!盀槲④浄趸嵏残钥萍疾?chuàng)造新的業(yè)務(wù)?,F(xiàn)在我們部門建立了幾個(gè)團(tuán)隊(duì),專注于新業(yè)務(wù)?!彼f道。

  每年,微軟研發(fā)集團(tuán)會(huì)挑選一些項(xiàng)目向公司業(yè)務(wù)部門展示,但只有七個(gè)項(xiàng)目進(jìn)入到最后的顛覆性科技評(píng)估環(huán)節(jié)。這些入選的項(xiàng)目大都在相關(guān)性領(lǐng)域有顛覆性的研究發(fā)現(xiàn)。每年10月,在雷德蒙會(huì)議室里,各個(gè)項(xiàng)目負(fù)責(zé)人都會(huì)與微軟高層們進(jìn)行4個(gè)小時(shí)的頭腦風(fēng)暴,沈向洋會(huì)在一旁收集反饋,并決定下一步動(dòng)作,比如,是否立刻將其落實(shí)為產(chǎn)品。

  一些項(xiàng)目已經(jīng)處于前期研究的階段,其中包括位于美國(guó)加州的圣塔芭芭拉市(SantaBarbara)的量子計(jì)算實(shí)驗(yàn)室;英國(guó)劍橋研究院在做生物計(jì)算(Biological Computing)的長(zhǎng)期研究;最近,微軟還試圖在DNA上存儲(chǔ)海量信息,并為此新建了一個(gè)Wet Lab……

  說起這些項(xiàng)目,沈向洋如數(shù)家珍。過去兩年,他平均每周深度考察兩個(gè)來自全球研究院的項(xiàng)目。沈向洋分享了以上那些鮮為人知的微軟黑科技。他試圖向外界展示的不外乎一點(diǎn):現(xiàn)在的微軟跟蓋茨時(shí)代沒有兩樣,仍然是一家注重技術(shù)研發(fā)的公司,哪怕這些研發(fā)都相當(dāng)基礎(chǔ),短期內(nèi)不可能實(shí)現(xiàn)。

  從基礎(chǔ)研發(fā)到最終產(chǎn)品,其中過程并不容易。微軟不止一次在一些項(xiàng)目上栽跟頭,包括Tay。今年3月Tay在美國(guó)正式上線,但幾個(gè)小時(shí)后,就有別有用心的人教會(huì)它發(fā)表種族歧視的言論。不久Tay便被要求緊急下線。這幾乎可以看作小冰“西游”的一次失敗。

  不過,在與中國(guó)文化相近的日本,小冰的姐妹版Rinna卻受到追捧。在沈向洋看來,這回到了最根本的問題:計(jì)算機(jī)的算法讓它已經(jīng)能識(shí)別數(shù)千種汽車,而人類可能只能認(rèn)出三種。但在認(rèn)知、同理心和情感層面,機(jī)器還無法接近人類。

  需求與未來

  人工智能之于今天的微軟,就像當(dāng)年的搜索服務(wù)。人工智能是讓計(jì)算機(jī)學(xué)習(xí)如何像人一樣聽、說、讀、想,該領(lǐng)域與移動(dòng)互聯(lián)網(wǎng)時(shí)代緊密相連。大多數(shù)科技公司都已經(jīng)看到其廣闊前景,巨頭之間,人工智能的競(jìng)賽也已展開。

  Facebook在硅谷、紐約和巴黎建立了三個(gè)人工智能實(shí)驗(yàn)室。Google常年在全球搜羅人工智能方面的科學(xué)家。百度挖走了谷歌的科學(xué)家吳恩達(dá),還在硅谷建立了研究院……“但是各家不一樣,主要還是看各自的業(yè)務(wù)模式,也就是你到底用這樣的技術(shù)去做什么?!鄙蛳蜓笳f道,他與百度董事長(zhǎng)李彥宏相熟,去年他們還討論過尼克.波斯特洛姆的《超級(jí)智能》里的場(chǎng)景。

  百度與谷歌類似,在人臉識(shí)別、自然語(yǔ)言處理上下功夫,以支撐搜索技術(shù)發(fā)展的需要。Facebook則希望通過人工智能挖掘社交技術(shù)的可能。而微軟花了大量精力在機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺識(shí)別等人工智能的基礎(chǔ)研究上,“所有的人工智能研究都圍繞微軟未來的智能云平臺(tái)展開?!鄙蛳蜓笳f道。這是繼搜索后的又一次賽跑,好在這次,微軟至少?zèng)]有輸在起跑線上,北京的研發(fā)團(tuán)隊(duì)過去十幾年的技術(shù)積累,正在派上用場(chǎng)。

  機(jī)器學(xué)習(xí)是讓機(jī)器具有智能的核心。過去十多年,聶再清位于北京中關(guān)村的團(tuán)隊(duì)都在主攻大數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)。他的第一個(gè)項(xiàng)目叫學(xué)術(shù)搜索。那時(shí),他剛從美國(guó)大學(xué)博士畢業(yè),正愁沒有研究課題。卻發(fā)現(xiàn)自己平時(shí)苦于做論文需要尋找文獻(xiàn),于是搭建了一個(gè)可以搜索文獻(xiàn)、會(huì)議、作者、機(jī)構(gòu)及其關(guān)系的對(duì)象級(jí)別搜索引擎。

  后來該團(tuán)隊(duì)把搜索對(duì)象擴(kuò)展到了互聯(lián)網(wǎng)上有公開信息的任何一個(gè)人,就有了叫“人立方”的產(chǎn)品——這是一種關(guān)系搜索,它從超過十億的中文網(wǎng)頁(yè)中自動(dòng)抽取出人名、地名、機(jī)構(gòu)名以及中文短語(yǔ),并且通過算法自動(dòng)計(jì)算出它們之間存在關(guān)系的可能性。

  “機(jī)器人智能”項(xiàng)目,實(shí)際上基于人立方的技術(shù)。這種技術(shù)最先被用到了企業(yè)內(nèi)部,一款名為企業(yè)深度智能(Enterprise Deep Intelligence,簡(jiǎn)稱EDI)的應(yīng)用已經(jīng)預(yù)計(jì)會(huì)很快進(jìn)行產(chǎn)品化。它已在微軟亞洲研究院內(nèi)部廣泛試用,人們都在用這個(gè)應(yīng)用查詢信息、組織會(huì)議、自動(dòng)預(yù)訂會(huì)議室。

  另外,EDI還可以像一個(gè)私人秘書一樣,通過Skypefor Business與用戶聊天,只要告訴“他”你的需求,“他”就幫你處理日常事務(wù)。“可以把預(yù)訂會(huì)議的郵件抄送給‘他’,或者輸入:‘EDI,請(qǐng)幫我跟這些人約一個(gè)會(huì)議’,‘他’根據(jù)你的要求和喜好,會(huì)自動(dòng)去找會(huì)議室和大家都有空的時(shí)間段?!甭櫾偾逭f,“把API應(yīng)用到達(dá)美樂場(chǎng)景,就得到了訂購(gòu)Pizza的機(jī)器人。”

  在沈向洋看來,這是微軟的下一步:“我們認(rèn)為未來智能助理(Intelligent Agent),可能會(huì)是一個(gè)新入口,無論是Android還是WindowsPhone都行得通,微軟就可以和所有的公司合作。”看上去此類需求無處不在?!昂芏嘞敕◤钠綍r(shí)的閱讀和學(xué)術(shù)文章中來,但有些時(shí)候,是自己真的發(fā)現(xiàn)了需求。”微軟亞洲研究院主管研究員閆峻說。近幾年,他一直在負(fù)責(zé)一支5個(gè)研究員組成的知識(shí)挖掘團(tuán)隊(duì)。

  去年,閆峻在北京一家醫(yī)院接受了一個(gè)外科手術(shù)。他了解到,一個(gè)普通外科醫(yī)生一天可能進(jìn)行10例手術(shù),醫(yī)生資源不夠用,無法解答每個(gè)康復(fù)期病人的困惑。這激發(fā)他進(jìn)行一項(xiàng)基于知識(shí)挖掘的醫(yī)療項(xiàng)目,以解決醫(yī)院生產(chǎn)力的問題。他選擇在北京和沈陽(yáng)的醫(yī)院進(jìn)行試點(diǎn),并同時(shí)與產(chǎn)品部門保持密切聯(lián)系,讓后者及時(shí)得到用戶需求的趨勢(shì)。

  理想的模型是,醫(yī)院里有一個(gè)機(jī)器人,或者是存在于病患手機(jī)中的一個(gè)App中,病患的所有問題都能通過這個(gè)機(jī)器人得到回復(fù)。去年年底開始,閆峻通過讓機(jī)器模擬人類學(xué)習(xí)的四個(gè)階段來獲取這些專業(yè)知識(shí)。閆峻介紹稱,即使在最簡(jiǎn)單的第一階段,也需要運(yùn)用到知識(shí)挖掘的技術(shù)——在這個(gè)階段,機(jī)器可以從一些網(wǎng)頁(yè)上抓取疾病可能存在的癥狀,然后捕捉那些在論壇上活躍醫(yī)生的問答。

  據(jù)閆峻團(tuán)隊(duì)統(tǒng)計(jì),一個(gè)外科醫(yī)生一年之內(nèi),能在不同論壇里回答幾十到幾千個(gè)問題。而網(wǎng)絡(luò)針對(duì)同一疾病可能有幾萬個(gè)不同問題,最后通過機(jī)器的知識(shí)挖掘,可以總結(jié)出用戶實(shí)際上在問的最本質(zhì)的問題,針對(duì)一個(gè)疾病這樣的問題可能只有80多個(gè)。

2016062511.jpg

  閆峻

  除了機(jī)器學(xué)習(xí)和知識(shí)挖掘之外,沈向洋鼓勵(lì)亞洲研究院的中國(guó)研究員們?cè)谏疃壬窠?jīng)網(wǎng)絡(luò)研究領(lǐng)域投入力量。這個(gè)領(lǐng)域的研究屬于人工智能深度學(xué)習(xí)。“這個(gè)領(lǐng)域的意義在于,幾年內(nèi),計(jì)算機(jī)在感知上的能力就會(huì)超越人類。再過5到10年,圖像識(shí)別上計(jì)算機(jī)就可以比人類更厲害。到時(shí)候,當(dāng)識(shí)別這是個(gè)什么瓶子、是哪個(gè)牌子的瓶子時(shí),人工智能就能比人更清楚。”沈向洋說。

  人工智能要達(dá)到這樣的能力,還有很遠(yuǎn)的路要走。沈向洋明白,如果“人工智能”之父阿蘭.圖靈活到今天,可能會(huì)對(duì)人工智能過去60年的發(fā)展感到失望——即便是最近獲得極大關(guān)注的Alpha Go,它可以在圍棋上取勝,卻玩不了高級(jí)撲克,因?yàn)樗€看不懂人類的虛張聲勢(shì)。不過,對(duì)沈向洋的團(tuán)隊(duì)而言,這倒也是機(jī)會(huì),畢竟,至少現(xiàn)在他們的人工智能技術(shù)可以用來叫Pizza外賣了。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。