前不久,Google的CEO桑達(dá)爾·皮查伊在接受Forbes專訪時,非常明確地指出了:Google將在一切服務(wù)和設(shè)備中,或早或晚地采用人工智能技術(shù)。
Back Channel的一篇來自Steven Levy的文章描述了Google從培訓(xùn)、雇傭、管理、技術(shù)等各個方面的措施和轉(zhuǎn)變,并且介紹了機(jī)器學(xué)習(xí)在Google崛起的歷史、克服的阻力、以及勢不可擋的未來。
Google正在打造機(jī)器學(xué)習(xí)的“忍者團(tuán)隊(duì)”
Carson Colgate,一名Google機(jī)器學(xué)習(xí)隊(duì)伍的新成員。她正在訓(xùn)練自己成為一名“忍者”。
她今年26歲,之前已經(jīng)在跆拳道里拿過一個二級的黑帶。這次,她要做的是在算法上成為一名“忍者”。她在Google的Android部門擔(dān)任工程師,現(xiàn)在則被收錄到Google內(nèi)部的一個機(jī)器學(xué)習(xí)“忍者項(xiàng)目”。這個項(xiàng)目只招收了18個人,這18個人卻都是Google各個產(chǎn)品部門的精英。他們將要把學(xué)習(xí)到的人工智能技巧,用于打造他們各自負(fù)責(zé)的產(chǎn)品。
在Google負(fù)責(zé)內(nèi)部機(jī)器學(xué)習(xí)、管理此“忍者項(xiàng)目”的產(chǎn)品經(jīng)理Christine Robson說:“這個項(xiàng)目邀請Google全公司對機(jī)器學(xué)習(xí)感興趣的工程師,與機(jī)器學(xué)習(xí)團(tuán)隊(duì)一起學(xué)習(xí)6個月,跟導(dǎo)師取取經(jīng),做一些項(xiàng)目,然后開展和實(shí)施項(xiàng)目,從中學(xué)習(xí)經(jīng)驗(yàn)和教訓(xùn)。”
Carson Colgate
很多年來,機(jī)器學(xué)習(xí)被認(rèn)為是一個只有技術(shù)精英才懂的技術(shù)專項(xiàng)。但是現(xiàn)在,機(jī)器學(xué)習(xí)成為了將人類智慧與電腦智慧結(jié)合在一起的不二途徑。Google致力于在公司內(nèi)部制作多一點(diǎn)機(jī)器學(xué)習(xí)的“精英”,甚至想要讓機(jī)器學(xué)習(xí)成為工程師的常規(guī)技巧。
Google是一個龐大的公司,六萬個雇員里面,有將近一半都是工程師。對比之下,這個目前只有18個人的機(jī)器學(xué)習(xí)忍者項(xiàng)目,實(shí)在很小。但是這個項(xiàng)目表明了Google一個認(rèn)知上的轉(zhuǎn)變——機(jī)器學(xué)習(xí)已經(jīng)成為最受重視的新方向之一。
雖然Google一直都有采用機(jī)器學(xué)習(xí)的技術(shù),也一直致力于雇傭這個領(lǐng)域的人才,但是直到2016年,Google才開始執(zhí)迷于機(jī)器學(xué)習(xí)這項(xiàng)科技。去年年末,Google的總裁Sundar Pichai就說出了Google的新態(tài)度:
“機(jī)器學(xué)習(xí)是一個核心的、轉(zhuǎn)變式的改變,它將改變我們做每一件事的方式和想法。我們有目的地在我們的各項(xiàng)產(chǎn)品中運(yùn)用機(jī)器學(xué)習(xí),無論是搜索,廣告,You Tube,還是Play。我們目前所處的階段還早,但是你會看到我們一個系統(tǒng)性、規(guī)模性的進(jìn)展——我們將在眾多的領(lǐng)域使用機(jī)器學(xué)習(xí)。”
因而這個邏輯很清晰:如果Google真的想要在全線的產(chǎn)品中運(yùn)用機(jī)器學(xué)習(xí),它的工程師也必須掌握機(jī)器學(xué)習(xí)的技巧,這個技巧將和傳統(tǒng)的編程很不同。正如知名的機(jī)器學(xué)習(xí)宣言《高超算法》一書的作者Pedro Domingos所言:
“機(jī)器學(xué)習(xí)確實(shí)是太陽底下的新鮮事:它將自己建造(和實(shí)現(xiàn))自己?!?/p>
機(jī)器學(xué)習(xí)是如何在Google崛起的?
Jeff Dean,Google的神級人物,正在帶領(lǐng)Google轉(zhuǎn)向機(jī)器學(xué)習(xí)的時代。
做好機(jī)器學(xué)習(xí),意味著辨識正確的數(shù)據(jù),選擇正確的算法,并且確保所有的其他條件都正確,才能成功。
Jeff Dean,Google軟件部的神級人物,如今帶領(lǐng)著機(jī)器學(xué)習(xí)團(tuán)隊(duì),建造各種工具,幫助Google工程師加深機(jī)器學(xué)習(xí)的技能。根據(jù)他的預(yù)測:今天Google25000個工程師中,只有幾千個工程師精通于機(jī)器學(xué)習(xí)。而Jeff Dean的愿景是:所有的Google工程師都要懂得機(jī)器學(xué)習(xí)的一些知識?!拔覀儗⒁獓L試實(shí)現(xiàn)這個目標(biāo)?!?/p>
John Giannandrea一直以來都在Google內(nèi)部提倡機(jī)器學(xué)習(xí)的重要性,而時代造英雄,在Google的機(jī)器學(xué)習(xí)時代,Giannandrea成為了搜索業(yè)務(wù)的負(fù)責(zé)人。但是當(dāng)他2010年剛到公司的時候,他并沒與多少機(jī)器學(xué)習(xí)的經(jīng)驗(yàn)。2011年的時候,他在一個會議上得知“神經(jīng)信息處理系統(tǒng)”(Neural Information Processing Systems,NIPS),從此欲罷不能。
從此,每一年,NIPS都使用機(jī)器學(xué)習(xí)創(chuàng)造著科技界的神話,解決著如翻譯、聲音辨識、或者視覺辨識等諸多領(lǐng)域的難題。Giannandrea回憶道當(dāng)時參加這個NIPS會議的時候,這個會議非常不知名,“但是這個領(lǐng)域在學(xué)術(shù)和科技界都在過去三年高速成長。去年參會者達(dá)到了6000人。”
不只是Giannandrea認(rèn)為機(jī)器學(xué)習(xí)將會成為科技的核心。Google內(nèi)部的機(jī)器學(xué)習(xí)擁護(hù)者越來越多。比如,Google Brain的聯(lián)合創(chuàng)始人Dean,他曾在Google X負(fù)責(zé)一個神經(jīng)網(wǎng)絡(luò)的研究計(jì)劃。這些在Google進(jìn)行的機(jī)器學(xué)習(xí)運(yùn)動,說明了Google對計(jì)算機(jī)的決心和信心。
Jeff Dean
如今在機(jī)器學(xué)習(xí)領(lǐng)域最領(lǐng)先的為“深度學(xué)習(xí)”算法,這個算法的模型由人腦啟發(fā),建立在復(fù)雜的神經(jīng)網(wǎng)絡(luò)之上。Google Brain以及Google在2014年1月以5億美元收購的Deep Mind,都在深度學(xué)習(xí)這一塊集中力量開發(fā)。Deep Mind開發(fā)了Apha Go,并在圍棋比賽中將人類的冠軍打敗了,這件事激發(fā)了人類對人工智能深深的恐懼。Giannandrea覺得人工智能絕對不會把人類趕盡殺絕或者取代人類,但是,它將要深刻地變革我們生活的每一個方面。
機(jī)器學(xué)習(xí)的概念在Google絕不是新鮮事。Google的創(chuàng)始人一直以來相信人工智能的力量。十年前,Google已經(jīng)開始在公司內(nèi)部給工程師教授機(jī)器學(xué)習(xí)的課程。2005年的時候,研究科學(xué)家Peter Norvig開始在每周三在43號樓給感興趣的Google工程師講授機(jī)器學(xué)習(xí)。課程如此受歡迎,以至于在Bangladesh的工程師熬夜到凌晨,只為了遠(yuǎn)程打個電話過來一起聽課。而2013年,整個Google都意識到了機(jī)器學(xué)習(xí)的重要性。
隨著機(jī)器學(xué)習(xí)的重要性在Google內(nèi)部崛起,Jeff Dean也開始認(rèn)真思考:
“在過往,我們可能會使用機(jī)器學(xué)習(xí),去改善系統(tǒng)的某幾個方面。但現(xiàn)在我們真的是要用機(jī)器學(xué)習(xí)去取代整個舊的系統(tǒng)?!?/p>
機(jī)器學(xué)習(xí)正在讓產(chǎn)品有著以往不可想象的新功能。比如去年11月發(fā)布的Gmail上的智能回復(fù)功能,就是緣起于Google Brain與Gmail團(tuán)隊(duì)的一次對話。Google一直鼓勵著這種合作,讓這兩個團(tuán)隊(duì)保持密切的聯(lián)系。
傳統(tǒng)的對人工智能語言的理解是:人們需要將語言的規(guī)則嵌入到系統(tǒng),但是在Gmail的智能回復(fù)中,這個系統(tǒng)擁有足夠多的數(shù)據(jù),它自己就可以學(xué)習(xí)和完善自己。
不過當(dāng)這個團(tuán)隊(duì)在開始測試智能回復(fù)的時候,這個軟件有一個很詭異的問題:它總是在建議一些不太符合場合的浪漫性的回復(fù)。當(dāng)它感到困惑的時候,它就會開始說:我愛你。這不是什么軟件上的故障。這個錯誤可能就是它從人類行為中學(xué)習(xí)而來的:如果你處于不知所措或者困窘的狀態(tài),說“我愛你”是個很好的防范策略。
克服重重阻力,機(jī)器學(xué)習(xí)滲透到了搜索算法中
自從去年11月發(fā)布智能回復(fù)之后,GmailInbox應(yīng)用的用戶就可以選擇三個自動生成的回復(fù),而且這些自動生成的回復(fù)準(zhǔn)確性一般很高?,F(xiàn)在,從手機(jī)移動端的Gmail用戶發(fā)出的回復(fù)中,十分之一都是由機(jī)器學(xué)習(xí)系統(tǒng)創(chuàng)造的。Gmail的成功只是Google成功運(yùn)用機(jī)器學(xué)習(xí)的一個極小的例子。
但是當(dāng)機(jī)器學(xué)習(xí)被運(yùn)用到搜索功能,這就是極大的轉(zhuǎn)折點(diǎn)了。一直以來,搜索都有運(yùn)用到機(jī)器學(xué)習(xí),但是很多年以來,這個公司最重要的搜索算法,都被認(rèn)為太過于神圣,而不能被機(jī)器學(xué)習(xí)算法所玷污。機(jī)器學(xué)習(xí)對于搜索的作用,一直都受到懷疑。
這種懷疑,部分源自于一種文化上的抵抗:一直以來,高超的黑客們都想要對程序有完全的掌控,而機(jī)器學(xué)習(xí)難免有點(diǎn)太禪意般的“放任自流”。Amit Singhal是一個經(jīng)驗(yàn)豐富的搜索工程師,是傳奇式的電腦科學(xué)家Gerald Salton的學(xué)徒,Singhal當(dāng)年修改了Google創(chuàng)始人布林和佩奇的編程作業(yè),讓他們的程序變?yōu)榭梢粤炕瘮U(kuò)大的工具。Singhai對于把機(jī)器學(xué)習(xí)并入搜索算法,曾經(jīng)抱著懷疑的態(tài)度。Google的工程師David Pablo Cohn證實(shí)當(dāng)時他們用機(jī)器學(xué)習(xí)提高搜索的沮喪的嘗試:
“Amit Singhai的算法當(dāng)時是世界上最棒的,我們只能通過復(fù)制他的想法來做好。當(dāng)時我們找不到任何比他的方法要好的東西。”
Greg Corrado為Google Brain的聯(lián)合創(chuàng)始人
到2014年早期的時候,Google的機(jī)器學(xué)習(xí)專家們繼續(xù)挑戰(zhàn)這種局面。結(jié)果,機(jī)器學(xué)習(xí)團(tuán)隊(duì)的實(shí)驗(yàn)成為了搜索的一個核心部分:通過看用戶是否點(diǎn)擊了搜索詞條,來判斷搜索呈現(xiàn)的結(jié)果是否更好地匹配搜索的詞條。
如今,機(jī)器學(xué)習(xí)所建立的搜索匹配的成果Rank Brain,已經(jīng)是搜索算法的一部分。Rank Brain于2015年4月的時候上線。Google一直以來對于搜索功能如何運(yùn)作都是閃乎其辭,但是Jeff Dean很明確地說:
“Rank Brain這個機(jī)器學(xué)習(xí)的產(chǎn)物在每一次檢索中都發(fā)揮作用,并且在大部分的檢索中影響著排名?!?/p>
并且,這個機(jī)器學(xué)習(xí)的算法證明是非常有效的。每一次的Google搜索都要用上幾百個信息點(diǎn)(比如,用戶所處的地理位置,以及頁面的標(biāo)題是否與搜索詞條匹配),而Rank Brain提供的信息點(diǎn),是所有信息點(diǎn)中的重要性排在了第三。
打敗了傳統(tǒng)編程后,機(jī)器學(xué)習(xí)該如何在Google普及
Christine Robson是Google內(nèi)外機(jī)器學(xué)習(xí)活動的組織者和帶動者。
機(jī)器學(xué)習(xí)在搜索中獲得成功,對于Google而言非常重要,這讓很多人開始真的注意起機(jī)器學(xué)習(xí)來。而華盛頓大學(xué)的教授Pedro Domingos用更直白的語言說:
“一直以來,在傳統(tǒng)編程者與機(jī)器學(xué)習(xí)者之間都存在著一場戰(zhàn)爭。結(jié)果機(jī)器學(xué)習(xí)者在戰(zhàn)斗中獲勝了?!?/p>
Google目前的挑戰(zhàn)是要將他們的工程師隊(duì)伍過渡到機(jī)器學(xué)習(xí)的隊(duì)伍,不要求每個人都熟悉掌握機(jī)器學(xué)習(xí),但起碼需要熟悉機(jī)器學(xué)習(xí)。不僅Google在這么做,很多其他的公司(比如Facebook)都在積極邁進(jìn)機(jī)器學(xué)習(xí)的時代。Google正在各個名校的機(jī)器學(xué)習(xí)領(lǐng)域搶奪人才。Google也即將在蘇黎世開設(shè)一個機(jī)器學(xué)習(xí)研究中心,搶奪機(jī)器學(xué)習(xí)人才的戰(zhàn)爭,延伸到了歐洲。
基于目前學(xué)術(shù)界并沒有造出很多的機(jī)器學(xué)習(xí)人才,保持這方面的人才就顯得至關(guān)重要。在Google,這并不是易事。因?yàn)榇蟛糠值捻敿壒こ處熞惠呑佣纪ㄟ^傳統(tǒng)的編程取得成就。但是機(jī)器學(xué)習(xí)所要求的,是全新的思維。編程者一般通過對編程的控制來進(jìn)行創(chuàng)造,但是機(jī)器學(xué)習(xí)要求掌控的是某些具體類型的數(shù)學(xué)和統(tǒng)計(jì)學(xué),但是這些領(lǐng)域的知識,甚至對于一些頂級的、可以解決復(fù)雜問題的工程師而言,都是陌生的,他們之前也根本不愿意學(xué)。
Christine Robson正在致力于給Google的工作人員創(chuàng)造更好的機(jī)器學(xué)習(xí)的環(huán)境:
“機(jī)器學(xué)習(xí)與靜止不變的編程不同:你要經(jīng)常給它提供新數(shù)據(jù),我們要一直更新模型,一直學(xué)習(xí),要一直添加更多的數(shù)據(jù),一直轉(zhuǎn)變我們預(yù)測的方式。機(jī)器學(xué)習(xí)就像是一個活生生的、會呼吸的家伙,它和傳統(tǒng)的計(jì)算機(jī)編程完全不同?!?/p>
但是,Google對訓(xùn)練工程師學(xué)會機(jī)器學(xué)習(xí)的前景是樂觀的:如今在機(jī)器學(xué)習(xí)中使用的數(shù)學(xué)不算太復(fù)雜,大部分Google的工程師都可以學(xué)會。Google并且建造了類似Tensor Flow的工具,幫助工程師學(xué)習(xí)機(jī)器學(xué)習(xí)。Tensor Flow也為Google在雇用人才方面增加了吸引力。當(dāng)Google開設(shè)Tensor Flow公開課時,有75000人報(bào)名參加。
目前Google最大的任務(wù),就打造更多可以完善這些機(jī)器學(xué)習(xí)工具的人才。他們也在內(nèi)部建立了大量的機(jī)器學(xué)習(xí)的課程,“下一次的課程,已經(jīng)有好幾千的工程師報(bào)名參加?!盝effDean說。
毫無疑問,機(jī)器學(xué)習(xí),將會是Google一個重大的發(fā)展方向。我們的未來,將會是一個機(jī)器學(xué)習(xí)和人工智能的未來。