作為機器學(xué)習(xí)的領(lǐng)軍人物,Yann LeCun(楊立昆)曾在 25 年前開發(fā)過一塊名為 ANNA 的人工智能芯片。而現(xiàn)在,構(gòu)建適用于深度學(xué)習(xí)的計算芯片已成為所有科技巨頭共同的發(fā)展目標(biāo)。
那是 1992 年,LeCun 還供職于貝爾實驗室,這座位于紐約市郊的研發(fā)機構(gòu)舉世聞名。他和一群研究者們共同設(shè)計了一種適用于進行深度神經(jīng)網(wǎng)絡(luò)計算的芯片 ANNA,用于高效處理需要分析大量數(shù)據(jù)的復(fù)雜任務(wù),但 ANNA 從未投入市場。隨后的二十多年里,神經(jīng)網(wǎng)絡(luò)隨著計算機性能的不斷提升,開始在識別文字、人臉和語音等任務(wù)中達到甚至超越了人類水平。但人工智能還遠沒有達到威脅人類智能的水平,那些用于特定任務(wù)的算法,在執(zhí)行其他種類任務(wù)的時候,不會產(chǎn)生任何有意義的結(jié)果。
盡管如此,今天的神經(jīng)網(wǎng)絡(luò)還是在重塑著所有科技公司的面貌,谷歌、Facebook、微軟都在做著自己的改變。LeCun 現(xiàn)在已經(jīng)成為 Facebook 人工智能實驗室的主任。在那里,神經(jīng)網(wǎng)絡(luò)被用于識別人臉、標(biāo)注圖片中的事物、翻譯語言甚至更多。在 25 年后,LeCun 認為市場現(xiàn)在非常需要像 ANNA 這樣的芯片,很快,它們將大量涌現(xiàn)。
谷歌剛剛有了自己的人工智能芯片 TPU,這種芯片已經(jīng)廣泛用于谷歌的數(shù)據(jù)中心,成為其網(wǎng)絡(luò)帝國的引擎。每臺安卓手機的谷歌語音搜索指令都會經(jīng)由 TPU 處理。這只是芯片業(yè)巨大變革的開始,CNBC 等媒體 4 月 20 日 的報道指出,谷歌 TPU 的開發(fā)者們正在秘密成立的創(chuàng)業(yè)公司 Groq 重新集結(jié),開發(fā)類似的人工智能芯片;而傳統(tǒng)芯片廠商,如英特爾、IBM 和高通也在做著同樣的努力。
谷歌在本月初推出 TPU 時稱:「它是我們的第一塊機器學(xué)習(xí)芯片?!乖诠雀璋l(fā)表的論文中,TPU 在一些任務(wù)中的處理速度可達到英偉達 K80 GPU 與英特爾 Haswell CPU 的 15-30 倍。而在功耗測試中,TPU 的效率也比 CPU 和 GPU 高 30-80 倍(當(dāng)然,作為對比的芯片并不是最新產(chǎn)品)。
谷歌 TPU 芯片已經(jīng)成為其數(shù)據(jù)中心的重要組成部分
像谷歌、Facebook 和微軟這樣的科技巨頭當(dāng)然可以把自己的神經(jīng)網(wǎng)絡(luò)任務(wù)交給常規(guī)計算機芯片來處理(如 CPU),但 CPU 是設(shè)計用來處理所有類型任務(wù)的,這種方式顯得效率很低。當(dāng)使用特殊設(shè)計的芯片進行處理時,神經(jīng)網(wǎng)絡(luò)任務(wù)會運行得更快,消耗更少的電力。谷歌宣稱隨著 TPU 的應(yīng)用,它為谷歌節(jié)約的成本可以打造另外 15 個數(shù)據(jù)中心。而隨著谷歌、Facebook 等公司將神經(jīng)網(wǎng)絡(luò)應(yīng)用于手機和 VR 頭盔,為了減少延遲,在個人設(shè)備上的小型智能芯片也變得迫在眉睫了。「在更加高效的專業(yè)芯片方面,市場還有很大一片空白,」LeCun 說道。
技術(shù)巨頭
在收購了初創(chuàng)公司 Nervana 之后,英特爾正在打造一款機器學(xué)習(xí)專用芯片。IBM 也是,它正在創(chuàng)建一個可以映射(mirror)神經(jīng)網(wǎng)絡(luò)設(shè)計的硬件架構(gòu)。最近,高通已經(jīng)開始制造執(zhí)行神經(jīng)網(wǎng)絡(luò)的專用芯片,這條消息來自 LeCun,因為 Facebook 正幫助高通開發(fā)機器學(xué)習(xí)相關(guān)技術(shù)所以他對高通的計劃很了解;高通技術(shù)部副主席 Jeff Gehlhaar 證實了該計劃,他說:「在原型機研發(fā)方面,我們還有很多路要走?!?/p>
高通一直在和 Yann LeCun 在 Facebook AI 研究機構(gòu)的團隊保持合作,共同開發(fā)用于實時推理的新型芯片。高通最近宣布計劃花費 470 億美元收購荷蘭汽車芯片公司 NXP。在收購宣布之前,NXP 就在致力于解決深度學(xué)習(xí)和計算機視覺難題,看來高通希望借助收購加強自動駕駛系統(tǒng)的開發(fā)。
自動駕駛是深度學(xué)習(xí)與人工智能發(fā)揮作用的主要領(lǐng)域之一。除此之前,內(nèi)置芯片有很多其他選擇以與真實世界交互,比如手機和虛擬現(xiàn)實耳機。當(dāng)前技術(shù)發(fā)展飛快,我們很快就會看到其他實際應(yīng)用的出現(xiàn)。
很多公司想把握住這一藍海機遇,比如傳統(tǒng)芯片巨頭英特爾和 IBM。Big Blue 努力在其 Minsky 人工智能服務(wù)器中把 RISC 芯片和英偉達 GPU 結(jié)合起來的同時,其研究團隊也在探索其他芯片架構(gòu)。IBM Almaden 實驗室探討了其類腦芯片 TrueNorth 的性能,該芯片具備 100 萬個神經(jīng)元和 2.56 億個突觸。IBM 稱在若干個視覺和語音數(shù)據(jù)集中,TrueNorth 給出了接近當(dāng)前最高分類精確度的深度網(wǎng)絡(luò)。
IBM 研究院類腦計算首席科學(xué)家 Dharmendra Modha 在其博文中說道:「類腦計算的目標(biāo)是在不斷逼近時間、空間和能量的根本限制的情況下,給出可擴展的神經(jīng)網(wǎng)絡(luò)基礎(chǔ)(substrate)。」
作為芯片領(lǐng)域最大的玩家,英特爾并沒有止步不前,它也正在根據(jù)下一代人工智能工作需求開發(fā)自己的芯片架構(gòu)。去年,英特爾宣布其第一個人工智能專用硬件 Lake Crest(其技術(shù)基于 Nervana)將在 2017 年上半年推出,并在稍后接著推出 Knights Mill,它是 Xeon Phi 聯(lián)合處理器架構(gòu)的下一個迭代。
英偉達已成為人工智能硬件領(lǐng)域的主力軍之一。在谷歌、Facebook 等公司能夠使用神經(jīng)網(wǎng)絡(luò)翻譯語言之前,他們必須首先用特殊任務(wù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),給神經(jīng)網(wǎng)絡(luò)輸入現(xiàn)有的大量翻譯數(shù)據(jù)集。英偉達制造了可以加快這一訓(xùn)練進程的 GPU 芯片。LeCun 說,在訓(xùn)練方面,GPU 通??紤]的是市場,尤其是英偉達 GPU。但是 Farabet 的出現(xiàn)也許表明,英偉達正和高通一樣,也在探索一旦接受訓(xùn)練就可運行神經(jīng)網(wǎng)絡(luò)的芯片。
GPU 最初的設(shè)計初衷并非人工智能,而是圖形繪制。但是大約 5 年前,谷歌、Facebook 等公司開始使用 GPU 訓(xùn)練神經(jīng)網(wǎng)絡(luò),僅僅因為 GPU 是現(xiàn)有的最佳選擇。LeCun 相信 GPU 可以持續(xù)發(fā)揮這一作用,他說,現(xiàn)在程序員和公司對 GPU 相當(dāng)熟悉,他們具備使用 GPU 的所有工具;GPU 很難被替代,因為替代它需要換掉全部(整個生態(tài)系統(tǒng))。但是他也認為將會出現(xiàn)一種新型芯片,從數(shù)據(jù)中心和消費設(shè)備兩個方面,極大地改變大型公司運行神經(jīng)網(wǎng)絡(luò)的方式,從而,從手機到智能割草機再到真空吸塵器的一切也都將會改變。
正如谷歌 TPU 展示的,專用 AI 芯片可以將數(shù)據(jù)中心的運行效率提高到一個新的層次,特別是對于那些需要進行圖像識別的服務(wù)器。在執(zhí)行神經(jīng)網(wǎng)絡(luò)任務(wù)時,它們消耗更少的電力,發(fā)熱更小?!溉绻悴幌胱屢粋€池塘沸騰,你就需要特殊設(shè)計的硬件,」LeCun 說。
與此同時,隨著 VR 和 AR 技術(shù)的發(fā)展,手機與頭戴設(shè)備也需要同樣的芯片。Facebook 上周曾展示了它們的新型增強現(xiàn)實工具,而這種設(shè)備需要神經(jīng)網(wǎng)絡(luò)來對周圍環(huán)境進行識別。但增強現(xiàn)實系統(tǒng)的任務(wù)不能基于數(shù)據(jù)中心——傳送數(shù)據(jù)需要時間,延遲會破壞用戶體驗。正如 Facebook 首席技術(shù)官 Mike Schroepfer 所解釋的,F(xiàn)acebook 目前正在使用 GPU 和另一種被稱為數(shù)字信號芯片的設(shè)備處理這些任務(wù)。但從長遠來看,這些設(shè)備必須使用全新類型的芯片。
現(xiàn)在,需求已經(jīng)出現(xiàn),芯片公司正在爭相占領(lǐng)新的市場。