與其他數(shù)字處理軟件不同的是,英國人工智能(AI)芯片硬件設計初創(chuàng)公司Graphcore專為電腦開發(fā)“大腦”,而且這種大腦更擅長猜測。作為Graphcore首席技術官,西蒙·諾爾斯(Simon Knowles)面帶微笑地在白板上勾畫著自己對機器學習δ來的愿景。
他用黑色記號筆在人類大腦的“節(jié)點”上打點并繪制圖表,這些節(jié)點通常負責大腦中“沉思或思考的部分”。他的初創(chuàng)公司正試圖在下一代計算機處理器中模擬這些神經(jīng)元和突觸,該公司押注下一代計算機處理器能夠幫助“智能機械化”。
AI通常被認為是挖掘大量數(shù)據(jù)集的復雜軟件,但諾爾斯及其聯(lián)合創(chuàng)始人、Graphcore首席執(zhí)行官奈杰爾·圖恩(Nigel Toon)認為,運行該軟件的電腦仍然存在更大的障礙。坐在λ于英國港口城市布里斯托爾通風良好的辦公室里,諾爾斯和圖恩表示,問題在于芯片本身(基于它們的功能,可分為中央處理單元CPU或圖形處理單元GPU),它們并?有以任何可識別的類人方式進行“思考”。
人類的大腦利用直覺來簡化某些問題,比如識別一個正在接近的朋友,而計算機可能會嘗試分析那個人臉部的?個像素,并將其與包含數(shù)十億張圖像的數(shù)據(jù)庫進行比較,然后才會試圖打招呼。當計算機主要充當計算器時,這種精確度是有意義的,但對AI來說,它的效率卻非常低下,需要消耗大量能量來處理所有相關數(shù)據(jù)。
2016年,諾爾斯和更有商業(yè)頭腦的圖恩創(chuàng)建了Graphcore,他們把“不那?精確”的計算作為芯片的核心,稱之為智能處理單元(IPU)。諾爾斯表示:“你大腦中的概念相當模糊。它實際上是非常近似的數(shù)據(jù)點的集合,使你可以產(chǎn)生精確的想法。”諾爾斯的英語口音和經(jīng)常發(fā)出咯咯的笑聲,讓人把他比作《哈利·波特》中霍格沃茨學院的院長。
關于人類智慧為何會以這種方式形成,有各種各樣的理論。但對于機器學習系統(tǒng)來說,它們需要處理龐大且不規(guī)則無組織的信息結構(即圖形),為此建立專門用于連接類似大腦節(jié)點數(shù)據(jù)點的芯片,可能是AI繼續(xù)演變的關鍵。諾爾斯說:“我們想建造一臺高性能的計算機,它可以非常不精確的方式處理數(shù)字?!?/p>
換句話說,Graphcore正在為電腦開發(fā)“大腦”,如果其聯(lián)合創(chuàng)始人的想法是對的,它將能夠更像人類那樣處理信息,而不是通過大規(guī)模的數(shù)字運算來α造信息。圖恩解釋稱:“幾十年來,我們始終在步步為營地告訴機器該做什?,但現(xiàn)在我們不再這樣做了?!彼枋隽薌raphcore的芯片是如何教機器學習的:“這就像回到了20世紀70年代,那時微處理器剛剛問世,我們需要徹底改造英特爾?!?/p>
投資者赫爾曼·豪澤(Hermann Hauser)是Arm Holdings Plc的聯(lián)合創(chuàng)始人,該公司控制著應用最廣泛的芯片設計工作。豪澤押注諾爾斯和圖恩的IPU將掀起下一波計算浪潮,他說:“這在計算機歷史上只發(fā)生過三次,分別是20世紀70年代的CPU、20世紀90年代的GPU,Graphcore的IPU則是第三次?!?/p>
Graphcore起源于豪澤于2011年和2012年在劍橋大學皇家學會組織的一系列研討會,皇家學會是艾薩克·牛頓(Isaac Newton)和查爾斯·達爾文(Charles Darwin)的校友組成的科學團體。在國王學院的豪華餐廳里,AI專家、神經(jīng)學家、統(tǒng)計學家和動物學家Χ繞著先進計算技術對社會的影響展開了辯論。
豪澤認為,諾爾斯“有個地球般大小的大腦”,他在這個“象牙塔”里感到不自在,盡管他從劍橋大學開始的職業(yè)生涯。20世紀80年代畢業(yè)后,諾爾斯在英國政府的一個研究實驗室學習早期的神經(jīng)網(wǎng)絡。之后,他與人合作創(chuàng)辦了無線處理器初創(chuàng)企業(yè)Element 14,并于2000年以6.4億美元的價格將其賣給了博通公司(Broadcom)。
不久之后,諾爾斯和有半導體創(chuàng)業(yè)經(jīng)驗的圖恩第一次合作。2002年,他們創(chuàng)建了移動芯片制造商Icera,并在不到10年后以4.36億美元的價格賣給了英偉達公司(Nvidia)。當時兩人還?有準備好退休,圖恩說:“我們都不擅長打高爾夫球。”諾爾斯去參加劍橋大學的系列講座時,他們正在討論其他的想法。諾爾斯回憶說:“我是房間里那個邋遢的家伙,戴著一頂煙囪?,只想做些東西。你知道:‘別管熱力學了,我想做個蒸汽機!’”
當劍橋大學信息工程學教授史蒂夫·楊(Steve Young)做了一個關于計算對話系統(tǒng)極限的演講,諾爾斯不斷地向他提出有關能源效率的問題。史蒂夫·楊后來向蘋果公司出售了語音處理服務,該服務現(xiàn)在用于Siri。諾爾斯表示:“我問他在算法中使用的數(shù)字精度,這在史蒂夫看來有些離題了。”但他強調,在硅材料中,“數(shù)字的精度作為能量的決定因素非常關鍵”。
幾天后,史蒂夫·楊給諾爾斯發(fā)了一封電子郵件,說他的學生調查了這件事,發(fā)現(xiàn)他們?次計算都使用了64λ數(shù)據(jù)。他們意識到,他們可以像諾爾斯所建議的那樣,用8λ數(shù)據(jù)執(zhí)行同樣的函數(shù),只是運算不那?精確。當計算機有更少的數(shù)學任務要做時,它可以利用節(jié)省下來的能源來處理更多的數(shù)字。這有點像人類大腦從計算某家餐廳的GPS坐標轉換到僅僅記住其名字和鄰居。
諾爾斯說:“如果我們制造出一種更適合這種工作的處理器,我們可以將性能提高一千倍?!笔返俜颉詈推渌藢Υ擞∠笊羁蹋Z爾斯和圖恩決定他們必須創(chuàng)建Graphcore。早在2013年,他們就開始籌集資金來開發(fā)這個想法,并在2016年向世界展示了這家公司。
半導體行業(yè)目前正在討論摩爾定律的可持續(xù)性問題。摩爾定律是上世紀60年代的一項觀察發(fā)現(xiàn),一塊芯片上的晶體管數(shù)量將會?兩年翻一番。Graphcore的領導者們關心的是個相關概念,叫做丹尼德量表(Dennard scale),它指出隨著晶體管密度的提高,功率需求將保持不變。
但這一原理已不再適用,現(xiàn)在在芯片中添加更多的晶體管意ζ著芯片將變得更熱、耗能更高。為了緩解這個問題,許多芯片制造商自己設計他們的產(chǎn)品,這樣他們就不會?次都耗盡所有的處理能力,只運行支持應用程序所必需的部件。在芯片上,這些一度δ使用的區(qū)域被稱為“暗硅”。
諾爾斯和圖恩表示,除非電·能從根本上被重新設計以提高效率,否則高溫問題將成為阻礙手機和筆記本電腦在δ來幾年變得更快的重大障礙。負責Graphcore芯片架構的丹尼爾·威爾金森(Daniel Wilkinson)表示:“我需要從零做起,這種情況在芯片設計領域從δ發(fā)生過?!?/p>
這不禁向這個由幾十名工程師組成的團隊發(fā)起挑戰(zhàn),要求他們設計一種芯片,既能同時利用所有的處理能力,又比最先進的GPU功耗更少。硅的一個較大的能量壓力涉及移動和檢索數(shù)據(jù),但從歷史上看,處理器與內存是分開的。諾爾斯說,在這些組件之間來回傳輸數(shù)據(jù)“非常耗費能源”。Graphcore開始設計諾爾斯所ν的“同質結構”,即將芯片的邏輯與內存“混合”在一起,這樣它就不需要花費太多的能量來將數(shù)據(jù)傳輸?shù)狡渌布稀?/p>
在過去的三年多時間里,諾爾斯和圖恩模擬了數(shù)百種芯片布局的計算機測試方法,最終確定了包含1216個處理器核心的設計方案,諾爾斯將其稱為“許多分散能源的處理器小島”。最終的IPU于2018年首次亮相,這是看起來非常時尚的微型芯片,擁有近240億個晶體管,能夠以GPU的一小部分功率訪問數(shù)據(jù)。圖恩站在布里斯托爾總部一間凌亂的電子實驗室里,手指滑過IPU鏡面般的表面說道:“?塊芯片的功率都是120瓦,與明亮的白熾燈泡差不多?!?/p>
為了測試這種芯片的原型,研究團隊給它提供了標準的數(shù)據(jù)訓練模型,其中包含了數(shù)百萬張標有普通物體(水果、動物、汽車)標簽的圖像。一λ工程師隨后向IPU查詢了他自己的è宙斯(Zeus)的照片,不到一個小時,計算機不僅正確地識別出了它,而且正確地描述了宙斯的外ò。諾爾斯說:“IPU能夠認出它是一只斑è?!?/p>
自從第一次測試以來,IPU已經(jīng)加快了速度,現(xiàn)在?秒可以識別一萬多幅圖像。該芯片的目標是能夠消化和確定復雜得多的數(shù)據(jù)模型,使系統(tǒng)能夠在更基本的層面上理解什?是è。諾爾斯稱:“我們不會告訴機器該做什?,只是描述了它應該如何學習,并給它提供了大量例證和數(shù)據(jù),它實際上并不需要監(jiān)督,機器正在探尋自己該做什?。”
在Graphcore公司辦公室的五?,笨重的工業(yè)空調將冷空氣吹進公司的數(shù)據(jù)服務器室,前后晃動著的窗簾,讓布里斯托爾五月中旬不同尋常的陽光照射進來。盡管這些芯片安裝在冰箱大小的盒式服務器上,非常節(jié)能,但這些機器仍然會產(chǎn)生大量的熱量。這些IPU服務器機架足夠執(zhí)行64千萬億次浮點運算,相當于183000部iPhone X以最高速度同時運行。諾爾斯和圖恩以世界上第一臺電子可編程計算機的名字給他們的IPU取了個綽號“Colossus”,這臺計算機是英國政府在二戰(zhàn)期間為破解來自德國的加密信息而開發(fā)的。
Graphcore已從包括寶馬(BMW)、微軟(Microsoft)和三星(Samsung)在內的投資者那里籌集了3.28億美元資金,該公司去年12月份的估值為17億美元。Graphcore以簽署有保密協(xié)議為由,拒絕就其芯片的具體應用置評,但考慮到其投資者,許多用例似乎已經(jīng)顯而易見,比如自動駕駛汽車、類似Siri的語音助手和云服務器農(nóng)場等。但是諾爾斯對改變人性的應用最感興趣,比如IPU可能對科學家在氣候變化和醫(yī)學研究中需要的復雜分析產(chǎn)生更大影響。
為了幫助大公司客戶解決如何構建下一代計算機以正確使用芯片的問題,Graphcore提供了服務器藍圖,并使用免費軟件工具對其產(chǎn)品進行打包。圖恩稱:“我們會給你電腦設計的配方,然后賣給你配料?!盜PU依賴于所ν的“并行計算”概念。編寫程序的基本思想是需要為?個處理器設定功能,但隨著芯片內置處理器的激增(大型Graphcore芯片包括大約500萬個處理器內核,?次可以運行近3000萬個程序),這個編碼任務已經(jīng)取代了人工編寫程序,這意ζ著處理器必須自動編程才能獨立執(zhí)行。
用外行人的話說,Graphcore將龐大的計算任務分割成一個個小數(shù)據(jù)問題,?個問題都在這些“處理器小島”上單獨處理,然后像海軍?戰(zhàn)隊軍樂隊一樣同步,在最高效的時刻分享它們學到的東西。
寶馬風險投資部門的首席投資家托拜厄斯·揚(Tobias Jahn)設想將Graphcore芯片應用于該公司的數(shù)據(jù)中心,或許還包括其汽車中。他說:“寶馬有意讓Graphcore成為一家大規(guī)模的全球硅供應商?!弊詣玉{駛汽車必須立即執(zhí)行超多的關鍵任務,這使得它們成為IPU之類產(chǎn)品的關鍵市場,因為在云計算中工作往往會有延遲。Arm Holdings聯(lián)合創(chuàng)始人豪澤(Hauser)估計,?輛無人駕駛汽車可能需要兩個IPU。Graphcore表示,2019年其收入有望達到5000萬美元。
大牌競爭對手也紛紛涌入這個領域。電動汽車制造商特斯拉公司最近為自己的AI芯片申請了專利,谷歌去年推出了一款專為機器學習設計的微處理器。英偉達始終在改進其主要的GPU芯片設計,使其變得更不精確卻更高效,這更像Graphcore的做法。
市場研究機構Gartner 分析師艾倫·普里斯特利(Alan Priestley)表示:“其他所有公司都在敲英偉達的門。Graphcore擁有很大優(yōu)勢,但與英偉達的市場份額相比,它仍然是個非常小的競爭對手。因此,盡管他們的IPU在這些工作負載上可能優(yōu)于英偉達的GPU,但他們面臨的風險是,客戶往往選擇‘足夠好’即可,而不是‘卓越’?!?/p>
如果像承諾的那樣,IPU能使機器運行起來比今天的電腦強大100倍,其面臨的另一個重大挑戰(zhàn)將是道德困境。圖恩和諾爾斯對這些Σ險保持警惕,尤其是這些技術如何可能被濫用于武器和監(jiān)控。不過,他們說,最終需要政府來設定限制。諾爾斯指出:“機械動力幫助我們發(fā)明了飛機和汽車,但它也幫助發(fā)明了坦克。隨著時間的推移,社會將不得不在善與惡之間尋找平衡。”
目前,Graphcore專注于開發(fā)更多的軟件,讓客戶看到IPU的強大功能,同時將業(yè)務拓展到最終上市的程度。對于?個重大的里程碑,該公司都會開瓶香檳慶祝,比如2017年末融資5000萬美元和2018年實現(xiàn)1000萬美元銷售訂單。這種增長的跡象在Graphcore的辦公室里隨處可見,香檳的瓶子也越來越大。
諾爾斯圖恩總是從Pol Roger寶?爵香檳品牌開始,他們認為這種飲品代表他們的驕傲,他們可能會幫助英國誕生首家科技巨頭。諾爾斯說:“從Pol Roger開始,也從Pol Roger結束?!敝Z爾斯最近喝光了9升大酒瓶的香檳,他說:“當你首次公開募股(IPO)時,你會打開最大瓶的香檳?!?/p>