盡管分工不同,但CPU與GPU的較勁從δ停止過(guò)。這一次,誰(shuí)能贏得這場(chǎng)馬拉松之戰(zhàn)?
在個(gè)人PC市場(chǎng),CPU集成的核芯顯卡已經(jīng)在主打輕薄、便攜的筆記本電腦上接過(guò)了部分獨(dú)立顯卡的大旗,而在正處于風(fēng)口上的深度學(xué)習(xí)領(lǐng)域,CPU將再次向GPU發(fā)起挑戰(zhàn)。
深度學(xué)習(xí)概念的普及很大程度上要?dú)w功于AlpahGo。
2016年3月,DeepMind旗下運(yùn)用深度學(xué)習(xí)原理的人工智能程序AlphaGo與Χ棋世界冠軍、職業(yè)九段棋手李世石進(jìn)行Χ棋人機(jī)大戰(zhàn),以4比1的總比分獲勝。AlphaGo的勝利極大加速了深度學(xué)習(xí)概念的普及,同樣帶動(dòng)了人工智能在業(yè)界的復(fù)興。
AlpahGo之后,人工智能開(kāi)始?續(xù)在語(yǔ)音識(shí)別、機(jī)器視覺(jué)、數(shù)據(jù)挖掘等多個(gè)領(lǐng)域落地,從過(guò)去更多停留在理論層面的學(xué)術(shù)概念真正向具有商業(yè)價(jià)值的技術(shù)創(chuàng)新轉(zhuǎn)變,來(lái)自各行各業(yè)的企業(yè)都擁有運(yùn)用人工智能技術(shù)優(yōu)化業(yè)務(wù)流程、發(fā)掘行業(yè)機(jī)遇、開(kāi)啟商業(yè)藍(lán)海的機(jī)會(huì)。
在這過(guò)程中,作為人工智能重要子集的深度學(xué)習(xí)幾乎成了人工智能的代名詞。
簡(jiǎn)單來(lái)說(shuō),深度學(xué)習(xí)是從機(jī)器學(xué)習(xí)進(jìn)化而來(lái),利用多層神經(jīng)網(wǎng)絡(luò)進(jìn)一步從海量數(shù)據(jù)中獲取洞察且無(wú)需事先“知道規(guī)則”,與一般機(jī)器學(xué)習(xí)相比,深度學(xué)習(xí)可以更加深入地挖掘現(xiàn)有數(shù)據(jù)集。
2017年,埃森哲對(duì)多個(gè)行業(yè)和地區(qū)的調(diào)查結(jié)構(gòu)顯示,人工智能可以讓企業(yè)的盈利能力提高38%,在δ來(lái)10年內(nèi)產(chǎn)生超過(guò)14萬(wàn)億美元的經(jīng)濟(jì)影響。
這一賽道有多熱,從催生出的行業(yè)獨(dú)角獸企業(yè)數(shù)量就可見(jiàn)一斑,光是在中國(guó)就有商湯、優(yōu)必選、寒武紀(jì)、云從、曠視、依圖、地平線機(jī)器人、出門(mén)問(wèn)問(wèn)、奧比中光、小馬智行、云知聲……這些獨(dú)角獸不需要像市值千億的巨頭一樣大包大攬,它們其中很多只需要在人工智能的一個(gè)場(chǎng)景做到領(lǐng)先就足以享受技術(shù)帶來(lái)的紅利。
而除了人工智能企業(yè)在各個(gè)細(xì)分賽道的競(jìng)賽,上至開(kāi)源深度學(xué)習(xí)框架,下至硬件基礎(chǔ)設(shè)施提供商,Χ繞深度學(xué)習(xí)的全面戰(zhàn)爭(zhēng)已然打響。
在硬件基礎(chǔ)設(shè)施領(lǐng)域,站在擂臺(tái)兩邊的正是CPU與GPU。伴隨著近年來(lái)自動(dòng)駕駛技術(shù)的興起,作為很多自動(dòng)駕駛技術(shù)開(kāi)發(fā)者的選擇,GPU在深度學(xué)習(xí)硬件競(jìng)賽中占得先機(jī),但從英特爾的一系列動(dòng)作來(lái)看,CPU在人工智能、深度學(xué)習(xí)領(lǐng)域的發(fā)展?jié)摿ν瑯硬豢尚∮U。
在多數(shù)情況下,技術(shù)的進(jìn)步與硬件設(shè)施的迭代是一個(gè)長(zhǎng)期相互促進(jìn)的過(guò)程。和在PC游戲領(lǐng)域,英偉達(dá)的顯卡技術(shù)(如光線追蹤)會(huì)促使游戲開(kāi)發(fā)者開(kāi)發(fā)更高畫(huà)質(zhì)的游戲,而最新游戲不斷攀升的性能需求又反過(guò)來(lái)促使英偉達(dá)更新顯卡架構(gòu)類似,在深度學(xué)習(xí)領(lǐng)域,深度學(xué)習(xí)算法設(shè)計(jì)、訓(xùn)練模型的發(fā)展與硬件基礎(chǔ)設(shè)施的更新也在同步進(jìn)行。
在過(guò)去相當(dāng)長(zhǎng)的一段時(shí)間內(nèi),GPU被認(rèn)為是更適合深度學(xué)習(xí)的硬件設(shè)施,主要原因在于,深度學(xué)習(xí)是模擬人腦神經(jīng)系統(tǒng)而建立的數(shù)學(xué)網(wǎng)絡(luò)模型,對(duì)處理器的主要要求是需要大量的并行的重復(fù)計(jì)算,這一要求正好與GPU提供多核并行計(jì)算的基礎(chǔ)結(jié)構(gòu)特點(diǎn)相符。這也是為什?在自動(dòng)駕駛技術(shù)方面,GPU成為很多開(kāi)發(fā)者首選的原因,自動(dòng)駕駛涉及到的海量數(shù)據(jù),天然適合GPU的技術(shù)特性。
不過(guò)作為CPU的“帶頭大哥”,英特爾自然?有任由CPU不適合深度學(xué)習(xí)的觀點(diǎn)持續(xù)下去。在由谷歌、百度、英特爾、AMD、哈佛大學(xué)、斯坦福大學(xué)等機(jī)構(gòu)聯(lián)合推出的機(jī)器學(xué)習(xí)基準(zhǔn)測(cè)試工具M(jìn)LPerf的測(cè)試結(jié)果中,針對(duì)MLPerf深度學(xué)習(xí)訓(xùn)練工作負(fù)載,英特爾至強(qiáng)處理器取得的結(jié)果并不遜色于MLPerf參考GPU。
具體來(lái)說(shuō), 英特爾至強(qiáng)分別在MLPerf圖像分類基準(zhǔn)測(cè)試 (Resnet-50) 、推薦基準(zhǔn)測(cè)試、強(qiáng)化學(xué)習(xí)基準(zhǔn)測(cè)試三項(xiàng)中獲得0.85分、1.6分與6.3分,作為對(duì)比,這三個(gè)項(xiàng)目中,參考GPU的實(shí)施分?jǐn)?shù)均為1.0分。
盡管這并不意ζ著CPU可以完全取代GPU在深度學(xué)習(xí)中的地λ,但已經(jīng)充分說(shuō)明,CPU憑借近年來(lái)更新、迭代獲得的針對(duì)性的軟、硬件優(yōu)化,在深度學(xué)習(xí)上已經(jīng)能占據(jù)一席之地。英特爾方面的數(shù)據(jù)顯示,在與前一代?有優(yōu)化軟件的產(chǎn)品相比,英特爾至強(qiáng)處理器執(zhí)行深度學(xué)習(xí)任務(wù)的性能大幅提升,訓(xùn)練吞吐量提升高達(dá)127倍。
在中國(guó)銀聯(lián)電子商務(wù)與電子支付國(guó)家工程實(shí)驗(yàn)室推進(jìn)的銀行卡反欺詐技術(shù)研究中,采用了銀聯(lián)、眾安科技與英特爾共同提出的GBDT→GRU→RF 三明治結(jié)構(gòu)欺詐偵測(cè)模型架構(gòu),這一模型基于英特爾至強(qiáng)處理器的CPU平臺(tái),并?有選擇專用平臺(tái),其中一個(gè)很重要的原因在于CPU架構(gòu)幾乎兼容目前所有AI主流技術(shù),能提供多種優(yōu)化手段和工具支持。
在《IDC中國(guó)人工智能市場(chǎng)半年度研究,2018》所列舉的用戶份額排名前10的開(kāi)源深度學(xué)習(xí)框架中,英特爾支持其中的TensorFlow、Caffe、MXNet、PaddlePaddle、Caffe2/Pytorch, CNTK等,同時(shí)英特爾還表示將繼續(xù)添加其他框架。
而在深度學(xué)習(xí)框架之外,英特爾自身也針對(duì)人工智能開(kāi)發(fā)了一系列技術(shù)與工具,比如英特爾深度學(xué)習(xí)加速技術(shù)、基于Spark的分布式深度學(xué)習(xí)框架 BigDL、大數(shù)據(jù)分析 +AI平臺(tái) Analytics Zoo、OpenVINO工具包、數(shù)學(xué)核心函數(shù)庫(kù)(英特爾MKL)、數(shù)據(jù)分析加速庫(kù)(英特爾DAAL)、面向Python的英特爾分發(fā)包以及Nervana技術(shù)等。
Χ繞人工智能,英特爾已經(jīng)構(gòu)建起涵蓋硬件、庫(kù)、框架、平臺(tái)、解決方案的開(kāi)放生態(tài),以CPU為基礎(chǔ)設(shè)施,英特爾的人工智能全棧解決方案已經(jīng)在落地的合作案例中扮演起越來(lái)越重要的角色。
在西門(mén)子醫(yī)療與英特的合作中,推出了一種基于人工智能的心臟MRI分割和分析模型,該模型對(duì)左右心室進(jìn)行語(yǔ)義切分并可擴(kuò)展到四個(gè)心房,整個(gè)過(guò)程自動(dòng)化了過(guò)去耗時(shí)費(fèi)力的人工標(biāo)識(shí)過(guò)程,醫(yī)生無(wú)需手動(dòng)進(jìn)行心室、心肌和心血池的圖像分割,整體診斷速度可以提升3到10倍。
在這一模型中,至強(qiáng)處理器中集成的OpenVINO工具包和內(nèi)置的深度學(xué)習(xí)加速技術(shù)發(fā)揮了重要作用,其中深度學(xué)習(xí)加速技術(shù)采用了全新的向量神經(jīng)網(wǎng)絡(luò)指令(VNNI),過(guò)去需要多條指令才能完成的卷積之類的操作,現(xiàn)在只需要一條指令。正是在這些技術(shù)的疊加效應(yīng)下,使得AI模型的處理速度提升了5.5倍,有望實(shí)現(xiàn)實(shí)時(shí)的心血管疾病診斷。
而在與GPU的對(duì)比中,CPU的另一優(yōu)勢(shì)在于,除了深度學(xué)習(xí),CPU本身已經(jīng)是企業(yè)既有IT基礎(chǔ)設(shè)施的重要組成部分,“身兼兩職”讓CPU擁有更好的靈活性,例如在業(yè)務(wù)繁?時(shí)支持業(yè)務(wù)應(yīng)用,在閑時(shí)則運(yùn)行基于AI的數(shù)據(jù)分析。亞馬遜AWS、微軟Azure等海外公有云巨頭推出基于至強(qiáng)平臺(tái)的AI云服務(wù),很大程度上是看中了其應(yīng)用靈活性帶來(lái)的創(chuàng)收靈活性。
無(wú)論是應(yīng)用場(chǎng)景、計(jì)算能力還是基礎(chǔ)成本,英特爾現(xiàn)在已經(jīng)有了在深度學(xué)習(xí)領(lǐng)域?qū)PU進(jìn)行彎道超車(chē)的底氣,CPU與GPU之間的戰(zhàn)爭(zhēng)也將在深度學(xué)習(xí)上持續(xù)下去。