很多朋友應(yīng)該都知道了,昨天(1月28日)英偉達(dá)下調(diào)了第四財(cái)季的業(yè)績(jī)預(yù)期,隨后股價(jià)暴跌高達(dá)18%。
請(qǐng)注意這里的細(xì)節(jié),是英偉達(dá)自己下調(diào)了預(yù)期,發(fā)生的時(shí)機(jī)是在發(fā)布本季財(cái)報(bào)(2月4日)之前。說(shuō)白了,就是自己提前承認(rèn)這個(gè)季度搞砸了,并跪求各位投資人放過(guò)。
另外一個(gè)需要注意的細(xì)節(jié)是,這已經(jīng)不是英偉達(dá)第一次下調(diào)本季度的業(yè)績(jī)預(yù)期了。在去年發(fā)布第三季度財(cái)報(bào)時(shí),英偉達(dá)就已經(jīng)將第四財(cái)季的營(yíng)收期望下調(diào)了7%左右,低于市場(chǎng)預(yù)期近兩成。最近六個(gè)月以來(lái),英偉達(dá)股價(jià)已經(jīng)由最高的290美元左右,下跌到目前的130美元,除了股價(jià)腰斬,更成為同期標(biāo)普500指數(shù)中表現(xiàn)最差的公司。
英偉達(dá)在這封致股東信中提到,導(dǎo)致收入指引下調(diào)的主要原因是全球及部分地區(qū)的經(jīng)濟(jì)減速,導(dǎo)致游戲GPU銷量和數(shù)據(jù)中心業(yè)務(wù)的大量下滑。
相比之下,老石在之前的文章中介紹過(guò),F(xiàn)PGA公司Xilinx在前幾天發(fā)布季度財(cái)報(bào)后,股價(jià)飆升接近20%。這很大程度上歸功于Xilinx通信與數(shù)據(jù)中心部門的高速增長(zhǎng)。此外,英特爾在其最新財(cái)報(bào)中披露,旗下FPGA部門在數(shù)據(jù)中心領(lǐng)域的增長(zhǎng)幅度約有驚人的50%。
分析師們并不會(huì)告訴你,為什么這些公司目前有如此迥異的表現(xiàn)。在本文中,老石就從技術(shù)角度深入分析,當(dāng)年的小甜甜怎么變成了今天的牛夫人。
數(shù)據(jù)中心AI加速芯片的選擇
推動(dòng)人工智能爆發(fā)的最主要原因之一,就是硬件算力的提升。而英偉達(dá)的股價(jià)當(dāng)年之所以能夠三年漲10倍,就是因?yàn)镚PU非常適用于深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。與傳統(tǒng)的CPU相比, GPU擁有數(shù)千個(gè)計(jì)算內(nèi)核,能夠在性能上取得上百倍的提升。因此AI就成為了GPU最主要的應(yīng)用領(lǐng)域之一,也成就了英偉達(dá)的高速增長(zhǎng)。
隨著AI的不斷發(fā)展,諸如微軟和谷歌這樣的巨頭公司開始考慮在數(shù)據(jù)中心里采用GPU作為AI加速芯片,這時(shí)問(wèn)題就出現(xiàn)了。在大量部署時(shí),芯片的性能并不是唯一需要考慮的因素。事實(shí)上,很多情況下它也并不是最重要的因素。
對(duì)于某種AI加速芯片,老石將常見的評(píng)價(jià)因素總結(jié)為五點(diǎn):性能、靈活性、同構(gòu)性、成本和功耗。其中:
靈活性:指這種芯片對(duì)不同應(yīng)用場(chǎng)景的適應(yīng)程度。
同構(gòu)性:指的是AI加速芯片能否重復(fù)利用數(shù)據(jù)中心現(xiàn)有的架構(gòu)和資源。
成本:既包括對(duì)該硬件加速器的研發(fā)投入,也包含了它的采購(gòu)、部署和運(yùn)維開支。
功耗:就是指引入該方案后,對(duì)數(shù)據(jù)中心帶來(lái)的額外功耗負(fù)擔(dān)。
接下來(lái),老石就對(duì)幾種常見的AI加速芯片,比如GPU、FPGA以及ASIC,采用上述評(píng)價(jià)因素做一個(gè)簡(jiǎn)單的定性對(duì)比。
GPU
GPU最大的問(wèn)題是,它基本上是個(gè)“功耗黑洞”:中等性能的GPU功耗都普遍超過(guò)200W,而高性能GPU的功耗會(huì)超過(guò)300W。相比于FPGA或ASIC的幾十瓦甚至幾瓦的功耗而言,這個(gè)數(shù)字顯得過(guò)于驚人。
高功耗對(duì)于GPU在數(shù)據(jù)中心里的大規(guī)模部署是致命的,因?yàn)檫@不僅代表著高昂的電費(fèi)開支,還表示數(shù)據(jù)中心現(xiàn)有的供電、散熱等硬件架構(gòu)需要進(jìn)行重新修改,這對(duì)于同構(gòu)性和低成本這兩項(xiàng)要求而言基本上是不可能的任務(wù)。
在靈活性方面,GPU通常只適用于計(jì)算密集型運(yùn)算,對(duì)于通信密集型的應(yīng)用,GPU需要與CPU和網(wǎng)卡組成一個(gè)完整的通信系統(tǒng),因此對(duì)于這類應(yīng)用,GPU的靈活性會(huì)受到較大限制。
ASIC
專用的AI加速芯片以谷歌的張量處理器TPU(Tensor Processing Unit)最為典型。TPU專為谷歌的深度學(xué)習(xí)框架TensorFlow設(shè)計(jì),現(xiàn)在已有第二代,被用來(lái)加速神經(jīng)網(wǎng)絡(luò)的和決策。ASIC最主要的優(yōu)勢(shì)是它的超高性能和超低功耗。與GPU相比,TPU在某些AI應(yīng)用的性能可以提高一個(gè)量級(jí),而功耗會(huì)下降一到兩個(gè)量級(jí)。
不過(guò),得到這樣高性能和低功耗需要付出的代價(jià)就是巨大的研發(fā)成本。放眼全球,有資金實(shí)力和技術(shù)儲(chǔ)備進(jìn)行這類研發(fā)的公司,大概用一個(gè)手就能數(shù)的出來(lái)。ASIC的另外一個(gè)缺點(diǎn)是它的低靈活性,它通常針對(duì)某種特定的應(yīng)用和算法框架而設(shè)計(jì),因此很難直接用于其他的應(yīng)用。
FPGA
相比GPU和ASIC,F(xiàn)PGA在各項(xiàng)評(píng)價(jià)指標(biāo)中能夠達(dá)到比較理想的平衡。在絕對(duì)性能方面,雖然不如GPU或ASIC,但由于FPGA可以定制化硬件流水線,并且可以進(jìn)行大規(guī)模并行運(yùn)算,因此相比傳統(tǒng)的基于CPU的計(jì)算性能還是有著至少一到兩個(gè)量級(jí)的提升。由于FPGA具有硬件可編程的特點(diǎn),使得它可以應(yīng)對(duì)包括計(jì)算密集型和通信密集型在內(nèi)的各類應(yīng)用。此外,F(xiàn)PGA獨(dú)有的動(dòng)態(tài)可編程、部分可編程的特點(diǎn),使其可以跨空間和時(shí)間兩個(gè)維度,同時(shí)處理多個(gè)應(yīng)用,或在不同時(shí)刻處理不同應(yīng)用,因此有很強(qiáng)的靈活性。
功耗和成本方面,F(xiàn)PGA的功耗通常為幾十瓦,采購(gòu)與運(yùn)維成本遠(yuǎn)低于GPU。FPGA的開發(fā)成本主要涉及購(gòu)買特定的FPGA設(shè)計(jì)和調(diào)試工具、采購(gòu)FPGA芯片或加速卡,以及組建團(tuán)隊(duì)進(jìn)行或外包FPGA開發(fā)項(xiàng)目等投入。雖不及CPU或GPU等基于軟件的開發(fā)方式,但由于省去了FPGA芯片制造的相關(guān)環(huán)節(jié),因此相比研發(fā)一款專用芯片而言還是低很多。
此外,F(xiàn)PGA目前通常以加速卡的形式配合現(xiàn)有的通用處理器進(jìn)行大規(guī)模部署,對(duì)額外的供電和冷卻等環(huán)節(jié)沒有特殊要求,因此可以兼容數(shù)據(jù)中心的現(xiàn)有硬件體系結(jié)構(gòu)。
AI芯片的最大風(fēng)險(xiǎn)
對(duì)于AI芯片的設(shè)計(jì)者而言,當(dāng)前最大的風(fēng)險(xiǎn)就是AI本身。在這個(gè)群雄爭(zhēng)霸的時(shí)代,各種新算法、新模型層出不窮,因此在某種方法一統(tǒng)天下之前,很難將其中的任何一種方法固化在芯片上,否則就很可能再次重演以前的小甜甜變成今天的牛夫人這樣的悲劇。
比如,為了進(jìn)一步提升性能功耗比,目前比較流行的方法是使用近似(approximation)算法,例如將雙精度浮點(diǎn)數(shù)換成低精度的定點(diǎn)數(shù),或者對(duì)不同權(quán)重的網(wǎng)絡(luò)分支做剪枝、結(jié)構(gòu)優(yōu)化和壓縮的操作。這方面的具體內(nèi)容在本文中不再展開,有興趣的讀者可以參考老石在英國(guó)的博士師弟小王同學(xué)最新發(fā)表的綜述,題目見下圖,點(diǎn)擊閱讀原文即可查看。
老石想說(shuō)的是,這些不斷涌現(xiàn)的全新AI方法只有通過(guò)FPGA才能快速實(shí)現(xiàn),這對(duì)于GPU或者ASIC都是不可能完成的任務(wù)。
結(jié)語(yǔ)
正如老石在之前的文章里提到的,數(shù)據(jù)中心與AI已經(jīng)成為各家芯片公司的必爭(zhēng)之地。只不過(guò),近期資本市場(chǎng)的表現(xiàn)在某種程度上展示了人們對(duì)不同方案的認(rèn)可度。這也是老石在本文中嘗試分析的。
然而,老石并不想立flag斷言這些公司的未來(lái),老石只是相信,技術(shù)會(huì)不斷給出自己的答案。