8月8日,英特爾在美國(guó)總部召開了名為“以數(shù)據(jù)為中心(Data-Centric)”的創(chuàng)新峰會(huì)。在會(huì)上,以英特爾執(zhí)行副總裁、數(shù)據(jù)中心集團(tuán)總經(jīng)理Navin Shenoy為首的各產(chǎn)品線主要負(fù)責(zé)人介紹了英特爾在大數(shù)據(jù)時(shí)代的發(fā)展愿景和布局,對(duì)“以數(shù)據(jù)為中心的計(jì)算(Data-Centric Computing)”的潛在市場(chǎng)進(jìn)行了分析,并且公布了若干英特爾相關(guān)軟硬件產(chǎn)品的發(fā)展路線圖。
本次峰會(huì)披露了很多關(guān)于FPGA的重大動(dòng)態(tài),其中包括正式宣布了基于英特爾FPGA的智能網(wǎng)卡產(chǎn)品線,以及其第一款代號(hào)為“Cascade Glacier(冰川瀑布)”的量產(chǎn)版智能網(wǎng)卡。作為這款產(chǎn)品的FPGA研發(fā)團(tuán)隊(duì)的主要成員之一,筆者從立項(xiàng)之初就參與了它的各項(xiàng)研發(fā)工作,并負(fù)責(zé)了多個(gè)軟硬件模塊和系統(tǒng)的設(shè)計(jì)與驗(yàn)證任務(wù)。因此對(duì)于這款產(chǎn)品的正式對(duì)外發(fā)布,我倍感欣喜,并希望通過(guò)本文進(jìn)一步梳理和分析峰會(huì)的技術(shù)細(xì)節(jié),以及從以下幾個(gè)方面探討FPGA在大數(shù)據(jù)時(shí)代的各種機(jī)遇和挑戰(zhàn):
1.英特爾“泛數(shù)據(jù)中心”業(yè)務(wù)及其潛在市場(chǎng)
2.基于FPGA的智能網(wǎng)卡產(chǎn)品線的正式發(fā)布
3.英特爾人工智能計(jì)算加速器產(chǎn)品系列的相關(guān)布局
4.FPGA開發(fā)的痛點(diǎn)與潛在方案
英特爾“泛數(shù)據(jù)中心”業(yè)務(wù)
近年來(lái),英特爾一直積極的尋求業(yè)務(wù)轉(zhuǎn)型,即從一家以個(gè)人計(jì)算機(jī)和CPU為主的企業(yè),轉(zhuǎn)向以數(shù)據(jù)為中心并圍繞其發(fā)展全棧式解決方案的公司。為了實(shí)現(xiàn)這一目標(biāo),這幾年英特爾先后收購(gòu)了FPGA大廠Altera(167.5億美金),自動(dòng)駕駛大廠Mobileye(153億美金),人工智能芯片初創(chuàng)公司Nervana、機(jī)器視覺公司Movidus等眾多公司擴(kuò)展其產(chǎn)品線,并同時(shí)招攬了兩位芯片設(shè)計(jì)大神Jim Keller和 Raja Koduri分別擔(dān)任半導(dǎo)體工程總負(fù)責(zé)人和芯片總架構(gòu)師,負(fù)責(zé)統(tǒng)領(lǐng)英特爾各類芯片(特別是高端數(shù)據(jù)中心芯片)的整體架構(gòu)和路線圖規(guī)劃。另外,英特爾旗下的風(fēng)投部門僅在2017年就投資了包括地平線在內(nèi)的十余家AI初創(chuàng)企業(yè),各領(lǐng)域總投資額超過(guò)五億美元。
推動(dòng)這場(chǎng)變革的主要力量,就是目前方興未艾的大數(shù)據(jù)浪潮。目前,全世界現(xiàn)有的超過(guò)90%的數(shù)據(jù)都是在過(guò)去的兩年內(nèi)產(chǎn)生的。隨著人工智能、自動(dòng)駕駛、5G、云計(jì)算等各種技術(shù)的不斷發(fā)展,各類數(shù)據(jù)將會(huì)基于源源不斷的產(chǎn)生,預(yù)計(jì)到2025年時(shí),數(shù)據(jù)總量將比現(xiàn)在增長(zhǎng)10倍。由于上述技術(shù)的發(fā)展都基于對(duì)大數(shù)據(jù)的研究和分析,因此有人形象的將數(shù)據(jù)比作未來(lái)人工智能時(shí)代的石油。
隨著數(shù)據(jù)量的增長(zhǎng)和技術(shù)的發(fā)展,對(duì)數(shù)據(jù)進(jìn)行處理的能力也有了長(zhǎng)足的進(jìn)步。特別是隨著摩爾定律的延續(xù),從2012年至2017年,處理數(shù)據(jù)所需的計(jì)算和存儲(chǔ)成本分別下降了56%和77%;同時(shí),處理數(shù)據(jù)的性能相較2006年則提升了41倍,如圖1所示。然而即便如此,現(xiàn)如今只有不到1%的數(shù)據(jù)被有效的進(jìn)行了處理、分析和利用。由此可見,如何高效的以數(shù)據(jù)為中心進(jìn)行現(xiàn)有系統(tǒng)的優(yōu)化設(shè)計(jì)、升級(jí)和創(chuàng)新,擁有著巨大的市場(chǎng)潛力和前景。
圖1:摩爾定律的延續(xù)帶來(lái)的數(shù)據(jù)處理性能的增長(zhǎng)
在本次峰會(huì)上,英特爾對(duì)其2022年的大數(shù)據(jù)相關(guān)的潛在市場(chǎng)規(guī)模(Total Addressable Market – TAM)做了自己的預(yù)測(cè),如下圖所示:
圖2:2022年英特爾大數(shù)據(jù)相關(guān)的潛在市場(chǎng)規(guī)模
英特爾的各類以數(shù)據(jù)為中心的業(yè)務(wù)部門主要包括四個(gè)子業(yè)務(wù)群:第一,傳統(tǒng)的數(shù)據(jù)中心業(yè)務(wù),包括Xeon處理器、網(wǎng)絡(luò)、連接等;第二,非易失性存儲(chǔ)業(yè)務(wù);第三,物聯(lián)網(wǎng)和自動(dòng)駕駛業(yè)務(wù),包括各類人工智能相關(guān)的業(yè)務(wù)部門;第四,F(xiàn)PGA業(yè)務(wù)。我在本文中將將其統(tǒng)一稱作“泛數(shù)據(jù)中心”集團(tuán)。至2022年,泛數(shù)據(jù)中心集團(tuán)的潛在市場(chǎng)規(guī)模將超過(guò)2000億美元,并由此成為英特爾歷史上最大的市場(chǎng)機(jī)遇。其中,各個(gè)子業(yè)務(wù)群的市場(chǎng)規(guī)模分別為,傳統(tǒng)數(shù)據(jù)中心業(yè)務(wù)超過(guò)900億美元、非易失性存儲(chǔ)業(yè)務(wù)750億美元,物聯(lián)網(wǎng)和自動(dòng)駕駛業(yè)務(wù)330億美元,F(xiàn)PGA相關(guān)的業(yè)務(wù)也超過(guò)80億美元。
為此,英特爾提出了“全棧式”的數(shù)據(jù)中心系統(tǒng)解決方案路線圖,并由此打造以數(shù)據(jù)為中心的基礎(chǔ)架構(gòu),如下圖所示。
圖3:英特爾全棧式數(shù)據(jù)中心解決方案
可以看到,這個(gè)路線圖主要由“三駕馬車”進(jìn)行驅(qū)動(dòng),分別是傳輸、存儲(chǔ)和計(jì)算。值得注意的是,圖中在傳輸和計(jì)算的部分都明確標(biāo)出了FPGA的存在。下文將進(jìn)一步分析FPGA在這兩個(gè)領(lǐng)域中所面臨的主要機(jī)遇和挑戰(zhàn)。
使用FPGA智能網(wǎng)
卡加速數(shù)據(jù)中心網(wǎng)絡(luò)
?。?)數(shù)據(jù)中心網(wǎng)絡(luò)市場(chǎng)高速增長(zhǎng)
在2022年,F(xiàn)PGA的數(shù)據(jù)中心相關(guān)業(yè)務(wù)的潛在市場(chǎng)規(guī)模將達(dá)到80億美元,較現(xiàn)在增長(zhǎng)將超過(guò)30億美元。就英特爾FPGA業(yè)務(wù)部(原Altera)而言,其數(shù)據(jù)中心相關(guān)業(yè)務(wù)的年同比增長(zhǎng)率在今年一季度達(dá)到了140%,與高端FPGA器件相關(guān)的增幅達(dá)50%,而整體業(yè)務(wù)也有超過(guò)兩位數(shù)的增長(zhǎng),見下圖所示。
圖4:英特爾可編程業(yè)務(wù)部年增長(zhǎng)率
FPGA的一個(gè)最主要的應(yīng)用領(lǐng)域就是對(duì)各類網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行并行化處理。這里的網(wǎng)絡(luò),既包括傳統(tǒng)的有線通信網(wǎng)絡(luò),也包括正在興起的5G無(wú)線網(wǎng)絡(luò),以及在數(shù)據(jù)中心里的各類網(wǎng)絡(luò)連接。
?。?)FPGA智能網(wǎng)卡產(chǎn)品線發(fā)布
前文中提到,作為本次峰會(huì)的一大亮點(diǎn),英特爾發(fā)布了全新的基于FPGA的智能網(wǎng)卡產(chǎn)品線,以及其中的首款量產(chǎn)級(jí)產(chǎn)品,代號(hào)為“Cascade Glacier(冰川瀑布)”。由此進(jìn)一步擴(kuò)充了英特爾的以太網(wǎng)硬件產(chǎn)品線,形成了傳統(tǒng)網(wǎng)卡(ASIC)+智能網(wǎng)卡(FPGA)+網(wǎng)絡(luò)功能加速卡(FPGA)的完整產(chǎn)品組合,如下圖所示。
圖5:英特爾數(shù)據(jù)中心以太網(wǎng)硬件產(chǎn)品線
這類智能網(wǎng)卡的產(chǎn)生背景是為了應(yīng)對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)流量的爆炸性增長(zhǎng)。從下圖可以看到,全球數(shù)據(jù)中心的網(wǎng)絡(luò)流量將從2016年的6.8Z字節(jié)(1ZB等于10的12次方GB)暴增至2021年的20.6Z字節(jié),年復(fù)合增長(zhǎng)率約為25%。同時(shí)值得注意的是,這其中大部分的網(wǎng)絡(luò)流量都是在數(shù)據(jù)中心內(nèi)部的,因此如何優(yōu)化處理這類網(wǎng)絡(luò)流量就成了亟需解決的課題。另外,在目前的通信及云服務(wù)提供商的數(shù)據(jù)中心里,部分CPU核心被用來(lái)實(shí)現(xiàn)必須的存儲(chǔ)和網(wǎng)絡(luò)功能,如針對(duì)虛擬化交換的OVS(Open Virtual Switch),以及針對(duì)I/O虛擬化的Virtio等等,這樣使得寶貴的CPU資源被非用戶任務(wù)占用,造成可用CPU資源的壓縮和緊張。為解決這些問題,Cascade Glacier智能網(wǎng)卡由此產(chǎn)生。
圖6:全球數(shù)據(jù)中心網(wǎng)絡(luò)流量增長(zhǎng)率
如圖7所示,Cascade Glacier基于英特爾Arria10系列FPGA,能為云數(shù)據(jù)中心的網(wǎng)絡(luò)流量提供2x25GbE的數(shù)據(jù)處理加速。
圖7a:FPGA智能網(wǎng)卡Cascade Glacier
與傳統(tǒng)網(wǎng)卡以及現(xiàn)有的其他智能網(wǎng)卡相比,它提供了業(yè)界唯一的對(duì)Virtio協(xié)議的硬件支持和加速,使得云數(shù)據(jù)中心里的虛擬機(jī)可以進(jìn)行無(wú)縫的動(dòng)態(tài)遷移,而不需要安裝額外的驅(qū)動(dòng),極大的擴(kuò)展了數(shù)據(jù)中心的部署靈活性。另外,它將原本在CPU上實(shí)現(xiàn)的OVS功能完全卸載到FPGA上實(shí)現(xiàn),釋放了寶貴的CPU資源。另外,它還提供了FPGA靈活的可編程以及低功耗的特點(diǎn),方便在數(shù)據(jù)中心中大規(guī)模部署,以及對(duì)常用網(wǎng)絡(luò)功能進(jìn)行定制化加速。作為英特爾獨(dú)立開發(fā)的量產(chǎn)級(jí)智能網(wǎng)卡產(chǎn)品,Cascade Glacier會(huì)與英特爾”泛數(shù)據(jù)中心“架構(gòu)中的其他組成部分,如Xeon CPU、存儲(chǔ)器、AI協(xié)處理器和加速器等,進(jìn)行軟硬件深度整合,從而提供完整的端到端的系統(tǒng)解決方案。目前,Cascade Glacier已經(jīng)進(jìn)入了最后的批量裝配階段,并預(yù)計(jì)將于2019年一季度正式出貨。
圖7b:使用智能網(wǎng)卡進(jìn)行CPU功能卸載
Cascade Glacier可以算是英特爾針對(duì)云數(shù)據(jù)中心而設(shè)計(jì)開發(fā)的第一代基于FPGA的智能網(wǎng)卡量產(chǎn)產(chǎn)品,很好的解決了行業(yè)痛點(diǎn),因此已經(jīng)吸引了很多大型云服務(wù)提供商的關(guān)注。相信在不久的將來(lái),會(huì)有更多關(guān)于這款產(chǎn)品的詳細(xì)信息和部署情況被正式公布,屆時(shí)我會(huì)更深入的介紹關(guān)于Cascade Glacier的更多性能特點(diǎn)。