2015年6月1日,英特爾與Altera宣布,雙方已達(dá)成最終協(xié)議,根據(jù)該協(xié)議,英特爾將以167億美元的價格收購Altera。這是FPGA行業(yè)的一個重要里程碑,因?yàn)?a class="innerlink" href="http://ihrv.cn/tags/Xilinx" target="_blank">Xilinx和Altera是主要的FPGA供應(yīng)商。
在AMD正式宣布收購Xilinx之后,F(xiàn)PGA界對FPGA的未來充滿了擔(dān)憂。
收購Xilinx的主要目標(biāo)是打造業(yè)界領(lǐng)先的高性能計算公司,根據(jù)AMD的說法,“在Xilinx已確立領(lǐng)先地位的各個成長型市場上,大幅擴(kuò)大AMD產(chǎn)品組合和客戶集的廣度”。但Xilinx目前領(lǐng)先的主要市場是什么?
Alveo,VERSAL和Vitis AI
Xilinx 3年前發(fā)布了一個功能強(qiáng)大的FPGA平臺,名為Alveo。Alveo是Xilinx最初開發(fā)的第一塊FPGA板,用作與GPU競爭的加速卡。在此之前,Xilinx主要開發(fā)FPGA芯片,并且依賴其他供應(yīng)商來提供FPGA卡。隨著Alveo卡(以及最近的Versal)的出現(xiàn),Xilinx希望以其品牌名稱提供功能強(qiáng)大的平臺用作加速卡。賽靈思圍繞Alveo平臺快速開發(fā)了一個令人印象深刻的生態(tài)系統(tǒng),其中包括多家利用Alveo卡的強(qiáng)大功能來加速機(jī)器學(xué)習(xí),深度神經(jīng)網(wǎng)絡(luò),數(shù)據(jù)庫,自然語言處理,基因組學(xué)和定量金融等領(lǐng)域的應(yīng)用的公司。
賽靈思還提供了集成的EDA工具(先是SDAccel,然后是Vitis),該工具允許使用OpenCL和C / C ++等高級編程語言對FPGA進(jìn)行編程,而無需使用VHDL或Verilog。這些工具使軟件開發(fā)人員無需具備FPGA的經(jīng)驗(yàn)知識即可開發(fā)自己的加速器(盡管需要對FPGA技術(shù)有深入的了解,才能使用OpenCL開發(fā)高效的硬件加速器)。
NVIDIA,ARM和Mellanox
大約一個月前,Nvidia宣布有意以400億美元的價格收購ARM,“創(chuàng)建AI時代的世界頂級計算公司”。收購的原因之一是幫助Nvidia開發(fā)數(shù)據(jù)處理單元(DPU),該單元包括:
軟件可編程的多核CPU(又名ARM)
高性能網(wǎng)絡(luò)接口(aka SmartNIC)(aka Mellanox)
豐富的靈活和可編程加速引擎集(又名Nvidia GPU)
因此,在從AMD收購Xilinx之后,F(xiàn)PGA的未來將是什么。
英特爾擁有豐富的硬件加速器產(chǎn)品組合,包括功能強(qiáng)大的至強(qiáng)處理器,GPU,F(xiàn)PGA和用于深度學(xué)習(xí)的ASIC。那么FPGA針對英特爾的主要市場是什么?在一份英特爾演講中,英特爾提出旨在在3個特定市場中利用FPGA:
自然語言處理(BERT)
欺詐檢測(LSTM)
智能城市(推理)
因此,似乎英特爾主要致力于低延遲至關(guān)重要的應(yīng)用,與其他平臺相比,F(xiàn)PGA可以提供更低的延遲。但是,仍然有待觀察這些針對深度學(xué)習(xí)應(yīng)用的FPGA與ASIC深度學(xué)習(xí)平臺(例如基于Habana Labs的平臺)的區(qū)別。英特爾以20億美元的價格收購了Habana Labs,以提供其高性能深度學(xué)習(xí)推理和培訓(xùn)技術(shù)。
FPGA的未來
在進(jìn)行了相關(guān)的收購之后,我認(rèn)為每個人都清楚,我們正邁入異構(gòu)數(shù)據(jù)處理平臺的時代,其中計算平臺將包括 SmartNIC,多核處理器和硬件加速器 ,用戶將不得不選擇完整的解決方案而不是混合使用和匹配。英特爾,AMD和Nvidia將提供具有自己專有的加速器和SmartNIC的完整計算平臺。
好處可能是更易于部署和更好的集成,但是選擇每個領(lǐng)域中最好的選項(xiàng)將不再可行,或者至少會更具挑戰(zhàn)性(例如,從Xilinx選擇FPGA,從Intel Xeon處理器選擇和從Nvidia獲得GPU。)。
例如,對于英特爾和AMD而言,很難在深度學(xué)習(xí)領(lǐng)域推廣FPGA,而其他平臺將以自己的品牌名稱提供。也許FPGA將主要用于其生硬的市場(網(wǎng)絡(luò)和電信,如vRAN和5G),而其他平臺(GPU,ASIC)將被推廣用于深度學(xué)習(xí)。
FPGA的主要優(yōu)點(diǎn)是可編程性,以支持量身定制的架構(gòu)。這意味著它們可以更快地適應(yīng)新算法或應(yīng)用程序。這種競爭優(yōu)勢至關(guān)重要,特別是在深度學(xué)習(xí)領(lǐng)域,其中由機(jī)器學(xué)習(xí)工程師和數(shù)據(jù)科學(xué)家開發(fā)新模型。FPGA可以使用新的量身定制的模型/算法進(jìn)行編程,與其他平臺相比,可以提供更好的性能。尤其是在需要比特級處理的應(yīng)用中,例如數(shù)據(jù)包處理,基因組學(xué)和比特幣挖掘,F(xiàn)PGA表現(xiàn)出比其他平臺更好的性能。在深度學(xué)習(xí)應(yīng)用中,F(xiàn)PGA可以提供更低的延遲和更高的性能,尤其是在使用更少的位數(shù)時。(例如Xilinx FINN)。
無論如何,為了使FPGA成為加速器平臺具有吸引力,我們還需要提供所需的框架,以允許 輕松,可擴(kuò)展的FPGA部署。這就是為什么需要與供應(yīng)商無關(guān)的框架的原因,該框架允許像GPU或CPU一樣容易地部署FPGA。
在嵌入式系統(tǒng)領(lǐng)域,F(xiàn)PGA仍然可以占上風(fēng)。Xilinx和Intel均提供具有ARM內(nèi)核的基于SoC的FPGA,廣泛用于嵌入式應(yīng)用。Nvidia表示,仍將允許第三方使用ARM內(nèi)核,因此Xilinx和Intel將繼續(xù)在基于SoC的FPGA中使用ARM(直到他們切換到RISC-V處理器為止)。
FPGA社區(qū)很大,并且還在不斷增長。像FCCM,F(xiàn)PGA和FPL這樣的幾次會議表明,有一個龐大的社區(qū)支持并促進(jìn)了FPGA的使用。但是,F(xiàn)PGA是否將繼續(xù)用作通用加速器,或者其應(yīng)用在網(wǎng)絡(luò)和電信應(yīng)用中的局限性還有待觀察。