《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > 前景可人 Intel選擇擁抱FPGA

前景可人 Intel選擇擁抱FPGA

2017-02-19
關(guān)鍵詞: FPGA 服務(wù)器 交換器 CPU

我們知道,相對于專業(yè)的ASIC,FPGA有上市時間和成本上的優(yōu)勢。另外,在大多數(shù)情況下,F(xiàn)PGA執(zhí)行某些功能較之CPU上的軟件操作更高效。這就是為什么我們認(rèn)為它不但會運(yùn)用在數(shù)據(jù)中心的服務(wù)器、交換器、存儲層的各個角落,并且具有加速整個工作流程的功能。

然而我們不能過分樂觀,尤其是在2015年12月,Intel以167億美元收購了FPGA生產(chǎn)商Altera之后。

在2014年年底,當(dāng)時還處于獨立的Altera公司高層盯上了基于CPU+FPGA的數(shù)據(jù)中心并行計算的發(fā)展前景——這個當(dāng)時價值大約10億美元的市場。而并非數(shù)據(jù)中心里約2.5億美元的CPU-GPU市場和直接應(yīng)用CPU處理器的90億美元市場。

Altera做出這個決定的原因在于他們認(rèn)為這個組合較之另外兩個方案,有編程的簡便性和能效優(yōu)勢。人們對CPU非常熟悉,并發(fā)現(xiàn)尋找C程序員也不會太難。因此對大部分開發(fā)者來說,在執(zhí)行運(yùn)算任務(wù)的時候,持續(xù)使用這種方案不需要冒太大的風(fēng)險,但是能源效率相對比較低,尤其是在密集的計算和固有的并行工作負(fù)載的情況底下。

至于CPU+GPU的方案,程序員并不是很熟悉,但是擁有很高的效率。

根據(jù)Altera的估計,使用OpenCL對混合CPU-FPGA系統(tǒng)進(jìn)行編程比使用Nvidia的CUDA環(huán)境對于程序員來說更容易(某些方面肯定是有爭議的),但用HDL來硬編程FPGA是相當(dāng)困難的,因此需要OpenCL或者通過其他抽象層來將CPU中的負(fù)載轉(zhuǎn)移到FPGA上。

Intel收購Altera改變FPGA格局

這個十億美元的數(shù)據(jù)中心市場被Altera、Xilinx和其他FPGA供應(yīng)商瓜分。在Intel于2015年6月收購了Altera之后,這個市場變得更加復(fù)雜。

在收購之前的2014年,Altera的19億美元收入中,有16%來自于與數(shù)據(jù)中心相關(guān)的計算、網(wǎng)絡(luò)和存儲業(yè)務(wù),其總值達(dá)到3.04億美元。那些在這個領(lǐng)域深耕十幾二十年的通信和無線設(shè)備系統(tǒng)制造商想要有更高的能源效率,更低的成本和更高的擴(kuò)展性,這些都是FPGA所擅長的領(lǐng)域。另外有一點需要提一下,那就是在執(zhí)行這些功能的時候,使用FPGA并不需要像使用CPU那樣需要操作系統(tǒng)和相應(yīng)的軟件。這部分的營收占了Altera營收的44%,總額為8.35億美元。

Altera另外的22%收入,即4.18億美元,來自工業(yè)控制、軍事設(shè)備和汽車制造等領(lǐng)域。他們面對相同的困境,因此選擇FPGA來處理他們的一些工作負(fù)載。

其實早在2014年,英特爾看中了價值1150億美元的各種類型的芯片潛在市場。當(dāng)中可編輯邏輯設(shè)備(以FPGA為主)約占4%,ASIC占18%,其余為ASSP的大雜燴。

在可編輯邏輯設(shè)備的領(lǐng)域中,英特爾預(yù)估Altera占有48億美元市場中的39%,Xilinx占有49%,剩下供應(yīng)商則占據(jù)剩下的12%。

當(dāng)時英特爾沒有收購Altera的原因是因為FPGA業(yè)務(wù)的增長速度幾乎與其數(shù)據(jù)中心集團(tuán)(為服務(wù)器,存儲和交換機(jī)制造商提供芯片,芯片組和主板)的速度一樣快。

再者,英特爾沒有這樣做也是因為摩爾定律逐漸緩慢下來的腳步,給FPGA帶來了日益增長的競爭威脅。

實際上,如果應(yīng)用的話,在數(shù)據(jù)中心里不止安裝一個FPGA、GPU或DSP加速器,但不需要安裝多個Xeon CPU。由于英特爾不能繼續(xù)為Xeons提供更多的核心和加速器,所以他們得出了將FPGA當(dāng)做加速器的結(jié)論。

除非FPGA能在數(shù)據(jù)中心創(chuàng)造5億美元的收益,或者幾年后創(chuàng)造10億美元或更多的收入。不然英特爾寧愿犧牲兩至三倍的Xeon收入,也不會把Xeon的收入拱手相讓。

深度學(xué)習(xí)加持,F(xiàn)PGA前景可人

根據(jù)英特爾的預(yù)測,他們計劃從現(xiàn)在到2023年以接近直線增長率來提升FPGA的業(yè)務(wù)。對此我們總是抱有懷疑的態(tài)度。但FPGA業(yè)務(wù)隨著時間的推移或多或少地在增長(比15年前增長約2.5倍)。

英特爾還預(yù)計,F(xiàn)PGA的營收在2014年到2023年之間將會再翻一倍。按照英特爾預(yù)測,從2014年到2023年間其復(fù)合年增長率為7%,其收入應(yīng)該略低于預(yù)測的89億美元。有趣的是,由于英特爾的預(yù)測并沒有把來自數(shù)據(jù)計算中心(服務(wù)器,交換和網(wǎng)絡(luò))的FPGA收入份額納入計劃中,這將會發(fā)生很大變化。讓我們分析一下:

如果Altera和Xilinx的市場份額沒有發(fā)生改變,且假設(shè)Altera的收入在網(wǎng)絡(luò),計算和存儲的部分保持不變,那么Altera這一部分的業(yè)務(wù)收入到2023年將會達(dá)到5.6億美元左右。我們認(rèn)為Intel這樣的數(shù)據(jù)低估了數(shù)據(jù)中心在提供更有效和靈活計算所面對的壓力。不給過我們認(rèn)為FPGA的前景遠(yuǎn)遠(yuǎn)優(yōu)于這個預(yù)測。也就是說,許多FPGA技術(shù)的支持者一直期待FPGA在數(shù)據(jù)中心中獲得計算合法化的那天很快到來。

諷刺的是,英特爾本身作為FPGA的編程專家,硬件描述語言的使用者,以及知名的ASIC制造商,竟成為推動FPGA成為加速器優(yōu)先選擇的主要參與者。這樣的加速器既能作為獨立的離散計算元件,又可以作為混合 CPU-FPGA器件。

這也是為什么從2016年以來,我們看到所有關(guān)于Altera的新聞都是昭示FPGA將會有的大規(guī)模增的增長。所以至少在短期,他們除了為其他的FPGA制造商作嫁衣裳,幾乎別無他法。

這次收購不僅是FPGA發(fā)展的里程碑,也是英特爾對FPGA巨大的潛力的承認(rèn)。FPGA作為未來強(qiáng)大的計算加速器,不但影響主要企業(yè)的決策和市場趨勢,而且加速企業(yè)中的工作負(fù)載,促進(jìn)超大規(guī)模數(shù)據(jù)中心的內(nèi)部搜索,以及提高高性能計算模擬的地位。

在跨越2017年之際,F(xiàn)PGA在應(yīng)用程序中等級中新增了機(jī)器學(xué)習(xí)和深度學(xué)習(xí),這給FPGA產(chǎn)業(yè)敲下了又一重錘。

我們知道,相對于專業(yè)的ASIC,F(xiàn)PGA有上市時間和成本上的優(yōu)勢。另外,在大多數(shù)情況下,F(xiàn)PGA執(zhí)行某些功能較之CPU上的軟件操作更高效。這就是為什么我們認(rèn)為它不但會運(yùn)用在數(shù)據(jù)中心的服務(wù)器、交換器、存儲層的各個角落,并且具有加速整個工作流程的功能。

然而我們不能過分樂觀,尤其是在2015年12月,Intel以167億美元收購了FPGA生產(chǎn)商Altera之后。

在2014年年底,當(dāng)時還處于獨立的Altera公司高層盯上了基于CPU+FPGA的數(shù)據(jù)中心并行計算的發(fā)展前景——這個當(dāng)時價值大約10億美元的市場。而并非數(shù)據(jù)中心里約2.5億美元的CPU-GPU市場和直接應(yīng)用CPU處理器的90億美元市場。

Altera做出這個決定的原因在于他們認(rèn)為這個組合較之另外兩個方案,有編程的簡便性和能效優(yōu)勢。人們對CPU非常熟悉,并發(fā)現(xiàn)尋找C程序員也不會太難。因此對大部分開發(fā)者來說,在執(zhí)行運(yùn)算任務(wù)的時候,持續(xù)使用這種方案不需要冒太大的風(fēng)險,但是能源效率相對比較低,尤其是在密集的計算和固有的并行工作負(fù)載的情況底下。

至于CPU+GPU的方案,程序員并不是很熟悉,但是擁有很高的效率。

根據(jù)Altera的估計,使用OpenCL對混合CPU-FPGA系統(tǒng)進(jìn)行編程比使用Nvidia的CUDA環(huán)境對于程序員來說更容易(某些方面肯定是有爭議的),但用HDL來硬編程FPGA是相當(dāng)困難的,因此需要OpenCL或者通過其他抽象層來將CPU中的負(fù)載轉(zhuǎn)移到FPGA上。

Intel收購Altera改變FPGA格局

這個十億美元的數(shù)據(jù)中心市場被Altera、Xilinx和其他FPGA供應(yīng)商瓜分。在Intel于2015年6月收購了Altera之后,這個市場變得更加復(fù)雜。

在收購之前的2014年,Altera的19億美元收入中,有16%來自于與數(shù)據(jù)中心相關(guān)的計算、網(wǎng)絡(luò)和存儲業(yè)務(wù),其總值達(dá)到3.04億美元。那些在這個領(lǐng)域深耕十幾二十年的通信和無線設(shè)備系統(tǒng)制造商想要有更高的能源效率,更低的成本和更高的擴(kuò)展性,這些都是FPGA所擅長的領(lǐng)域。另外有一點需要提一下,那就是在執(zhí)行這些功能的時候,使用FPGA并不需要像使用CPU那樣需要操作系統(tǒng)和相應(yīng)的軟件。這部分的營收占了Altera營收的44%,總額為8.35億美元。

Altera另外的22%收入,即4.18億美元,來自工業(yè)控制、軍事設(shè)備和汽車制造等領(lǐng)域。他們面對相同的困境,因此選擇FPGA來處理他們的一些工作負(fù)載。

其實早在2014年,英特爾看中了價值1150億美元的各種類型的芯片潛在市場。當(dāng)中可編輯邏輯設(shè)備(以FPGA為主)約占4%,ASIC占18%,其余為ASSP的大雜燴。

在可編輯邏輯設(shè)備的領(lǐng)域中,英特爾預(yù)估Altera占有48億美元市場中的39%,Xilinx占有49%,剩下供應(yīng)商則占據(jù)剩下的12%。

當(dāng)時英特爾沒有收購Altera的原因是因為FPGA業(yè)務(wù)的增長速度幾乎與其數(shù)據(jù)中心集團(tuán)(為服務(wù)器,存儲和交換機(jī)制造商提供芯片,芯片組和主板)的速度一樣快。

再者,英特爾沒有這樣做也是因為摩爾定律逐漸緩慢下來的腳步,給FPGA帶來了日益增長的競爭威脅。

實際上,如果應(yīng)用的話,在數(shù)據(jù)中心里不止安裝一個FPGA、GPU或DSP加速器,但不需要安裝多個Xeon CPU。由于英特爾不能繼續(xù)為Xeons提供更多的核心和加速器,所以他們得出了將FPGA當(dāng)做加速器的結(jié)論。

除非FPGA能在數(shù)據(jù)中心創(chuàng)造5億美元的收益,或者幾年后創(chuàng)造10億美元或更多的收入。不然英特爾寧愿犧牲兩至三倍的Xeon收入,也不會把Xeon的收入拱手相讓。

深度學(xué)習(xí)加持,F(xiàn)PGA前景可人

根據(jù)英特爾的預(yù)測,他們計劃從現(xiàn)在到2023年以接近直線增長率來提升FPGA的業(yè)務(wù)。對此我們總是抱有懷疑的態(tài)度。但FPGA業(yè)務(wù)隨著時間的推移或多或少地在增長(比15年前增長約2.5倍)。

英特爾還預(yù)計,F(xiàn)PGA的營收在2014年到2023年之間將會再翻一倍。按照英特爾預(yù)測,從2014年到2023年間其復(fù)合年增長率為7%,其收入應(yīng)該略低于預(yù)測的89億美元。有趣的是,由于英特爾的預(yù)測并沒有把來自數(shù)據(jù)計算中心(服務(wù)器,交換和網(wǎng)絡(luò))的FPGA收入份額納入計劃中,這將會發(fā)生很大變化。讓我們分析一下:

如果Altera和Xilinx的市場份額沒有發(fā)生改變,且假設(shè)Altera的收入在網(wǎng)絡(luò),計算和存儲的部分保持不變,那么Altera這一部分的業(yè)務(wù)收入到2023年將會達(dá)到5.6億美元左右。我們認(rèn)為Intel這樣的數(shù)據(jù)低估了數(shù)據(jù)中心在提供更有效和靈活計算所面對的壓力。不給過我們認(rèn)為FPGA的前景遠(yuǎn)遠(yuǎn)優(yōu)于這個預(yù)測。也就是說,許多FPGA技術(shù)的支持者一直期待FPGA在數(shù)據(jù)中心中獲得計算合法化的那天很快到來。

諷刺的是,英特爾本身作為FPGA的編程專家,硬件描述語言的使用者,以及知名的ASIC制造商,竟成為推動FPGA成為加速器優(yōu)先選擇的主要參與者。這樣的加速器既能作為獨立的離散計算元件,又可以作為混合 CPU-FPGA器件。

這也是為什么從2016年以來,我們看到所有關(guān)于Altera的新聞都是昭示FPGA將會有的大規(guī)模增的增長。所以至少在短期,他們除了為其他的FPGA制造商作嫁衣裳,幾乎別無他法。

這次收購不僅是FPGA發(fā)展的里程碑,也是英特爾對FPGA巨大的潛力的承認(rèn)。FPGA作為未來強(qiáng)大的計算加速器,不但影響主要企業(yè)的決策和市場趨勢,而且加速企業(yè)中的工作負(fù)載,促進(jìn)超大規(guī)模數(shù)據(jù)中心的內(nèi)部搜索,以及提高高性能計算模擬的地位。

在跨越2017年之際,F(xiàn)PGA在應(yīng)用程序中等級中新增了機(jī)器學(xué)習(xí)和深度學(xué)習(xí),這給FPGA產(chǎn)業(yè)敲下了又一重錘。

首先,在2016年第二季度英特爾財務(wù)聲明會上,Krzanich承諾,英特爾將加強(qiáng)對目前使用Altera的ARM-FPGA芯片客戶的支持。

Waxman進(jìn)一步澄清:“我們的觀點是會以某種形式把FPGA集成到Xeon里。我們已經(jīng)公開宣布將會打造第一代使用這種單一封裝的設(shè)備,但是我們將根據(jù)進(jìn)展情況調(diào)整方向,甚至可能會在同一個die上實現(xiàn)。我們將根據(jù)客戶的反饋了解什么是正確的組合。

順便說一下,我仍然期待看到?jīng)]有集成的系統(tǒng),保持他們會做系統(tǒng)級的協(xié)同。我們不會將Xeon與FPGA以多種方式組合集成,反之我們會在市場上找到正確的目標(biāo)和平衡?!?/p>

編程問題首當(dāng)其沖

雖然Altera的工具集利用OpenCL編程模型獲得應(yīng)用程序代碼,并將其轉(zhuǎn)換為RTL(FPGA的原生語言),但是有趣的是,英特爾并不認(rèn)為FPGA在數(shù)據(jù)中心的未來成功是基于OpenCL與RTL工具集成的改進(jìn)或更廣泛地采用OpenCL。

Waxman也強(qiáng)調(diào)地說:“這并不是以O(shè)penCL為基礎(chǔ)的?!彪m然我們確實把OpenCL看作是進(jìn)一步擴(kuò)大FPGA應(yīng)用范圍的一個途徑,但目前FPGA的初始云端部署可能由更具能力的公司完成,但他們并沒有要求我們提供OpenCL。Waxman補(bǔ)充說。

Waxman在不能“自由”地談?wù)摰那闆r下,暗示英特爾有計劃使FPGA更容易編程。他表示Intel將會為程序員提供RTL庫,方便他們調(diào)用在FPGA上部署的例程,并推動在其上執(zhí)行應(yīng)用程序的gate的形成,來實現(xiàn)應(yīng)用程序例程的gate,而不是讓他們自己創(chuàng)建例程。這有一定的意義,與Convey(現(xiàn)在是美光科技的一個部門)幾年前用FPGA加速系統(tǒng)處理的方案一樣。

Waxman說:“我認(rèn)為有一個連續(xù)的加速。在一開始,你可能不知道你正在試圖加速什么,只是做了一些嘗試,因此在這個階段加速,你想要的是一個更通用的目的。當(dāng)你開始真正地想要加速的時候,你會想要更高效的,更低的功耗和更少的空間,這時你就會把焦點移到FPGA上?!?/p>

Waxman還引用了Microsoft在其“Catapult”系統(tǒng)上使用FPGA加速的方案來說明。

該系統(tǒng)采用其Open Cloud Server并添加FPGA夾層卡作為加速器。我們在3月份研究了這個項目,將這些加速器應(yīng)用在Google上執(zhí)行相同的圖像識別訓(xùn)練算法,得出的結(jié)果顯示,25瓦的FPGA器件相對于使用Nvidia Tesla K20 GPU加速器(235瓦特)的服務(wù)器,提高了更好的性能/瓦特。

正如我們所說,我們對于微軟和Google發(fā)布的性能數(shù)據(jù)毫無疑問。但是對分立的GPU或FPGA執(zhí)行應(yīng)用性能和對自身的熱配置文件進(jìn)行測量都是不公平的。你必須在服務(wù)器節(jié)點級別上看到這一點。

如果意識到這點,得到FPGA輔助的Microsoft服務(wù)器在系統(tǒng)級只稍稍領(lǐng)先于用Tesla K20s的Google服務(wù)器。(這些只是我們基于每秒每瓦特圖像處理性能的估計)。在這個對比中,Microsoft應(yīng)該不考慮成本。而且坦白說,不同于什么都配備的Tesla GPU,微軟開放云端服務(wù)器并沒有使用Juice或Cooling。真正的評測怎么都會使用GPU夾層卡,同時還需要考慮熱量,性能和價格等因素。

但是Waxman討論的重點仍然是那個?!霸谀硞€時候,你真的很想要那個能給你驚喜,并且能做到更低功耗的方案。而這就是我們的FPGA方案所擅長的方面。”

云端業(yè)務(wù)

最后要考慮的是英特爾的云端業(yè)務(wù)。這些客戶現(xiàn)在占據(jù)了他們數(shù)據(jù)中心集團(tuán)收入的25%。

整體來看,他們的購買量每年增長約25%。預(yù)計從2016年開始,未來幾年整體數(shù)據(jù)中心集團(tuán)業(yè)務(wù)都將增長15%。讓我們做一些計算。

如果英特爾的計劃如期實施,他的數(shù)據(jù)中心集團(tuán)2016年收益將會達(dá)到166億美元。云端服務(wù)提供商(其中包括在The Next Platform上使用我們的語言的云端構(gòu)建者和超大規(guī)模計算者)占大約41億美元,其余歸屬于英特爾數(shù)據(jù)中心,銷售數(shù)據(jù)大約為125億美元。因此,英特爾數(shù)據(jù)中心的業(yè)務(wù)增長在12%左右(除云端外),是云端速率的一半。英特爾需要以任何方式來滿足云端的增長和明顯的FPGA需求,即使它只占用Xeon容量的一點點。對于英特爾來說是這個的選擇比讓GPU加速持續(xù)增長的方案要好。

編程方面可能是阻礙FPGA被廣泛采用的一個主因(不像其他加速器,具有豐富的開發(fā)生態(tài)系統(tǒng),如Nvidia GPU的CUDA)。這就驅(qū)動程序員去基于C語言去做擴(kuò)展設(shè)計,或使用OpenCL,而不是用過去困擾FPGA開發(fā)的低級模型。但即使在應(yīng)用的過程中有這么多里程碑,F(xiàn)PGA仍然不被主流青睞。我們將會探索解決編程問題的方法和機(jī)會。

雖然我們已經(jīng)與這個相對較小的生態(tài)系統(tǒng)中的許多供應(yīng)商(包括Altera和Xilinx,兩個主要供應(yīng)商)進(jìn)行了交流,但按照FPGA長期研究員Russell Tessier所說,F(xiàn)PGA在更廣闊的市場上大展拳腳的日子還在前面,新的發(fā)展意味著更廣泛的采用。

他在馬薩諸塞大學(xué)(他還在Altera工作,并且Mentor Graphics收購的虛擬機(jī)工程的創(chuàng)始人)研究了FPGA二十多年,他認(rèn)為FPGA從科學(xué)項目到企業(yè)應(yīng)用的形勢正式緩變化。他認(rèn)為其中的關(guān)鍵是來自于設(shè)計工具的改進(jìn),設(shè)計人員不斷提高他們設(shè)計高水平。除此與外,工具vendor可以更好地引導(dǎo)芯片發(fā)展。他補(bǔ)充說,設(shè)備內(nèi)的大量邏輯量意味著用戶能夠?qū)崿F(xiàn)更多的功能,這使得FPGA對更多領(lǐng)域更廣泛的吸引力。

Tessier說:“在過去幾年里,F(xiàn)PGA的一個明顯趨勢就是這些設(shè)備更容易“程序化”。

Xilinx目前鼓勵使用其Vivado產(chǎn)品的時候,用C語言進(jìn)行設(shè)計。Altera還有一個已經(jīng)開發(fā)的OpenCL環(huán)境。關(guān)鍵是兩家公司都在試圖創(chuàng)建一個環(huán)境,讓用戶可以使用更熟悉的編程(如C和OpenCL),而不必是使用RTL設(shè)計專家所擅長的Verilog或VHDL。雖然在過去幾年里取得不錯的成績,但這仍然處于推進(jìn)的階段,不過這將有助于把更多的事情地移入主流。

其中一個對FPGA真正有利的因素就是如果將其和芯片搭配使用,建立一個快速的內(nèi)部互聯(lián),它能解決memory和數(shù)據(jù)移動中的限制。這種優(yōu)勢就是吸引Intel收購Altera的主要誘因。另外,如果像英特爾和IBM這樣的大公司能夠積極推動FPGA的軟件生態(tài)系統(tǒng)的建設(shè),其應(yīng)用市場將會迅速擴(kuò)張。FPGA的主流化(至少現(xiàn)在沒有GPU那么重要,)可能會更快地出現(xiàn)。

Tessier解釋:“標(biāo)準(zhǔn)核心處理器集成的增加肯定是關(guān)鍵所在。過去的障礙是語言和工具,隨著這些障礙越來越少,為芯片供應(yīng)商新的合作機(jī)會打開了一扇門。由于這些和其他“主流化”趨勢出現(xiàn),不斷做出的改變的FPGA的應(yīng)用領(lǐng)域?qū)⒗^續(xù)增長。例如,金融服務(wù)商店是第一個使用FPGA進(jìn)行財務(wù)趨勢和股票選擇分析的用戶,但使用案例正在擴(kuò)大。現(xiàn)在有更強(qiáng)的設(shè)備可以解決更大的問題。

更廣泛的應(yīng)用領(lǐng)域

除此之外,F(xiàn)PGA通過的其他新領(lǐng)域發(fā)現(xiàn)新用途,包括DNA測序,安全性,加密和一些關(guān)鍵的機(jī)器學(xué)習(xí)任務(wù)。

當(dāng)然,我們希望FPGA變得強(qiáng)大,并“進(jìn)入”世界上最大的云端和超大規(guī)模數(shù)據(jù)中心,Xilnix數(shù)據(jù)中心部門副總裁Hamant Dhulla對此表示強(qiáng)烈贊同。他在2016年初,他告訴The Next Platform, “異構(gòu)計算已經(jīng)不再是一種趨勢,而是現(xiàn)實”,也就是在那個時候,微軟推出了使用FPGA的Catapult案例(現(xiàn)在就很多或以后會很多),英特爾收購了Altera以及看到了更多FPGA將廣泛應(yīng)用在數(shù)據(jù)中心的聲明。

從機(jī)器學(xué)習(xí),高性能計算,數(shù)據(jù)分析等領(lǐng)域,F(xiàn)PGA在更多樣化的應(yīng)用領(lǐng)域中嶄露頭角。這些都與FPGA上嵌入了越來越多可用的on-chip存儲器有關(guān),這些都是FPGA制造商和潛在終端用戶所期待的。 Dhulla表示,市場潛力足夠大,讓Xilinx能夠調(diào)整其業(yè)務(wù)的方式。 過去幾年,存儲和網(wǎng)絡(luò)主導(dǎo)了FPGA用戶群。但未來五年內(nèi),計算端的需求將遠(yuǎn)遠(yuǎn)超過存儲和網(wǎng)絡(luò),并都將沿著穩(wěn)定的增長線繼續(xù)發(fā)展。

在FPGA其他的熱門領(lǐng)域(包括機(jī)器學(xué)習(xí)),它們的更像是一個帶有GPU 的“協(xié)作”加速器。毫無疑問,對于許多機(jī)器學(xué)習(xí)工作負(fù)載的訓(xùn)練部分,GPU是主要的。因此為這里需要很多計算能力,就像HPC一樣,其中power envelope tradeoff值得的。但是這些客戶購買了數(shù)十或數(shù)百個GPU,而不是數(shù)十萬個,龐大的加速器數(shù)目正使用在機(jī)器學(xué)習(xí)pipeline的推理部分,這就是市場所在。

正如我們指出的,Nvidia正在使用兩個獨立的GPU(用M4來訓(xùn)練,更低功耗的M4插入來削減服務(wù)器)來抵消這一點,但Dhulla認(rèn)為FPGA仍然能夠通過采用PCIe方法降低功耗,也可以嵌入超大規(guī)模數(shù)據(jù)中心。

他們的SDAccel編程環(huán)境通過提供對C,C ++和OpenCL的高級接口,使其更實用,但是推動超大規(guī)模和HPC采用的真正途徑是通過最終用戶示例。

當(dāng)涉及到這些早期的用戶,就像為下一代的FPGA的應(yīng)用搭建了舞臺,Dhulla指向像Edico Genome這樣的公司。Xilinx目前還與其他領(lǐng)域的客戶合作,包括石油和天然氣和金融方面的歷史計算方面。早期客戶將Xilinx 的FPGA應(yīng)用在機(jī)器學(xué)習(xí),圖像識別和分析以及安全性方面,這可以看作他們計算加速業(yè)務(wù)發(fā)展的第一步。

盡管雙精度性能和總體價格不佳,F(xiàn)PGA的真正的大規(guī)模應(yīng)用機(jī)會在于云端。因為FPGA可以提供GPU所不能提供的優(yōu)勢。如果FPGA供應(yīng)商能夠說服其最終用戶,他們的加速器可以提供相當(dāng)大的性能提升(在某些情況下他們會這樣做)給關(guān)鍵的工作負(fù)載。提供一個通過帶有其他加速器(例如CUDA)的complexity-wise的編程環(huán)境推進(jìn)OpenCL開發(fā),通過在云端中提供FPGA來解決價格問題。這可能是一個新的希望。

當(dāng)然,這種希望來源于將FPGA部署到有超密集服務(wù)器云端架構(gòu)內(nèi),而不是在單機(jī)的銷售上。這種模式已經(jīng)在FPGA的金融服務(wù)中發(fā)生。

正如他們GPU加速器“伙伴”圍繞深度學(xué)習(xí)進(jìn)行拉動,以便迅速得到更多的用戶, FPGA設(shè)備在探索一個通過解決神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的問題的方式找尋入侵市場的真正的機(jī)會。

新的應(yīng)用程序主機(jī)意味著新的市場,隨著云端應(yīng)用的推廣消除了一些管理開銷,它可能意味著更廣泛的采用。FPGA供應(yīng)商努力推動它在一些關(guān)鍵的機(jī)器學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)和搜索方面的應(yīng)用。FPGA在諸如自然語言處理,醫(yī)學(xué)成像,深度數(shù)據(jù)檢測等領(lǐng)域中的超大規(guī)模上下文中變得越來越普遍。

在過去一年里,F(xiàn)PGA的多種應(yīng)用得到曝光,特別是在深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò),以及圖像識別和自然語言處理等領(lǐng)域。例如,微軟使用FPGA在1,632個節(jié)點上提供2倍的搜索服務(wù),并采用創(chuàng)新的高吞吐量網(wǎng)絡(luò)來支持Altera FPGA驅(qū)動的工作。中國的搜索引擎巨頭百度(也是許多深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)任務(wù)GPU用戶)正在用FPGA執(zhí)行存儲控制,其每天的數(shù)據(jù)吞吐量在100TB到1PB之間。

使用FPGA的大規(guī)模數(shù)據(jù)中心和其他領(lǐng)域的應(yīng)用正在吸引人們對FPGA的單精度浮點性能的更多關(guān)注。

雖然一些案例使用(包括百度示例),將GPU作為計算加速器和FPGA用在存儲端,但Altera,Xilnix,Nallatech和IBM的研究人員在OpenPower聯(lián)盟展示了FPGA在云端深度學(xué)習(xí)的光明前景。

可以說現(xiàn)在屬于FPGA的一個黃金時代。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。