讓時(shí)光倒退回到2015年,這一年2月份,FPGA龍頭企業(yè)賽靈思(Xilinx)發(fā)布了業(yè)界首款16nm工藝的FPGA產(chǎn)品——UltraScale+系列FPGA,在FPGA領(lǐng)域風(fēng)光無兩。同年6月份,當(dāng)時(shí)的半導(dǎo)體行業(yè)龍頭英特爾宣布以167億美元收購Altera。此后,人們給賽靈思設(shè)計(jì)出無數(shù)種前途,可是考慮到當(dāng)年50億美元的FPGA市場(chǎng),大家都覺得這是一場(chǎng)實(shí)力懸殊的競爭。
把目光拉回到當(dāng)下,翻看今天的賽靈思官網(wǎng),如果單看FPGA產(chǎn)品,賽靈思似乎沒有什么進(jìn)步,因?yàn)镕PGA產(chǎn)品工藝沒有精進(jìn),豐富的是合作伙伴和開發(fā)支持工具。作為“摩爾定律”的倡導(dǎo)者,英特爾則在FPGA上依然在宣講先進(jìn)工藝的重要性,14nm的FPGA產(chǎn)品和10nm的FPGA產(chǎn)品計(jì)劃都公諸于世。不過需要注意的是,現(xiàn)在FPGA依然是一個(gè)小市場(chǎng),結(jié)合中國報(bào)告網(wǎng)的數(shù)據(jù)來看,2017年全球FPGA市場(chǎng)份額只有67.5億美元,放到4204億美元的半導(dǎo)體市場(chǎng)里,規(guī)模太小了。如果是一家僅有FPGA產(chǎn)品的公司,吃掉整個(gè)市場(chǎng)后相對(duì)于英特爾來說也不夠大。
FPGA被譽(yù)為“萬能芯片”,能量就只有這么一點(diǎn)?當(dāng)然不是的。目前FPGA在數(shù)據(jù)中心領(lǐng)域已經(jīng)得到認(rèn)可,采用FPGA的加速卡解決方案成為數(shù)據(jù)中心的首選。而人工智能通過深度學(xué)習(xí)算法在認(rèn)知智能和推理智能上遇到難題,擅長推理的FPGA被寄予厚望。賽靈思如何借助這一歷史性的機(jī)遇實(shí)現(xiàn)跳躍性發(fā)展呢?答案在10月16日的2018賽靈思XDF(賽靈思開發(fā)者)大會(huì)上揭曉了。
數(shù)據(jù)中心優(yōu)先
目前,各行各業(yè)的數(shù)據(jù)在源源不斷產(chǎn)生,數(shù)據(jù)中心需要越來越多的存儲(chǔ)設(shè)備承載數(shù)據(jù),同時(shí)也要通過大量計(jì)算將無序的數(shù)據(jù)加以提取,形成有用信息,從而服務(wù)于人們的生活。面對(duì)海量的數(shù)據(jù)分析,只憑借CPU來進(jìn)行大數(shù)據(jù)計(jì)算遠(yuǎn)遠(yuǎn)無法滿足需求,因此設(shè)計(jì)人員想到為數(shù)據(jù)中心加速。而可供選擇的加速方案有兩個(gè),一個(gè)是專用的ASIC,一個(gè)是FPGA。FPGA相比其他芯片,最大的優(yōu)點(diǎn)表現(xiàn)在低延遲性、可編程性、低功耗,這是數(shù)據(jù)中心服務(wù)器的剛需。
數(shù)據(jù)中心是FPGA繼通信領(lǐng)域后又一大殺手級(jí)應(yīng)用領(lǐng)域。在數(shù)據(jù)中心解決方案上,F(xiàn)PGA不再僅僅是FPGA,而是加速卡中的加速解決方案。
在英特爾10nm“難產(chǎn)”的關(guān)鍵時(shí)間節(jié)點(diǎn)上,賽靈思的產(chǎn)品走到了前面。開發(fā)者大會(huì)上,賽靈思總裁及首席執(zhí)行官Victor Peng宣布賽靈思將進(jìn)行戰(zhàn)略轉(zhuǎn)型,轉(zhuǎn)型之后將采取數(shù)據(jù)中心優(yōu)先戰(zhàn)略。伴隨而來的還有一個(gè)重磅的新品——Versal ACAP。
賽靈思總裁及首席執(zhí)行官Victor Peng
為什么叫ACAP?Victor Peng解釋說:“ACAP是可擴(kuò)展的一體化程度非常高的計(jì)算平臺(tái),硬件和軟件都是可編程,所以縮寫為ACAP?!?/p>
從介紹材料了解到,Versal 產(chǎn)品組合基于臺(tái)積電(TSMC)的 7 nm FinFET 工藝技術(shù),是第一個(gè)將軟件可編程性與特定領(lǐng)域硬件加速和靈活應(yīng)變能力相結(jié)合的平臺(tái)。該產(chǎn)品組合包括 6 個(gè)系列的器件,其獨(dú)特架構(gòu)針對(duì)云端、網(wǎng)絡(luò)、無線通信乃至邊緣計(jì)算和端點(diǎn)等不同市場(chǎng)的眾多應(yīng)用提供了可擴(kuò)展性和 AI 推斷功能。
Versal系列產(chǎn)品將于 2019 年下半年上市。有了Versal 系列產(chǎn)品,賽靈思在產(chǎn)品工藝和性能上同時(shí)實(shí)現(xiàn)了超越,無論英特爾如何稱贊自己的10nm工藝,臺(tái)積電的7nm都更被認(rèn)可,何況英特爾10nm“難產(chǎn)”了。
除了基于臺(tái)積電先進(jìn)的7nm工藝打造的Versal ACAP,顯示賽靈思產(chǎn)品改變的還有一款已經(jīng)量產(chǎn)的產(chǎn)品——Alveo。Victor Peng通過三點(diǎn)解讀了這款加速卡的特殊性,第一是速度快;第二是架構(gòu)和算法靈活多變;第三是容易訪問、易于使用。
Victor Peng介紹Alveo
對(duì)英特爾產(chǎn)生威脅的除了產(chǎn)品之外還有產(chǎn)品背后的平臺(tái)和生態(tài)。在開發(fā)者大會(huì)上,Victor Peng表示,賽靈思已經(jīng)不再是一家FPGA企業(yè),而是一家平臺(tái)公司,并且要超越FPGA來開發(fā)整個(gè)平臺(tái)。Alveo有一個(gè)很廣泛的生產(chǎn)系統(tǒng)和合作伙伴ISA,包括數(shù)據(jù)庫的加速、數(shù)據(jù)分析,視頻處理、金融服務(wù)、機(jī)器學(xué)習(xí),已經(jīng)有14個(gè)應(yīng)用合作伙伴為Alveo平臺(tái)開發(fā)。
此外,在會(huì)上開發(fā)者們也看到了華為、浪潮基于賽靈思的FPGA打造自己的加速卡產(chǎn)品。
FPGA在人工智能推理上的“天賦異稟”
賽靈思實(shí)現(xiàn)跳躍式發(fā)展還有一個(gè)機(jī)會(huì)是人工智能。分析師們認(rèn)為FPGA是人工智能推理時(shí)代的“GPU”,背后的巨頭公司將成為下一個(gè)英偉達(dá)。賽靈思軟件及IP產(chǎn)品執(zhí)行副總裁Salil Raje指出:“今后AI模型必須應(yīng)用在云端和邊緣的模型上,所以未來的模式更多的是推斷,而不是訓(xùn)練。賽靈思關(guān)注的就是推斷?!?/p>
賽靈思軟件及IP產(chǎn)品執(zhí)行副總裁Salil Raje
GPU在人工智能的感知智能和認(rèn)知智能前期獲得了巨大的成功,英偉達(dá)也借此實(shí)現(xiàn)公司股價(jià)的水漲船高。隨著認(rèn)知智能的發(fā)展和推理智能的到來,GPU數(shù)據(jù)并行的體系結(jié)構(gòu)出現(xiàn)了弊端,流水線并行的FPGA擁有更低的延遲特性。Salil Raje提到:“對(duì)CPU和GPU而言,內(nèi)存的帶寬非常關(guān)鍵,內(nèi)存就是一個(gè)瓶頸,對(duì)于大的結(jié)果來說,希望能夠一次上載和下載。CPU和GPU通過批量可以做高吞吐量或者是低延遲,但是沒有辦法兩者兼顧。FPGA獲得高通量的方式是通過自定義數(shù)據(jù)流、自定義內(nèi)存層次結(jié)構(gòu)和自定義精度來實(shí)現(xiàn),所以有高吞吐量,同時(shí)還可以實(shí)現(xiàn)低延遲?!?/p>
同時(shí)實(shí)現(xiàn)高數(shù)據(jù)吞吐量和低時(shí)延,加上FPGA現(xiàn)場(chǎng)可編程的特性,其在人工智能推理階段的前途被廣泛看好。
因此,賽靈思將戰(zhàn)略中心轉(zhuǎn)移到數(shù)據(jù)中心業(yè)務(wù)上,拼的是FPGA的現(xiàn)在,廣泛關(guān)注人工智能推理則是押注未來。在數(shù)據(jù)洪流和人工智能推理時(shí)代的FPGA是沒有人敢小覷的,在FPGA深耕多年的賽靈思也就更無人敢忽視。正如Victor Peng所言:“我們起點(diǎn)很低,只要大家有熱情、有準(zhǔn)備,而且有非常高遠(yuǎn)的目標(biāo),隨著時(shí)間的推移,我們就能夠?qū)崿F(xiàn)非常了不起的結(jié)果?!?/p>