由于收購FPGA龍頭老大賽靈思顯然是不現(xiàn)實(shí)的,而行業(yè)排名第二的阿爾特拉已經(jīng)被Intel以167億美元捷足先登,因此就退而求其次收購萊迪思了,而這也已經(jīng)很不容易了。
11月3日,萊迪思半導(dǎo)體與傳聞中有中資背景的基金Canyon Bridge共同宣布,雙方簽署收購協(xié)議,Canyon Bridge將以13億美元的價(jià)格溢價(jià)30%收購萊迪思半導(dǎo)體。在交易完成以后,Lattice將會繼續(xù)以一間獨(dú)立的子公司的身份繼續(xù)運(yùn)營。
目前,該交易已經(jīng)被兩家公司董事會一致批淮,如果通過美國相關(guān)部門審核,而且被萊迪思股東大會通過,該交易有望于2017年上半年完成。不過,22名美國國會議員在12月5日致函美國財(cái)長雅各布?盧,以安全擔(dān)憂為由要求阻止與中國政府有關(guān)聯(lián)的基金收購美國晶片制造商萊迪思半導(dǎo)體,美國國會議員在信函中說,這項(xiàng)交易可能擾亂美國軍方的供應(yīng)鏈,導(dǎo)致美國國防部許多重要計(jì)劃要依賴源自國外的技術(shù)。
雖然這場收購是否會步中資收購德國半導(dǎo)體是設(shè)備廠愛思強(qiáng)公司的后塵還無從得知,但美國對中國政府嚴(yán)格的技術(shù)封鎖已經(jīng)展露無遺。在排除比較陰謀論的中國政府力圖通過收購萊迪思獲取有關(guān)FPGA的技術(shù)后,一起來看看這場收購的其他因素。
這場收購與深度學(xué)習(xí)的關(guān)系有多大?
相對于之前的那種比較陰謀論的觀點(diǎn)——中國政府背后主導(dǎo)了這次針對萊迪思的收購,另一種觀點(diǎn)認(rèn)為這僅僅是Canyon Bridge看好FPGA在深度學(xué)習(xí)方面的發(fā)展前景。
在阿法狗大戰(zhàn)李世石后,人工智能越來越多成為輿論的熱點(diǎn),深度學(xué)習(xí)的熱度也越來越高,但芯片計(jì)算能力卻成為一道瓶頸——傳統(tǒng)的處理器是為了進(jìn)行通用計(jì)算發(fā)展起來的,處理效率不高,谷歌甚至需要使用上萬個中央處理器運(yùn)行7天來訓(xùn)練一個識別貓臉的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。科大訊飛曾經(jīng)采用大量CPU來支持大規(guī)模數(shù)據(jù)預(yù)處理,運(yùn)行GMM-HMM等經(jīng)典模型的訓(xùn)練,在千小時(shí)的數(shù)據(jù)量下,效果也不理想。
因此,為了提高深度學(xué)習(xí)效率,逐漸衍生出使用CPU+GPGPU、眾核芯片、CPU+FPGA和使用專門針對人工智能而開發(fā)的NPU幾種方案。
GPGPU可以實(shí)現(xiàn)高并行計(jì)算和高計(jì)算吞吐,適用于計(jì)算密集、高并行、SIMD應(yīng)用,尤其擅長圖形圖像、矩陣計(jì)算等方面的應(yīng)用,英偉達(dá)的GPGPU雙精浮點(diǎn)性能可達(dá)5.3TFlops,英偉達(dá)還專門開發(fā)的DGX-1系統(tǒng),并宣稱DGX-1比 21 個 Xeon Phi 服務(wù)器集群快一點(diǎn),比四個 Xeon Phi 服務(wù)器集群快 5.3 倍。
Intel的眾核芯片雙精浮點(diǎn)性能為3 TFlops,性能功耗比為12 GFlops/W,雖然在性能上目前稍遜于GPGPU,但具有高應(yīng)用適應(yīng)性和易編程等多方面的特性,KNL眾核處理器可以與CPU相同的編程模式、語言和優(yōu)化方法,這對Intel眾核處理器搶占市場有較大幫助。
中科院寒武紀(jì)這樣的NPU是專門針對深度學(xué)習(xí)而開發(fā)的芯片,雖然在絕對性能上不輸于GPGPU,在性能功耗比上亦相對于于CPU會有百倍以上的優(yōu)勢,但在財(cái)力和商業(yè)化能力上,無論是中科院還是新成立的寒武紀(jì)公司都和Intel、英偉達(dá)、賽靈思、阿爾特拉等國際巨頭相距甚遠(yuǎn)。
FPGA的雙精浮點(diǎn)性能雖然相對于英偉達(dá)的GPGPU和Intel的眾核芯片要遜色不少——阿爾特拉展示的一款可以用于深度學(xué)習(xí)和科學(xué)計(jì)算的FPGA其雙精浮點(diǎn)性能為1.5TFlops。雖然性能稍弱一些,但是性能功耗比卻非常驚艷,以達(dá)到50GFlops/W,是Intel眾核芯片的四倍有余,如果將FPGA用于機(jī)器學(xué)習(xí),那么整個系統(tǒng)對于基于標(biāo)準(zhǔn)CPU和GPU的服務(wù)器有明顯的性能功耗比優(yōu)勢,在大規(guī)模部署后可以大幅節(jié)省電費(fèi)開銷。
不過將FPGA用于深度學(xué)習(xí),也存在一些不足。如果說性能功耗比是FPGA占優(yōu)的一方面,那么性價(jià)比就是FPGA的劣勢,F(xiàn)PGA可以通過編程靈活改變自己的內(nèi)部邏輯的同時(shí),也必然意味著計(jì)算資源的大量浪費(fèi)。事實(shí)上如果專門開發(fā)一款和寫入FPGA的電路相同的芯片,同產(chǎn)量理論成本只有FPGA的幾分之一。也就是說保守估計(jì),相同的性能FPGA的成本要高幾倍。事實(shí)上,目前FPGA只用于小規(guī)模產(chǎn)品或測試性質(zhì)的驗(yàn)證中以規(guī)避流片的風(fēng)險(xiǎn)。隨著芯片復(fù)雜程度的提高,芯片面積的增大這個問題還會越來越突出。這也是FPGA誕生那么多年來一直“養(yǎng)在深閨人未識”的重要原因。
FPGA是否能從此走向“深度學(xué)習(xí)”也是未知數(shù)——人的大腦是串行為主的思維模式,而且人類大腦的開發(fā)是相對有限的,有很大的開發(fā)潛力,而FPGA是并行化很高的元件,而且硬件資源是有限的。另外,培養(yǎng)一個FPGA編程工程師比培養(yǎng)一個編寫應(yīng)用軟件的工程師難度大多了,如果采用FPGA自己編寫自己的軟件的話,實(shí)在過于富有想象力——人不善于解決的問題就交給電腦去解決,這非常符合人類邏輯,但是未必符合機(jī)器的規(guī)律。AMD一位工程師曾經(jīng)提到過即使是最先進(jìn)的自動設(shè)計(jì)軟件進(jìn)行電路設(shè)計(jì)也總是比人手工設(shè)計(jì)的芯片面積大20%,同時(shí)還慢20%......
即便存在一些不足,CPU+FPGA依舊有應(yīng)用于深度學(xué)習(xí)的潛力,如果CPU+FPGA異構(gòu)計(jì)算技術(shù)如果在機(jī)器學(xué)習(xí)上成為主流,那么FPGA的市場規(guī)模將會進(jìn)一步擴(kuò)大。
或許,只是單純看好FPGA
其實(shí),深度學(xué)習(xí)領(lǐng)域僅僅是FPGA可能的潛在市場之一,F(xiàn)PGA的潛在市場絕不限于深度學(xué)習(xí)。
在隨著CPU、GPU、DSP等計(jì)算單元被集成到SOC中,嵌入式FPGA現(xiàn)在已經(jīng)開始被集成到一些高容量的SOC芯片中。
隨著無人駕駛的興起,一些MCU也開始嘗試集成嵌入式FPGA,這樣就可以實(shí)現(xiàn)MCU主管駕駛計(jì)算,而嵌入式FPGA則可以同時(shí)執(zhí)行視頻計(jì)算。
更為大膽的設(shè)想是,F(xiàn)PGA也能變成一個IP被授權(quán),并依靠類似于ARM授權(quán)處理器核的思路降低成本。
5G通信的興起也給FPGA——在5G通信時(shí)代,通信基站其實(shí)就是一個小相控陣,這就必須采用FPGA進(jìn)行數(shù)據(jù)處理。
在服務(wù)器上,F(xiàn)PGA也有一展拳腳的機(jī)會,Intel收購阿爾特拉后,也有在服務(wù)器芯片中將自家的CPU和FPGA結(jié)合的舉動——從IDF展會中展出的集成了FPGA芯片的至強(qiáng)E5 2600 v4處理器來看,至強(qiáng)CPU在FPGA的幫助下每瓦性能提升了70%。有觀點(diǎn)認(rèn)為,到2020年,所有主要云計(jì)算公司里1/3的服務(wù)器都將使用FPGA。
在醫(yī)療領(lǐng)域FPGA被用于聲波檢測儀、CT掃描儀、核磁共振、x射線等設(shè)備??梢哉f,在消費(fèi)品電子、物聯(lián)網(wǎng)、汽車電子、深度學(xué)習(xí)、數(shù)據(jù)挖掘、服務(wù)器等方面,F(xiàn)PGA會扮演越來越重要的角色。
從這些角度上講,Canyon Bridge因?yàn)榭春肍PGA的市場前景而收購萊迪思也是說的通的——
由于收購FPGA龍頭老大賽靈思顯然是不現(xiàn)實(shí)的,而行業(yè)排名第二的阿爾特拉已經(jīng)被Intel以167億美元捷足先登,因此就退而求其次收購萊迪思了,而這也已經(jīng)很不容易了。
因此,本次Canyon Bridge收購萊迪思,也可以看作資本對FPGA市場的看好,如同Intel耗資167億美元巨款收購阿爾特拉,美高森美收購Actel的延續(xù)。