芯片,是最近的熱門話題,我們要關(guān)注的不僅僅是手機芯片,也要關(guān)注汽車芯片,更何況智能網(wǎng)聯(lián)汽車業(yè)需要大量的芯片,其中,最重要的就是自動駕駛計算平臺需要用到的芯片。
北京時間5月21日,總部位于美國加州圣克拉拉市的半導體公司Achronix,在中國深圳舉辦交流會,宣布推出全新的7nm FinFETSpeedster7t系列產(chǎn)品,該產(chǎn)品可以滿足人工智能/機器學習(AI/ML)和高帶寬數(shù)據(jù)加速應(yīng)用的需求。
人工智能和機器學習的一大應(yīng)用就是自動駕駛,領(lǐng)頭羊Waymo采用的是英特爾CPU+Altera FPGA的方案來解決自動駕駛所需要的數(shù)據(jù)融合和算法處理,因為PFGA作為硬件加速器,可以作為GPU的有效補充,應(yīng)用為汽車主控芯片。
據(jù)Achronix總裁兼首席執(zhí)行官Robert Blake介紹,Speedster7t系列基于一種高度優(yōu)化的全新架構(gòu),從而獲得有類似ASIC一樣的性能、可簡化設(shè)計的FPGA靈活性和增強功能,會遠高于傳統(tǒng)的FPGA解決方案。
在中國自動駕駛領(lǐng)域,也有部分的公司采用了FPGA的方案,配合CPU或者GPU,搭建自己的解決方案,Achronix新推出的7nm FPGA系列產(chǎn)品Speedster7t,提供了Altera、Xilinx之外的多一種選擇,也給國內(nèi)FPGA廠商壓力。
01 FPGA在自動駕駛的應(yīng)用
智能網(wǎng)聯(lián)汽車對計算的要求在不斷提高,尤其是自動駕駛技術(shù)在面臨多傳感器數(shù)據(jù)融合處理的問題,傳統(tǒng)的汽車MCU的算力是滿足不了要求了,GPU、FPGA、ASIC等AI芯片就開始進入汽車市場。
正如前面所言,自動駕駛領(lǐng)域的全球領(lǐng)頭羊Waymo,也是采用CPU+FPGA的方案,其計算平臺采用了英特爾Xeon 12核以上CPU,搭配了Altera的Arria系列FPGA芯片,并且采用英飛凌的Aurix系列MCU作為CAN或FleRay網(wǎng)絡(luò)的通信連接。
在中信證券許英博的研究報告認為,在汽車主控芯片領(lǐng)域,GPU 仍將保持通用汽車主控芯片的主流地位, FPGA作為有效補充, ASIC 將成終極方向。
目前,人工智能及智能駕駛算法尚未定型,GPU作為通用加速器,預(yù)計仍將在相當長一段時間內(nèi)保持其汽車主控芯片的主流地位; FPGA 作為硬件加速器, 料將成為 GPU 的有效補充;將來如果全部或部分智能駕駛算法得以固化, ASIC 將成為最優(yōu)性價比的終極選擇。
下面是GPU、FPGA和ASIC各個芯片的一些特點:
GPU:通用性強、速度快、效率高。適合用在深度學習訓練方面,但是性能功耗比較低;
FPGA:具有低能耗、高性能以及可編程等特性。相對于 CPU 與 GPU 有明顯的性能或者能耗優(yōu)勢,但對使用者要求高;
ASIC:可以更有針對性地進行硬件層次的優(yōu)化,從而獲得更好的性能、功耗比。弊端在于ASIC 芯片的設(shè)計和制造需要大量的資金、較長的研發(fā)周期和工程周期,而且深度學習算法仍在快速發(fā)展,若深度學習算法發(fā)生大的變化,F(xiàn)PGA 能很快改變架構(gòu),適應(yīng)最新的變化,ASIC 類芯片一旦定制則難于進行修改。
但就現(xiàn)階段而言,F(xiàn)PGA讓自動駕駛開發(fā)更具靈活性當前處于自動駕駛發(fā)展的“試錯”階段,算法的更新迭代周期非常短,這給FPGA更多的市場機會。根據(jù)市場調(diào)研公司Semico Research的預(yù)測,人工智能應(yīng)用中FPGA的市場規(guī)模,將會在未來4年增長3倍,達到52億美元。
02 7nm的Speedster7t
除了采用7nm FinFET工藝制造(7nm真的很貴?。琒peedster7t系列產(chǎn)品的優(yōu)勢在于全新的架構(gòu),以平衡片上處理、互連和外部輸入輸出接口(I/O),以實現(xiàn)數(shù)據(jù)密集型應(yīng)用吞吐量的最大化,這些應(yīng)用場景可見于基于邊緣計算和基于服務(wù)器的AI/ML應(yīng)用、網(wǎng)絡(luò)處理和存儲。
高性能計算和機器學習系統(tǒng)的一個重點要求就是高片外存儲器帶寬,這樣可以為多個數(shù)據(jù)流提供存儲源和緩沖,據(jù)介紹,Speedster7t器件是唯一支持GDDR6的FPGA,每個GDDR6存儲器都能夠支持512Gbps的帶寬,多達8個GDDR6控制器則可以支持4Tbps的GDDR6累計帶寬。
Speedster7t系列產(chǎn)品之所以能夠支持如此高的帶寬,是因為該系列產(chǎn)品專門為高帶寬應(yīng)用進行了設(shè)計,具有一個革命性的全新二維片上網(wǎng)絡(luò)(2D NoC),以及一個高密度全新機器學習處理器(MLP)模塊陣列,從而把FPGA的可編程性與ASIC的布線結(jié)構(gòu)和計算引擎結(jié)合起來,創(chuàng)造了一類全新的“FPGA+”技術(shù)。
正如前面所言,可能現(xiàn)階段自動駕駛還處于“試錯”階段,F(xiàn)PGA可編程的特點可以在現(xiàn)在贏得市場,但是隨著自動駕駛技術(shù)的發(fā)展,其算法逐漸穩(wěn)定,需要將算法進行SoC的時候,可能就是ASIC的天下了。
對于Speedster7t的設(shè)計方Achronix公司而言,這個問題已經(jīng)考慮到了,基于Achronix公司是一家既提供獨立FPGA芯片又提供Speedcore嵌入式FPGA(eFPGA)半導體知識產(chǎn)權(quán)(IP)的公司,Achronix在SpeedcoreEFPGA IP中采用了與Speedster7t FPGA中使用的同一種技術(shù),可支持從Speedster7t FPGA到ASIC的無縫轉(zhuǎn)換。
FPGA應(yīng)用通常具有必須保持可編程性的功能,而其他固定功能則是應(yīng)用于特定的系統(tǒng)應(yīng)用。對于ASIC的轉(zhuǎn)換而言,固定功能可以被固化進ASIC結(jié)構(gòu)中,從而減少芯片面積、成本和功耗。
據(jù)Achronix介紹,當使用SpeedcoreeFPGA IP將Speedster7t FPGA轉(zhuǎn)換為ASIC時,用戶有望節(jié)省高達50%的功耗并且降低90%的成本。這個能夠?qū)崿F(xiàn)的話,可以讓Achronix公司的Speedster7t系列產(chǎn)品,在自動駕駛領(lǐng)域,應(yīng)該會有著較好的應(yīng)用前景。
03
Achronix總裁兼首席執(zhí)行官Robert Blake在深圳交流會后,就馬不停蹄地前往北京,接著在北京時間5月22日與當?shù)孛襟w進行交流。值得關(guān)注的一個細節(jié)就是,Speedster7t在美國當?shù)匕l(fā)布的時間(北京時間5月21日23:00)還是位于中國之后的,可見Achronix對中國市場的重視。
當問及當前的貿(mào)易環(huán)境時,Robert Blake表示專注于自己能做的事情上,并且看好中國市場。在Robert Blake在深圳與媒體交流的時候,華為任正非在同一時間接受媒體采訪,也談及了相關(guān)內(nèi)容,其談話內(nèi)容也在朋友圈刷屏了,相信大多數(shù)讀者都看到了。
總結(jié)就是,市場很大、機會很大、諸君努力。