? 全面的視覺平臺集成了新的CEVA-XM6 DSP內(nèi)核、硬件加速器、神經(jīng)網(wǎng)絡(luò)軟件框架、軟件庫和廣泛的算法支持
? 推動實現(xiàn)面向大眾市場智能視覺應(yīng)用的嵌入式神經(jīng)網(wǎng)絡(luò)
? 面向自主駕駛、感應(yīng)和躲避式無人機、虛擬和增強現(xiàn)實、智能監(jiān)控、智能手機、機器人等應(yīng)用
專注于智能互聯(lián)設(shè)備的全球領(lǐng)先信號處理IP授權(quán)公司CEVA宣布推出一款基于DSP的全新產(chǎn)品,為低功耗嵌入式系統(tǒng)帶來深度學(xué)習(xí)和人工智能(AI)能力。這款全面的可擴展集成硬件和軟件IP平臺的核心是全新圖像和視覺DSP CEVA-XM6 ,使得開發(fā)人員能夠高效地利用神經(jīng)網(wǎng)絡(luò)和機器視覺能力,用于智能手機、無人駕駛車輛、監(jiān)控、機器人、無人機和其它帶有相機功能的智能器件。
與上一代CEVA-XM4智能視覺DSP相比,這個基于CEVA-XM6的新型視覺平臺的神經(jīng)網(wǎng)絡(luò)性能提高至八倍,所有計算機視覺內(nèi)核性能改善達(dá)到三倍。這個新型架構(gòu)集成的關(guān)鍵增強功能包括新的矢量和標(biāo)量處理單元,以及指令集、存儲帶寬和 DMA的大量增強功能。
這個新型視覺平臺進(jìn)一步擴展了CEVA產(chǎn)品在實施神經(jīng)網(wǎng)絡(luò)時與采用GPU的主流架構(gòu)相比的性能優(yōu)勢。與用于計算機視覺和深度學(xué)習(xí)的領(lǐng)先GPU嵌入式系統(tǒng)相比,CEVA最新的圖像和視覺平臺的性能每瓦特效率(performance-per-watt efficiency)提升25倍以上,用于AlexNet和GoogLeNet等卷積神經(jīng)網(wǎng)絡(luò)(CNN)的處理速度加快四倍。?
CEVA視覺業(yè)務(wù)部副總裁兼總經(jīng)理Ilan Yona稱:“隨著計算機視覺和深度學(xué)習(xí)技術(shù)成為主流,我們需要在高功耗GPU引擎產(chǎn)生的深度神經(jīng)網(wǎng)絡(luò)和部署這些功率和性能受限的嵌入式應(yīng)用之間架起橋梁,消除中間的鴻溝。我們的新型視覺平臺在這方面非常出色,為開發(fā)人員提供最全面的技術(shù)集,能夠快速應(yīng)對這些嵌入式使用案例?!?/p>
這款視覺平臺集成了大量軟件和硬件IP,為在嵌入式系統(tǒng)中部署機器視覺和深度學(xué)習(xí)提供上市時間和功率優(yōu)勢。除CEVA-XM6 DSP本身之外,這平臺還包括CNN特定功能加速器和圖像去扭曲(針對所有類型的圖像變換)、CEVA受到廣泛贊譽的CDNN2神經(jīng)網(wǎng)絡(luò)軟件框架、OpenCV、OpenCL和OpenVX API、CEVA-CV計算機視覺庫,以及一組廣泛應(yīng)用的優(yōu)化算法。
嵌入式視覺聯(lián)盟創(chuàng)立者Jeff Bier道:“各種終端產(chǎn)品的設(shè)計人員都渴望在其設(shè)計中集成視覺智能。通常,這些開發(fā)人員使用的視覺和深度學(xué)習(xí)算法要求以低成本、低功耗,并且可編程的方法提供極高的處理性能。我非常贊賞CEVA長期致力于提供滿足這些需求的處理器和軟件工具?!?/p>
技術(shù)特點
CEVA-XM6以強大的CEVA-XM4和CEVA-MM3101處理器為基礎(chǔ),并已經(jīng)有了超過25個設(shè)計項目。它具備了一系列提供突破性神經(jīng)網(wǎng)絡(luò)性能和高級計算機視覺處理能力的架構(gòu)創(chuàng)新和增強功能,包括:
? 創(chuàng)新矢量處理單元(VPU)架構(gòu):確保95%以上的MAC利用率,是現(xiàn)今業(yè)界中無人能及的卓越水平
? 增強并行分散 – 集中存儲負(fù)荷機制:進(jìn)一步改善視覺算法性能,包括SLAM和深度映射。
? Sliding Window 2.0? :這個專利機制利用圖像處理的像素重疊,有助于在更廣泛的神經(jīng)網(wǎng)絡(luò)中實現(xiàn)更高的利用率,以及適應(yīng)這些網(wǎng)絡(luò)日益增加的復(fù)雜性。
? 選件32路SIMD矢量浮點單元,其中包括IEEE半精度標(biāo)準(zhǔn)(FP16)和重大的非線性運算增強。
? 其它改進(jìn)包括加速CNN性能的增強3D數(shù)據(jù)處理方案,與CEVA-XM4相比,控制代碼性能改進(jìn)了50%,并具有進(jìn)一步縮小代碼尺寸的新的可擴展單元及多核和系統(tǒng)集成支持。
除CEVA-XM6 DSP外,這種視覺平臺的其它關(guān)鍵部件包括:
? CDNN加速器:16位CDNN加速器具有512 MACs/cycle,確保提供業(yè)界最佳性能以處理目前最復(fù)雜的神經(jīng)網(wǎng)絡(luò)。CDNN加速器還用于釋放CEVA-XM6 DSP內(nèi)的256 MAC單元,允許并行運行其它計算機視覺任務(wù)。這種靈活的方法使得CDNN加速器配合CEVA-XM6的架構(gòu)成為了支持新的圖像算法、網(wǎng)絡(luò)結(jié)構(gòu)和改變快速演變的深度學(xué)習(xí)空間中的層類型的最佳選擇。
? 圖像去扭曲加速器 :對于寬角攝像頭應(yīng)用,比如360度攝像頭來說,圖像去扭曲加速器支持ARM幀緩沖壓縮(AFBC)協(xié)議,提供最佳系統(tǒng)互操作性。
? 加速器認(rèn)知補充軟件:在CEVA-XM6 DSP上運行,提供高效加速器利用率,使設(shè)計人員能夠進(jìn)一步差異化其產(chǎn)品設(shè)計。
? CDNN2軟件框架:經(jīng)優(yōu)化及與CEVA-XM6和加速器協(xié)作,使得開發(fā)人員很容易利用此工具生成并將其專有神經(jīng)網(wǎng)絡(luò)移植到CEVA-XM6上,從而顯著加速利用最新最先進(jìn)的網(wǎng)絡(luò)拓?fù)浜蛯拥男阅?,包括支持Caffe和Google的機器學(xué)習(xí)軟件庫TensorFlow。
? 符合ISO 26262主動安全性的產(chǎn)品包:在汽車應(yīng)用場合支持下一代ADAS和自主駕駛解決方案的需求。
CEVA的CDNN2軟件框架同時針對CEVA-XM6和CDNN加速器優(yōu)化,完全支持16位定點精度,確保運行在32位浮點環(huán)境中培訓(xùn)的網(wǎng)絡(luò)時精度降低小于1%。這是神經(jīng)網(wǎng)絡(luò)從研發(fā)過渡到面向大批量汽車和消費者應(yīng)用的高成本和功率效益解決方案的關(guān)鍵。
供貨
CEVA將于2016年第四季向主要客戶授權(quán)許可CEVA-XM6 DSP和視覺平臺組件,并且將于2017年第一季進(jìn)行普通授權(quán)許可。