據(jù)外媒報道,當(dāng)?shù)貢r間2月26日,東芝電子歐洲公司(TEE)宣布將研發(fā)一種用于汽車應(yīng)用的圖像識別片上系統(tǒng)(SoC),該系統(tǒng)與東芝以前的產(chǎn)品相比,深度學(xué)習(xí)加速器的速度是原來的10倍,功率效率為4倍。該項技術(shù)的細(xì)節(jié)在2019年IEEE國際固態(tài)線路研討會(ISSCC)上公布,該研討會于2月19日在舊金山舉行。
自動緊急制動等高級駕駛輔助系統(tǒng)提供越來越先進(jìn)的能力,而且實現(xiàn)此類系統(tǒng)需要圖像識別片上系統(tǒng),此類片上系統(tǒng)需要能夠在低功耗的情況下高速識別道路交通標(biāo)志以及道路狀況。
深度神經(jīng)網(wǎng)絡(luò)(DNN)是一種以大腦神經(jīng)網(wǎng)絡(luò)為模型的算法,與傳統(tǒng)的模式識別和機(jī)器學(xué)習(xí)相比,能夠更精確地進(jìn)行識別處理,而且人們普遍認(rèn)為其適用于汽車應(yīng)用。但是,使用傳統(tǒng)處理器、基于深度神經(jīng)網(wǎng)絡(luò)的圖像識別依賴大量的乘積累加(MAC)計算,因而需要大量處理時間,而且也需要消耗更多功率。
東芝推出的深度神經(jīng)網(wǎng)絡(luò)(DNN)加速器克服了上述問題,而且該加速器在硬件中實現(xiàn)了深度學(xué)習(xí),具備以下3個特點:
1、 平行乘積累加(MAC)組件。深度神經(jīng)網(wǎng)絡(luò)(DNN)處理需要很多乘積累加計算,東芝的新設(shè)備具有4個處理器,每個都有256個乘積累加組件,從而提升了深度神經(jīng)網(wǎng)絡(luò)(DNN)的處理速度。
2、 減少對動態(tài)隨機(jī)存取存儲器(DRAM)的訪問。傳統(tǒng)的片上系統(tǒng)沒有本地存儲器來保存深度神經(jīng)網(wǎng)絡(luò)執(zhí)行組件附近的暫態(tài)數(shù)據(jù),而且處理本地存儲器會消耗很多功率。使用乘積累加(MAC)計算加載權(quán)重數(shù)據(jù)也要消耗功率。而在東芝的新設(shè)備中,深度神經(jīng)網(wǎng)絡(luò)(DNN)執(zhí)行組件附近執(zhí)行的是靜態(tài)隨機(jī)存取存儲器(SRAM),深度神經(jīng)網(wǎng)絡(luò)(DNN)處理分成了子處理塊,以將暫態(tài)數(shù)據(jù)存儲于靜態(tài)隨機(jī)存取存儲器(SRAM)中,減少對動態(tài)隨機(jī)存取存儲器(DRAM)的訪問。此外,東芝還為加速器增加了一個解壓裝置,提前將權(quán)重數(shù)據(jù)壓縮、存儲在動態(tài)隨機(jī)存取存儲器中,再通過解壓裝置上傳權(quán)重數(shù)據(jù),可減少從動態(tài)隨機(jī)存取存儲器(DRAM)中上傳權(quán)重數(shù)據(jù)所帶來的功率消耗。
3、 減少對靜態(tài)隨機(jī)存取存儲器(SRAM)的訪問。傳統(tǒng)的深度學(xué)習(xí)需要在處理完深度神經(jīng)網(wǎng)絡(luò)的每一層之后再訪問靜態(tài)隨機(jī)存取存儲器,此過程會消耗大量功率。東芝推出的加速器具有流水線式結(jié)構(gòu),位于深度神經(jīng)網(wǎng)絡(luò)的深度神經(jīng)網(wǎng)絡(luò)執(zhí)行組件中,完成一系列的深度神經(jīng)網(wǎng)絡(luò)計算只需訪問一次靜態(tài)隨機(jī)存取存儲器(SRAM)。
該新型片上系統(tǒng)符合汽車應(yīng)用功能安全的全球標(biāo)準(zhǔn)ISO26262。東芝將繼續(xù)提升其片上系統(tǒng)的功率效率和處理速度,并將于今年9月份開始交付其下一代圖像識別處理器ViscontiTM5的樣品。