123,123

基于NOR Flash的卷积计算单元的设计

《信息技术与网络安全》2020年第5期

徐伟民1，黄鲁1，蒋明峰2

1.中国科学技术大学微电子学院，安徽合肥 230026； 2.中国科学技术大学信息科学技术学院，安徽合肥 230026

摘要： 提出一种基于NOR Flash的模拟卷积运算单元，与同类模拟卷积运算单元相比具有高精度、高能耗比、低噪声的特点。该单元采用存算一体架构，将卷积核的权重参数以阈值电压的方式存储在Flash中，输入图片经过模拟卷积运算得到输出图片。在SMIC 65 nm浮栅工艺下，使用SOBEL边缘检测算法评估该单元的性能。仿真结果表明，在3.3 V电源电压，100 MHz时钟下，实现一个3×3卷积核的Flash阵列的能耗比达到0.18 TOPS/W，卷积计算结果的峰值信噪比(PSNR)为39.05 dB。

關(guān)鍵詞： NORFlash 存算一体卷积加速

中圖分類號(hào)：TN432
文獻(xiàn)標(biāo)識(shí)碼：A
DOI： 10.19358/j.issn.2096-5133.2020.05.013
引用格式：徐偉民，黃魯，蔣明峰.基于NOR Flash的卷積計(jì)算單元的設(shè)計(jì)［J］.信息技術(shù)與網(wǎng)絡(luò)安全，2020,39（5）：63-68.

Abstract：

Key words :

深度學(xué)習(xí)在人臉識(shí)別、音頻識(shí)別、圖像分類等領(lǐng)域中得到廣泛應(yīng)用。深度學(xué)習(xí)網(wǎng)絡(luò)具有大量的權(quán)重?cái)?shù)據(jù)和大量的乘累加操作，極大的算力需求和功耗限制使得深度學(xué)習(xí)應(yīng)用難以部署在物聯(lián)網(wǎng)終端設(shè)備。而在深度學(xué)習(xí)網(wǎng)絡(luò)中，卷積計(jì)算占用前向計(jì)算89%的時(shí)間，隨之產(chǎn)生巨大的功耗。所以高速、低功耗的卷積計(jì)算單元的設(shè)計(jì)成為迫切的需求。

主流的馮諾依曼架構(gòu)中，計(jì)算單元和內(nèi)存單元是兩個(gè)完全分離的單元，計(jì)算單元根據(jù)指令從內(nèi)存讀取數(shù)據(jù)，在計(jì)算單元完成計(jì)算，再存回內(nèi)存。數(shù)據(jù)需要在計(jì)算單元和存儲(chǔ)單元之間進(jìn)行頻繁的移動(dòng)，因此帶來較大的功耗和較低的運(yùn)算效率。存算一體架構(gòu)將計(jì)算單元與內(nèi)存單元合二為一，在存儲(chǔ)數(shù)據(jù)的同時(shí)完成運(yùn)算，從而極大地減少了計(jì)算過程中數(shù)據(jù)存取的時(shí)間和功耗。實(shí)現(xiàn)存算一體化的介質(zhì)有相變存儲(chǔ)PCM，靜態(tài)隨機(jī)存儲(chǔ)SRAM、浮柵器件Flash等。Flash具有工藝成熟、成本低等特點(diǎn)，因此本設(shè)計(jì)采用Flash作為存算一體的介質(zhì)。具體做法是將卷積核的權(quán)值映射到Flash陣列的閾值電壓，然后Flash陣列進(jìn)行高速、低功耗的模擬乘累加計(jì)算來加速卷積計(jì)算過程。

本文的主要內(nèi)容在于：（1）利用Flash的線型區(qū)I/V特性，設(shè)計(jì)基于NOR Flash的模擬矩陣計(jì)算單元;（2）基于模擬矩陣計(jì)算單元，設(shè)計(jì)了基于NOR Flash的模擬卷積計(jì)算單元;（3）通過SOBEL邊緣檢測算子評(píng)估基于NOR Flash的卷積計(jì)算單元的性能。

本文詳細(xì)內(nèi)容請(qǐng)下載: http://ihrv.cn/resource/share/2000003121

作者信息：

徐偉民1，黃魯1，蔣明峰2(1.中國科學(xué)技術(shù)大學(xué) 微電子學(xué)院，安徽合肥 230026；

2.中國科學(xué)技術(shù)大學(xué) 信息科學(xué)技術(shù)學(xué)院，安徽合肥 230026)

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容