文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.200263
中文引用格式: 肖國麟,楊春玲,陳宇. 基于權(quán)值交互思想的卷積神經(jīng)網(wǎng)絡(luò)量化算法[J].電子技術(shù)應(yīng)用,2020,46(10):39-41.
英文引用格式: Xiao Guolin,Yang Chunling,Chen Yu. Convolutional neural network quantization algorithm based on weight interaction ideas[J]. Application of Electronic Technique,2020,46(10):39-41.
0 引言
隨著深度學(xué)習(xí)的飛速發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNN)被越來越多地應(yīng)用于各個領(lǐng)域,如圖像識別[1-2]和目標(biāo)檢測[3-4]。然而,隨著應(yīng)用要求的提高,CNN的結(jié)構(gòu)越來越深,導(dǎo)致其對于計算力和內(nèi)存的需求大大提高。同時由于移動端設(shè)備的飛速發(fā)展,設(shè)備小型化的需求和市場不斷擴大,將CNN應(yīng)用到小型移動端設(shè)備的需求也隨之增加。然而,受限于電源、內(nèi)存及功耗,移動端平臺無法滿足高性能CNN對于硬件性能、功耗及內(nèi)存的要求,因此優(yōu)化CNN模型從而降低其對于計算資源的要求非常必要[5]。
CNN權(quán)值量化是目前一種主流的CNN模型優(yōu)化方法,而三值量化其中一種能夠?qū)?quán)值由32位量化到2位(0,±α)從而達(dá)到16倍壓縮比的低位量化方法。自從2016年三值化網(wǎng)絡(luò)被LI F等人提出以來[6],其方法不斷改進(jìn),性能不斷提高。其中MELLEMPUDI N等人于2017年提出的細(xì)粒度三值化網(wǎng)絡(luò)[7],將激活函數(shù)量化到8或4位,將權(quán)重量化至2位,將每N個權(quán)值分為一個組,分組量化,兩組之間相互獨立,其中N=2,4,8,16,…。該方法主要通過嘗試不同的分組和暴力搜索解空間以及二次訓(xùn)練的方式得到最優(yōu)解,但相比原精度的32位卷積網(wǎng)絡(luò)仍有較大性能差距。目前的三值量化網(wǎng)絡(luò)性能不佳的其中一個問題在于都使用對稱均勻量化操作,只考慮了單個權(quán)值的量化,忽視了相鄰權(quán)值量化之間的相互關(guān)系,量化噪音直接相互累加,導(dǎo)致每一層網(wǎng)絡(luò)的噪聲積累過高,使得量化模型的預(yù)測準(zhǔn)確率有極大的下降。
針對此問題,本文提出一種新的CNN模型三值量化算法,基于權(quán)值交互思想,在同一卷積核內(nèi),將先前量化產(chǎn)生的積累噪聲作為一個負(fù)變量加入到下一個權(quán)值的量化操作中,使得對下一個權(quán)值朝著能減小積累噪聲的方向進(jìn)行量化。然后,通過層級貪婪搜索算法逐層搜索局部最優(yōu)解,得到效果近似最優(yōu)解的優(yōu)化解,降低搜索算法復(fù)雜度,極大減少搜索所需時間。實驗證明,相比于其他使用對稱均勻量化操作的算法,本文的算法極大地減小了由于量化操作導(dǎo)致的模型預(yù)測準(zhǔn)確率的損失。
本文詳細(xì)內(nèi)容請下載:http://ihrv.cn/resource/share/2000003017
作者信息:
肖國麟,楊春玲,陳 宇
(哈爾濱工業(yè)大學(xué) 電氣工程及自動化學(xué)院,黑龍江 哈爾濱150001)