基于浮柵器件的低位寬卷積神經(jīng)網(wǎng)絡(luò)研究
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大小:450 K
標(biāo)簽: 卷積神經(jīng)網(wǎng)絡(luò) 量化 存算一體
所需積分:0分積分不夠怎么辦?
文檔介紹:浮柵器件(Flash)能夠?qū)⒋鎯?chǔ)和計(jì)算的特性相結(jié)合,實(shí)現(xiàn)存算一體化,但是單個(gè)浮柵單元最多只能存儲(chǔ)位寬為4 bit的數(shù)據(jù)。面向Nor Flash,研究了卷積神經(jīng)網(wǎng)絡(luò)參數(shù)的低位寬量化,對(duì)經(jīng)典的AlexNet、VGGNet以及ResNet通過量化感知訓(xùn)練。采用非對(duì)稱量化,將模型參數(shù)從32位浮點(diǎn)數(shù)量化至4位定點(diǎn)數(shù),模型大小變?yōu)樵瓉淼?/8,針對(duì)Cifar10數(shù)據(jù)集,4位量化模型的準(zhǔn)確率相對(duì)于全精度網(wǎng)絡(luò)僅下降不到2%。最后將量化完成的卷積神經(jīng)網(wǎng)絡(luò)模型使用Nor Flash陣列加速。Hspice仿真結(jié)果表明,相對(duì)于全精度模型,部署在Nor Flash陣列中的量化模型精度僅下降2.25%,驗(yàn)證了卷積神經(jīng)網(wǎng)絡(luò)部署在Nor Flash上的可行性。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。