基于浮柵器件的低位寬卷積神經(jīng)網(wǎng)絡研究
所屬分類:技術論文
上傳者:zhoubin333
文檔大?。?span>450 K
標簽: 卷積神經(jīng)網(wǎng)絡 量化 存算一體
所需積分:0分積分不夠怎么辦?
文檔介紹:浮柵器件(Flash)能夠?qū)⒋鎯陀嬎愕奶匦韵嘟Y合,實現(xiàn)存算一體化,但是單個浮柵單元最多只能存儲位寬為4 bit的數(shù)據(jù)。面向Nor Flash,研究了卷積神經(jīng)網(wǎng)絡參數(shù)的低位寬量化,對經(jīng)典的AlexNet、VGGNet以及ResNet通過量化感知訓練。采用非對稱量化,將模型參數(shù)從32位浮點數(shù)量化至4位定點數(shù),模型大小變?yōu)樵瓉淼?/8,針對Cifar10數(shù)據(jù)集,4位量化模型的準確率相對于全精度網(wǎng)絡僅下降不到2%。最后將量化完成的卷積神經(jīng)網(wǎng)絡模型使用Nor Flash陣列加速。Hspice仿真結果表明,相對于全精度模型,部署在Nor Flash陣列中的量化模型精度僅下降2.25%,驗證了卷積神經(jīng)網(wǎng)絡部署在Nor Flash上的可行性。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。