引用格式:田佳鷺,鄧立國.基于改進VGG16的猴子圖像分類方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(5):6-11.
隨著深度學習技術(shù)的不斷進步,對于通用對象的類別分析,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)達到了很高的水平,但對于細粒度圖像分類的穩(wěn)定性目前還有待提升。所謂細粒度圖像分類,通常用于描述對同一類事物進行細致的劃分,所以待分類圖像的區(qū)別要更加精準,類內(nèi)區(qū)別大而類間區(qū)別小,粒度則更為精細。本文方法基于改進的VGG16深度卷積神經(jīng)網(wǎng)絡(luò)。盡管原始的VGG16模型已經(jīng)擁有了良好的普適性和實用價值,并且在各種圖像分類和目標檢測任務(wù)中都體現(xiàn)了極佳的效果,通過遷移學習改進的VGG16模型,能夠?qū)⒁蚜暤玫奶卣骱托阅軕?yīng)用到待解決的問題中,極大地節(jié)省了訓練時間。此外在硬件上選取GPU進行訓練,使得速度得到進一步提升。為了改善原始的交叉熵損失函數(shù)無法保證提取的特征具有識別度的缺點,在VGG16模型中引入將center loss損失函數(shù)與交叉熵損失函數(shù)相結(jié)合的辦法。此外還運用了新型的Swish激活函數(shù),以及擁有自適應(yīng)學習率的Adam優(yōu)化器。最后利用不同種類的猴子訓練集對改進的模型重新訓練,以獲得少量微調(diào)的參數(shù)信息。經(jīng)驗證該方法對猴子圖像識別的精準度可提升到98.875%,而原始的VGG16模型在該數(shù)據(jù)集上的分類僅能達到90.210%的準確率,可以證明改進后的模型具有更好的識別效果。
本文詳細內(nèi)容請下載:http://ihrv.cn/resource/share/2000003088
作者信息:田佳鷺,鄧立國(沈陽師范大學 數(shù)學與系統(tǒng)科學學院,遼寧 沈陽 110034)