文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.06.006
引用格式: 鄭睿,余童,程龍閱. 基于改進(jìn)LeNet-5的形狀類似物體識別方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(6):31-37,43.
當(dāng)前,基于視覺的智能機器人已經(jīng)應(yīng)用于各領(lǐng)域中。當(dāng)機器人面臨需要抓取形狀類似、硬度不同的物體時,智能機器人應(yīng)選擇不同的抓取力。因此,通過視覺識別出這類物體具有較高實用價值。利用深度學(xué)習(xí)對圖像進(jìn)行識別是較為高效的方法,國內(nèi)外相關(guān)研究已經(jīng)在車輛及車道線檢測、人臉識別、手寫體識別等領(lǐng)域取得較多的成果。
近年來,針對形狀類似物體的識別也取得了一定的成果。張雪芹等人利用深度學(xué)習(xí)AlexNet網(wǎng)絡(luò)實現(xiàn)了對多種類植物圖片進(jìn)行分類識別。林思思等提出融合深度特征和人工特征的花卉圖像特征提取方法,并在此基礎(chǔ)上實現(xiàn)花卉圖像的分類。西南交通大學(xué)秦放提出基于深度學(xué)習(xí)的昆蟲圖像識別研究,擴充了昆蟲樣本集,基于昆蟲圖像識別的任務(wù)需求和樣本集,從網(wǎng)絡(luò)和訓(xùn)練兩個方面進(jìn)行改進(jìn)。張立超等人利用LeNet-5網(wǎng)絡(luò)對兩種品種的蘋果進(jìn)行分類識別,在兩種蘋果的分類中取得不錯的效果。但大型的神經(jīng)網(wǎng)絡(luò)一般通過加深網(wǎng)絡(luò)深度獲得高精度的識別率,其結(jié)構(gòu)較為復(fù)雜,運算量大,無法滿足快速識別的要求。
因此,本文選擇LeNet-5網(wǎng)絡(luò)作為研究對象,由于LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)較為簡單,運算量較小,對硬件配置要求低,能夠在滿足網(wǎng)絡(luò)輕量化的前提下對形狀類似、硬度不同的物體實現(xiàn)快速識別。傳統(tǒng)LeNet-5網(wǎng)絡(luò)在識別精度上尚有不足。為了能夠提高識別精度且盡可能地減少運算量,本文將傳統(tǒng)卷積核拆分為非對稱卷積核以縮短計算時間;在網(wǎng)絡(luò)中間加入BN層使中間層的數(shù)據(jù)輸出更加穩(wěn)定,提高網(wǎng)絡(luò)的訓(xùn)練精度;采用全局平均池的方法取代原模型Flatten層以降低運算量。通過這三種方式有效地改進(jìn)了LeNet-5網(wǎng)絡(luò),使其能夠適用于移動機器人平臺,實現(xiàn)對物體的識別。
本文詳細(xì)內(nèi)容請下載: http://ihrv.cn/resource/share/2000003185
作者信息:
鄭 睿1,2,余 童1,2,程龍閱1
(1.安徽師范大學(xué) 物理與電子信息學(xué)院,安徽 蕪湖241002;
2.安徽省智能機器人信息融合與控制工程實驗室,安徽 蕪湖241000)