《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 基于改進LeNet-5的形狀類似物體識別方法
基于改進LeNet-5的形狀類似物體識別方法
《信息技術與網絡安全》2020年第6期
鄭 睿1,2,余 童1,2,程龍閱1
1.安徽師范大學 物理與電子信息學院,安徽 蕪湖241002; 2.安徽省智能機器人信息融合與控制工程實驗室,安徽 蕪湖241000
摘要: 針對深度學習在對外形類似物體的識別上存在著識別精度低、耗時長等問題,提出基于改進的LeNet-5的識別方法。在傳統LeNet-5網絡基礎上,將卷積層變?yōu)殡p層非對稱卷積使網絡有更好的特征提取能力;通過批量歸一化提高網絡泛化能力;采用全局平均池化替代原Flatten層,用于克服傳統全連接層參數多、耗時長的缺點;通過對訓練集進行增廣增加訓練樣本。實驗結果表明,改進LeNet-5網絡的訓練精度達到91%,識別形狀類似物體的精度為87%,且能在較少迭代次數內收斂,這些指標均顯著優(yōu)于原網絡。
中圖分類號: TP183
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.06.006
引用格式: 鄭睿,余童,程龍閱. 基于改進LeNet-5的形狀類似物體識別方法[J].信息技術與網絡安全,2020,39(6):31-37,43.
Recognition method of similar-shaped objects based on improved LeNet-5
Zheng Rui1,2,Yu Tong1,2,Cheng Longyue1
1.College of Physics and Electronic Information,Anhui Normal University,Wuhu 241002,China; 2.Anhui Province Engineering Laboratory of Intelligent Robot′s Information Fusion and Control,Wuhu 241000,China
Abstract: Aiming at the problems of low recognition accuracy and long time-consuming in the recognition of similar shape objects by deep learning, a recognition method based on improved LeNet-5 is proposed. Based on the traditional LeNet-5 network, changing the convolutional layer into a double-layer asymmetric convolution makes the network have better feature extraction capabilities; the generalization ability of the network is improved by batch normalization; the original Flatten layer is replaced by global average pooling,which is used to overcome the shortcomings of the traditional fully-connected layer with many parameters and long time-consuming; the training sample is increased by augmenting the training set. Experimental results show that the training accuracy of the improved LeNet-5 network reaches 91%, the accuracy of identifying objects with similar shapes is 87%, and it can converge within a small number of iterations. These indicators are significantly better than the original network.
Key words : LeNet-5 network;image recognition;asymmetric convolution;batch normalization;maximum average pooling

當前,基于視覺的智能機器人已經應用于各領域中。當機器人面臨需要抓取形狀類似、硬度不同的物體時,智能機器人應選擇不同的抓取力。因此,通過視覺識別出這類物體具有較高實用價值。利用深度學習對圖像進行識別是較為高效的方法,國內外相關研究已經在車輛及車道線檢測、人臉識別、手寫體識別等領域取得較多的成果。

近年來,針對形狀類似物體的識別也取得了一定的成果。張雪芹等人利用深度學習AlexNet網絡實現了對多種類植物圖片進行分類識別。林思思等提出融合深度特征和人工特征的花卉圖像特征提取方法,并在此基礎上實現花卉圖像的分類。西南交通大學秦放提出基于深度學習的昆蟲圖像識別研究,擴充了昆蟲樣本集,基于昆蟲圖像識別的任務需求和樣本集,從網絡和訓練兩個方面進行改進。張立超等人利用LeNet-5網絡對兩種品種的蘋果進行分類識別,在兩種蘋果的分類中取得不錯的效果。但大型的神經網絡一般通過加深網絡深度獲得高精度的識別率,其結構較為復雜,運算量大,無法滿足快速識別的要求。

因此,本文選擇LeNet-5網絡作為研究對象,由于LeNet-5網絡結構較為簡單,運算量較小,對硬件配置要求低,能夠在滿足網絡輕量化的前提下對形狀類似、硬度不同的物體實現快速識別。傳統LeNet-5網絡在識別精度上尚有不足。為了能夠提高識別精度且盡可能地減少運算量,本文將傳統卷積核拆分為非對稱卷積核以縮短計算時間;在網絡中間加入BN層使中間層的數據輸出更加穩(wěn)定,提高網絡的訓練精度;采用全局平均池的方法取代原模型Flatten層以降低運算量。通過這三種方式有效地改進了LeNet-5網絡,使其能夠適用于移動機器人平臺,實現對物體的識別。



本文詳細內容請下載:  http://ihrv.cn/resource/share/2000003185

作者信息:

鄭  睿1,2,余  童1,2,程龍閱1

(1.安徽師范大學 物理與電子信息學院,安徽 蕪湖241002;

2.安徽省智能機器人信息融合與控制工程實驗室,安徽 蕪湖241000)


此內容為AET網站原創(chuàng),未經授權禁止轉載。