文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.223161
中文引用格式: 安鶴男,鄧武才,管聰,等. 基于Involution Prediction Head的小目標(biāo)檢測(cè)算法[J].電子技術(shù)應(yīng)用,2022,48(11):19-23.
英文引用格式: An Henan,Deng Wucai,Guan Cong,et al. Small object detection algorithm based on involution prediction head[J]. Application of Electronic Technique,2022,48(11):19-23.
0 引言
目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域的一項(xiàng)基本任務(wù)。隨著硬件GPU以及卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Networks,CNN)的不斷發(fā)展,目標(biāo)檢測(cè)取得了顯著的發(fā)展,已廣泛應(yīng)用于自動(dòng)駕駛、視覺(jué)搜索、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等許多應(yīng)用領(lǐng)域[1]。目前大多數(shù)最先進(jìn)的目標(biāo)檢測(cè)深度學(xué)習(xí)算法都是基于CNN,主要分為兩大類:兩階段(Two-stage)目標(biāo)檢測(cè)器和單階段(One-stage)目標(biāo)檢測(cè)器。Two-stage檢測(cè)器的典型網(wǎng)絡(luò)有fast R-CNN[2]、mask R-CNN[3]和faster R-CNN[4]。卷積神經(jīng)網(wǎng)絡(luò)將目標(biāo)檢測(cè)的過(guò)程分為兩個(gè)步驟,先使用區(qū)域生成網(wǎng)絡(luò)(Region Proposal Networks,RPN)生成稀疏的候選錨框,然后檢測(cè)對(duì)象的位置和類別。而One-stage算法則是端到端的目標(biāo)檢測(cè)方法,這類算法直接用一個(gè)CNN網(wǎng)絡(luò)預(yù)測(cè)目標(biāo)的位置和類別,不需要RPN網(wǎng)絡(luò)來(lái)生成錨框,因而檢測(cè)速度更快。One-stage檢測(cè)器的典型網(wǎng)絡(luò)有SSD[5]和YOLO[6-9]系列模型。
小目標(biāo)檢測(cè)廣泛存在于目標(biāo)密集圖像和遠(yuǎn)距離成像目標(biāo)圖像中,作為目標(biāo)檢測(cè)的一部分,在現(xiàn)實(shí)中有著同樣重要的需求。無(wú)論是車(chē)牌號(hào)檢測(cè)、焊縫圖像檢測(cè), 還是無(wú)人機(jī)航拍圖像,許多場(chǎng)景中都有小目標(biāo)的存在。 但由于小目標(biāo)像素信息占比小、紋理特征不明顯,小目標(biāo)的檢測(cè)比大中型目標(biāo)的檢測(cè)更為困難。由此可知, 小目標(biāo)檢測(cè)是目標(biāo)檢測(cè)研究領(lǐng)域中具有重要性和挑戰(zhàn)性的研究方向。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000004999。
作者信息:
安鶴男1,鄧武才1,管 聰2,姜邦彥2
(1.深圳大學(xué) 電子與信息工程學(xué)院,廣東 深圳518000;2.深圳大學(xué) 微納光電子學(xué)研究院,廣東 深圳518000)