文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2021.01.007
引用格式: 劉津龍,賈郭軍。 基于K-Means算法的SSD-Mobilenet模型優(yōu)化研究[J].信息技術(shù)與網(wǎng)絡(luò)安全,2021,40(1):37-44.
0 引言
目標(biāo)檢測(cè)是將目標(biāo)從圖像中提取出來的計(jì)算機(jī)視覺技術(shù),是計(jì)算機(jī)視覺領(lǐng)域的重要組成部分,是一切計(jì)算機(jī)視覺任務(wù)的基礎(chǔ),具有較高的研究?jī)r(jià)值。運(yùn)動(dòng)目標(biāo)檢測(cè)是從不斷變化的序列圖像中進(jìn)行目標(biāo)的識(shí)別和定位,分為靜態(tài)背景下的目標(biāo)檢測(cè)和動(dòng)態(tài)背景下的目標(biāo)檢測(cè)。目前,解決目標(biāo)檢測(cè)問題的思路主要有如下兩種:一是依賴于目標(biāo)的先驗(yàn)知識(shí),提前為運(yùn)動(dòng)目標(biāo)建模,然后在圖像序列中實(shí)時(shí)找到匹配的目標(biāo);二是不依賴于先驗(yàn)知識(shí),直接從圖像序列中檢測(cè)到運(yùn)動(dòng)目標(biāo),并進(jìn)行類別判定。
傳統(tǒng)的目標(biāo)檢測(cè)一般使用滑動(dòng)窗口的檢測(cè)機(jī)制,主要包括以下三個(gè)步驟:第一步利用不同尺寸的滑動(dòng)窗口[1]在滑動(dòng)途中覆蓋的某一部分作為候選區(qū)域;第二步提取候選區(qū)域相關(guān)的視覺特征形成特征向量,例如人臉檢測(cè)常用的Harr特征[2],行人檢測(cè)和普通目標(biāo)檢測(cè)常用HOG特征[3];第三步利用提取到的特征對(duì)目標(biāo)進(jìn)行識(shí)別和定位。該類目標(biāo)檢測(cè)算法的窗口區(qū)域選擇策略沒有針對(duì)性,時(shí)間復(fù)雜度高,窗口冗余相對(duì)較多。手工設(shè)計(jì)的特征對(duì)目標(biāo)可能出現(xiàn)的多樣性變化沒有較強(qiáng)的魯棒性,比如形態(tài)變化和光照影響等。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003315
作者信息:
劉津龍,賈郭軍
(山西師范大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院, 山西 臨汾041000)