《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 測試測量 > 設(shè)計應(yīng)用 > 基于邊窗濾波和擴張卷積的礦井行人檢測
基于邊窗濾波和擴張卷積的礦井行人檢測
2020年電子技術(shù)應(yīng)用第10期
劉 欣,李衛(wèi)龍,張燦明
安徽省煤炭科學(xué)研究院,安徽 合肥230001
摘要: 在數(shù)字化礦山中,行人檢測系統(tǒng)能夠大幅減少事故傷亡,是保護工人安全的重要手段。為了構(gòu)建高性能的行人檢測系統(tǒng),提出了一種基于邊窗濾波和擴張卷積的礦井行人檢測模型。具體來說,針對復(fù)雜惡劣的礦井環(huán)境,采用邊窗濾波抑制視頻圖像中的干擾信號,提升圖像質(zhì)量。此外,考慮到行人目標的多尺度特性,在模型中引入擴張卷積增加特征的感受野,進而提升檢測性能。大量的對比實驗證明了邊窗濾波和擴張卷積的有效性,模型在礦井?dāng)?shù)據(jù)集上獲得94.3 mAP和99.1%檢測率的優(yōu)異性能。
中圖分類號: TN919.8;TP919.8;TP391.41
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200363
中文引用格式: 劉欣,李衛(wèi)龍,張燦明. 基于邊窗濾波和擴張卷積的礦井行人檢測[J].電子技術(shù)應(yīng)用,2020,46(10):42-46,50.
英文引用格式: Liu Xin,Li Weilong,Zhang Canming. Mine pedestrian detection based on side-window filter and dilated convolution[J]. Application of Electronic Technique,2020,46(10):42-46,50.
Mine pedestrian detection based on side-window filter and dilated convolution
Liu Xin,Li Weilong,Zhang Canming
Anhui Academy of Coal Science,Hefei 230001,China
Abstract: In digitalized mines, pedestrian detection system is able to greatly reduce accident casualties, which is an essential strategy for guaranteeing workers′ well-being. In order to establish mine pedestrian detection system with high performance, a mine pedestrian detection based on side-window filter and dilated convolution is proposed. Specifically, in terms of mines environment with complicated and hostile conditions, side-window filter is adopted to suppress disturbing signals in surveillance pictures, improving image quality. In addition, considering the multi-scale characteristic of pedestrian objects, dilated convolution is introduced into model to increase receptive field of features, thus enhancing detection performance. A number of comparison experiments are conducted to illustrate the effectiveness of side-window filter and dilated convolution, and the model achieves excellent performance of 94.3 mAP and 99.1% of detection accuracy on the mine dataset.
Key words : pedestrian detection;side-window filter;dilated convolution;deep learning

0 引言

    數(shù)字化礦山是實現(xiàn)智能化、現(xiàn)代化煤炭生產(chǎn)的重要基礎(chǔ),對于煤炭產(chǎn)業(yè)的可持續(xù)發(fā)展有著極為重要的意義。采礦自動化、運輸智能化、管理信息化是實現(xiàn)數(shù)字化礦山的三項關(guān)鍵技術(shù)[1]。實現(xiàn)這些技術(shù)的前提是構(gòu)建智能感知系統(tǒng),而礦井行人檢測系統(tǒng)是實現(xiàn)井下智能調(diào)度、安全監(jiān)測等技術(shù)的先決條件[2]。

    近些年來,深度學(xué)習(xí)技術(shù)在多個計算機視覺領(lǐng)域迅猛發(fā)展[3],并在多個任務(wù)上獲得了優(yōu)異的性能,例如人臉檢測[4]、物體分揀[5]、缺陷檢測[6]。具體到行人檢測任務(wù)上,R-CNN[7]率先將深度學(xué)習(xí)技術(shù)應(yīng)用在目標檢測任務(wù)。在此基礎(chǔ)上,F(xiàn)aster R-CNN[8]改進候選框選擇機制,完備端對端檢測框架。2019年,來自Google Brain的TAN M等研究人員[9]提出了基于自動網(wǎng)絡(luò)尋優(yōu)技術(shù)的EfficientNet,該模型通過動態(tài)調(diào)整網(wǎng)絡(luò)的深度、寬度和分辨率,尋找最優(yōu)的模型設(shè)計,在圖像分類、目標檢測等多個領(lǐng)域獲得先進表現(xiàn)。

    圖像在構(gòu)建和傳輸過程中,常因為外界干擾而導(dǎo)致質(zhì)量退化。常見的解決方案是采用濾波方法對圖像做去噪處理[10]。濾波算法可分成兩類:線性濾波和非線性濾波。常見的線性濾波包括盒子濾波、高斯濾波;非線性濾波包括中值濾波、雙邊濾波等。在深度學(xué)習(xí)算法中,濾波算法常用于圖像預(yù)處理、特征提取、邊緣獲取等。尤其是對于邊緣檢測,濾波算法基于研究人員對于圖像的先驗知識,充分地提取圖像的邊緣信息,實現(xiàn)對興趣區(qū)域的精準定位分割[11]。傳統(tǒng)濾波算法受限于濾波核結(jié)構(gòu)和運算機理,雖然可以抑制噪聲,但同時會造成邊緣信息丟失,對檢測模型產(chǎn)生負面影響。近些年來,大量的保邊濾波算法被提出,用于保留的更多的邊緣信息,例如全變分濾波算法[12]、加權(quán)最小二乘濾波[13]和導(dǎo)向濾波[14]等。

    對于礦井環(huán)境,構(gòu)建行人檢測模型需要考慮多個特定的環(huán)境因素,包括監(jiān)控設(shè)備所處環(huán)境光線不足、粉塵點多,且捕獲圖像存在較多干擾信號等硬件設(shè)備上的不利因素,又要考慮對多目標、不同尺度的行人目標實現(xiàn)準確檢測的要求。針對這些難點,本文從視頻圖像的處理和檢測模型的改進兩個角度出發(fā),采用邊窗濾波抑制視頻圖像的干擾信號,在模型網(wǎng)絡(luò)中引入擴張卷積處理多尺度目標。實驗證明模型在礦井?dāng)?shù)據(jù)集上取得了優(yōu)異的檢測性能。本文的主要貢獻如下:針對礦井環(huán)境存在的多樣不利因素,采用邊窗濾波抑制視頻圖像的干擾信號,為行人檢測模型提供優(yōu)質(zhì)的輸入圖像;采用先進的EfficientNet作為網(wǎng)絡(luò)主干,用于提取輸入圖像的特征,并在網(wǎng)絡(luò)主干中引入擴張卷積,增大特征的感受野,促使網(wǎng)絡(luò)在多尺度目標上獲得更為優(yōu)異的檢測性能。




本文詳細內(nèi)容請下載:http://ihrv.cn/resource/share/2000003018




作者信息:

劉  欣,李衛(wèi)龍,張燦明

(安徽省煤炭科學(xué)研究院,安徽 合肥230001)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。