《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 測試測量 > 設(shè)計(jì)應(yīng)用 > 一種基于SIFT特征的鐵道檢測圖片的匹配方法
一種基于SIFT特征的鐵道檢測圖片的匹配方法
2016年微型機(jī)與應(yīng)用第21期
馬彥昭,胡浩基,王曰海
浙江大學(xué) 信息與電子工程學(xué)院,浙江 杭州 310027
摘要: 提出一種基于SIFT特征的鐵道檢測圖片的匹配方法。由人工標(biāo)定鐵路上的目標(biāo)位置圖片,通過匹配算法計(jì)算匹配圖片與目標(biāo)位置圖片可匹配SIFT特征點(diǎn)的數(shù)量,利用DTW最優(yōu)路徑規(guī)劃得到全局最優(yōu)的匹配結(jié)果,從匹配結(jié)果中得到一張匹配度最高的圖片并將其輸出用于道路檢測。實(shí)驗(yàn)證明,該算法在效率和準(zhǔn)確度上均有較好的表現(xiàn)。
關(guān)鍵詞: 匹配 鐵道 SIFT特征 DTW
Abstract:
Key words :

  馬彥昭,胡浩基,王曰海

 ?。ㄕ憬髮W(xué) 信息與電子工程學(xué)院,浙江 杭州 310027)

       摘要:提出一種基于SIFT特征鐵道檢測圖片的匹配方法。由人工標(biāo)定鐵路上的目標(biāo)位置圖片,通過匹配算法計(jì)算匹配圖片與目標(biāo)位置圖片可匹配SIFT特征點(diǎn)的數(shù)量,利用DTW最優(yōu)路徑規(guī)劃得到全局最優(yōu)的匹配結(jié)果,從匹配結(jié)果中得到一張匹配度最高的圖片并將其輸出用于道路檢測。實(shí)驗(yàn)證明,該算法在效率和準(zhǔn)確度上均有較好的表現(xiàn)。

  關(guān)鍵詞:匹配;鐵道;SIFT特征;DTW

0引言

  隨著中國鐵路技術(shù)的發(fā)展,對鐵道的安全性也提出了更高的要求。為此,相關(guān)部門在列車上安裝了高幀率的攝像頭,并對獲得的圖片進(jìn)行人工檢測,以發(fā)現(xiàn)鐵道及其周邊環(huán)境(如兩側(cè)的線桿)是否發(fā)生異常變化。然而,由于路程遠(yuǎn)、幀率高,每輛列車僅僅在兩個站點(diǎn)之間獲取的圖片數(shù)量就達(dá)到了幾萬甚至幾十萬。對于人工檢測,無疑需要極高的勞動強(qiáng)度。而事實(shí)卻是,由于圖片之間較高的相似性和連續(xù)性,對于每根線桿都會有多張可供檢測的冗余的圖片,所以在這上萬張圖片中真正需要用來檢測的只有幾千張甚至幾百張。

  針對鐵路檢測圖片的冗余問題,本文提出了一種降低圖片冗余度的方法,在準(zhǔn)確度和效率上都有較好的表現(xiàn)。

1流程

  此方法包括了數(shù)據(jù)選擇、尺度不變特征轉(zhuǎn)換(ScaleInvariant Feature Transform,SIFT)特征檢測與匹配、動態(tài)時間歸整(Dynamic Time Warping,DTW)、最佳匹配圖片輸出四個部分。每一部分具體操作過程將在后文中詳細(xì)介紹。

2數(shù)據(jù)選擇

  2.1選擇目標(biāo)位置圖片

  選擇天氣良好時兩站點(diǎn)之間拍攝的一組圖片。按照電線桿標(biāo)號的順序,依次從圖片中人工選擇出一張可清晰看到該線桿的圖片。如圖1所示,拍攝到線桿‘1220’共有6張圖片,從中選擇圖片d作為目標(biāo)位置圖片(用黑實(shí)線標(biāo)記出)。最終選擇的圖片數(shù)量為M1,圖片集設(shè)為Aim。

圖像 001.png

  2.2輸入待匹配圖片

  在每次的匹配中,使用新得到的具有冗余度的一組圖片(設(shè)為Match,數(shù)量為M2),并保證Match與Aim具有相同的起點(diǎn)和終點(diǎn)。

3SIFT特征檢測與匹配

  3.1輸入待匹配圖片

  SIFT特征是圖像的局部特征,其對旋轉(zhuǎn)、尺度縮放、亮度變化保持不變性,對視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)定性[1-2],關(guān)于SIFT特征的具體提取與匹配方法,在參考文獻(xiàn)[3]中已有詳細(xì)的說明,此處不再作為重點(diǎn)陳述的對象。

3.2SIFT特征檢測與匹配

  分別檢測Aim與Match中第i,j張圖片的SIFT特征,記為QQ圖片20161207143026.pngQQ圖片20161207143029.png進(jìn)行SIFT特征匹配。將匹配的特征點(diǎn)數(shù)量記為Ni,j,構(gòu)成矩陣N。

4DTW動態(tài)規(guī)劃

  4.1DTW算法

  該算法基于動態(tài)規(guī)劃(DP)的思想[4-5],原本是語音識別中的一種算法,用于孤立詞識別。此處將其最優(yōu)路徑作為不同圖片匹配結(jié)果。

  4.2DTW最優(yōu)路徑規(guī)劃

  搜索從N1,1點(diǎn)出發(fā),點(diǎn)(i,j)可達(dá)到的前一個格點(diǎn)只可能是(i-1,j),(i-1,j-1)和(i,j-1)。那么(i,j)選擇這三個距離中的最大者所對應(yīng)的點(diǎn)作為其前續(xù)格點(diǎn),設(shè)Di,j為(i,j)到(1,1)的累計(jì)距離。則:

  QQ圖片20161207143021.png

  這樣從(1,1)點(diǎn)出發(fā)(令Di,j=0)搜索,反復(fù)遞推,直到DM1,M2就可以得到最優(yōu)路徑Road。Roadi,j=1表示路線經(jīng)過(i,j)點(diǎn)。Roadi,j=0,表示路線未經(jīng)過。

  對于矩陣Road,若Roadi,j=1,則Matchj與Aimi匹配。

  圖2是杭州至德清局部路段拍攝到的963張圖片匹配到選定的50張圖片的匹配結(jié)果。曲線經(jīng)過的地方表示Roadi,j=1。

圖像 002.png

  由圖可以得到,對于每一張目標(biāo)匹配圖片,有多張匹配圖片與之對應(yīng)。例如,以上選出的‘1220’線桿,在目標(biāo)圖片中是第38張圖片。在匹配圖片中標(biāo)號為771~779這9張圖片是與之匹配的結(jié)果。如圖3所示的a~i的9張圖片。

圖像 003.png

5最佳匹配圖片輸出

  已知一張圖片Aimi對應(yīng)于多張圖片Matchj。則對于每一個i,找到使Ni,j最大時的j=jmax。將Matchjmax作為最佳的匹配圖片輸出。如上述找到的‘1220’所匹配的9張圖片中,N38,776是N38,771至N38,779中最大的值,則將編號為776的圖片,即圖3圖片f作為最后的匹配結(jié)果輸出。如圖4所示。

圖像 004.png

  可以看出,在天氣條件不同、拍攝角度和拍攝圖片大小不同的情況下,此方法依然能夠找到一張最合適的圖片用于檢測。

  對于每一張圖片Aimi,均可以找到一張最佳匹配的圖片Matchjmax,將找到的圖片作為匹配集合,共有圖片M1張。此時,便實(shí)現(xiàn)了將原有的數(shù)量為M2的圖片壓縮為數(shù)量為M1的圖片集合的目的。

6實(shí)驗(yàn)結(jié)果

  在MATLAB R2014a 環(huán)境下,對不同路段圖片,在天氣不同的條件下進(jìn)行匹配。同時進(jìn)行人工驗(yàn)證,檢驗(yàn)得到的匹配結(jié)果是否可以用于實(shí)際的檢測中。實(shí)驗(yàn)結(jié)果如表1所示。

圖像 005.png

  實(shí)驗(yàn)結(jié)果證明:該匹配方法取得了較好的效果,輸出的匹配圖片可以滿足人工檢測的需求。

7結(jié)束語

  本文提出了一種基于SIFT特征的鐵道檢測圖片的匹配方法,具有準(zhǔn)確、高效率和極大降低人工勞動強(qiáng)度的優(yōu)點(diǎn)。同時此方法對環(huán)境、拍攝角度、拍攝器材和天氣的依賴較小,具有較好的魯棒性,可適用于多種場合。

  SIFT特征提取與匹配需要較大的計(jì)算量,是日后繼續(xù)深入研究的重點(diǎn)。即考慮根據(jù)實(shí)際應(yīng)用環(huán)境,通過一定的約束條件,降低計(jì)算量,以提高計(jì)算的速度,使此方法具備更強(qiáng)的實(shí)際應(yīng)用能力。

  參考文獻(xiàn)

 ?。?] BROWN M, LOWE D G. Invariant features from interest point groups[C]. InBritish Machine Vision Conference,Cardiff, Wales, 2002:656-665.

  [2] 官云蘭,張紅軍,劉向美. 點(diǎn)特征提取算法探討[J].東華理工學(xué)院學(xué)報(bào),2007,30(1):42-46.

 ?。?] DAVID G L. Distinctive image features from scaleinvariant keypoints[J].International Journal of Computer Vision, 2004,60(2):91-110.

 ?。?] KIM C,SEO K D. Robust DTWbased recognition algorithm for hand—held consumer devices[J].IEEE Transactions on Consumer Electronics,2005,51(2):699-709.

 ?。?] 趙力.語音信號處理[M].北京:清華大學(xué)出版社,2004.

  [6] LeCUN Y A, BOTTOU L, ORR G B, et al. Efficient backprop[C]. Neural Networks: Tricks of the Trade. Springer, 1998, 7:9-48.

 ?。?] LIU C, YUEN J, TORRALBA A.Sift flow: Dense correspondence across scenes and its applications[J]. Pattern Analysisand Machine Intelligence, IEEE Transactions on,2011,33(5):978-994.

 


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。