《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 基于SIFT和人機(jī)交互的遙感影像識別方法研究
基于SIFT和人機(jī)交互的遙感影像識別方法研究
來源:微型機(jī)與應(yīng)用2011年第3期
呂 萌
(燕山大學(xué) 信息科學(xué)與工程學(xué)院,河北 秦皇島 066004)
摘要: 尺度不變特征變換(SIFT)算法具有良好的尺度、光照以及空間旋轉(zhuǎn)不變性,在人機(jī)交互的環(huán)境中可以很好地識別出影像。介紹了SIFT算法和人機(jī)交互原理,并進(jìn)行了實驗論證。實驗結(jié)果表明,該方法能較好地識別出遙感影像,并具有實時性意義。
Abstract:
Key words :

摘  要: 尺度不變特征變換(SIFT)算法具有良好的尺度、光照以及空間旋轉(zhuǎn)不變性,在人機(jī)交互的環(huán)境中可以很好地識別出影像。介紹了SIFT算法和人機(jī)交互原理,并進(jìn)行了實驗論證。實驗結(jié)果表明,該方法能較好地識別出遙感影像,并具有實時性意義。
關(guān)鍵詞: SIFT;遙感影像;識別;人機(jī)交互

 飛機(jī)在采集敵方重要地面目標(biāo)影像時,會產(chǎn)生各種類型的影像,使得實時識別影像非常困難。通常目標(biāo)影像會發(fā)生旋轉(zhuǎn)、縮放、成像品質(zhì)等變化。近年來,在計算機(jī)視覺領(lǐng)域,基于局部不變量描述符的方法在目標(biāo)識別和圖像配準(zhǔn)方面取得了顯著進(jìn)展。2004 年,哥倫比亞大學(xué)的LOWE David G教授提出一種基于新特征點(diǎn)提取的尺度不變特征變換(SIFT)算法[1]。該算法較好地解決了物體發(fā)生旋轉(zhuǎn)縮放、視角以及光照變化引起的圖像變形等問題,并在人機(jī)交互的環(huán)境下,能實時識別地面目標(biāo)。
1 SIFT算法原理
 SIFT特征向量生成的實現(xiàn)順序為檢測尺度空間中的極值點(diǎn)、定位極值點(diǎn)的位置、確定特征點(diǎn)的方向、生成描述特征點(diǎn)的特征向量。
1.1 檢測尺度空間極值點(diǎn)
 尺度空間理論目的是模擬圖像數(shù)據(jù)的多尺度特征,高斯卷積核是實現(xiàn)尺度變換的唯一線性核,一幅二維圖像的尺度空間定義為:



式中,(x,y)是空間坐標(biāo);σ是尺度坐標(biāo),σ值越小,表征該圖像被平滑得越少,相應(yīng)的尺度也就越小。大尺度對應(yīng)于圖像的概貌特征,小尺度對應(yīng)于圖像的細(xì)節(jié)特征。為了有效地在尺度空間檢測到穩(wěn)定的關(guān)鍵點(diǎn),提出了高斯差分尺度空間(DoG Scale-space)。利用不同尺度的高斯差分核與圖像卷積生成 DoG算子,其計算簡單,是尺度歸一化的LoG算子的近似。為了尋找尺度空間的極值點(diǎn),每一個采樣點(diǎn)要與它所有的相鄰點(diǎn)比較,看其比它的圖像域和尺度域的相鄰點(diǎn)大或者小。如圖1所示,中間的檢測點(diǎn)與它同尺度的 8 個相鄰點(diǎn)和上下相鄰尺度對應(yīng)的點(diǎn)(共26個點(diǎn))進(jìn)行比較,以確保在尺度空間和二維圖像空間都檢測到極值點(diǎn)。

1.2 特征點(diǎn)過濾并進(jìn)行精確定位
 在該過程中,精確確定關(guān)鍵點(diǎn)的位置和尺度,要同時去除低對比度的特征點(diǎn)和不穩(wěn)定的邊緣相應(yīng)點(diǎn),以增強(qiáng)匹配穩(wěn)定性、提高抗噪聲能力。
1.3 特征點(diǎn)的方向值分配
 利用關(guān)鍵點(diǎn)鄰域像素的梯度方向分布特性為每個關(guān)鍵點(diǎn)指定方向參數(shù),使算子具備旋轉(zhuǎn)不變性。首先在高斯尺度空間計算特征點(diǎn)的梯度模和方向公式:

 其中,m是梯度模;θ是梯度方向;L是原圖與高斯核的卷積,L所用的尺度為每個關(guān)鍵點(diǎn)各自所在的尺度,在實際計算時,通常以關(guān)鍵點(diǎn)為中心的領(lǐng)域窗口內(nèi)采樣,用直方圖統(tǒng)計鄰域像素的梯度方向。
1.4 生成描述特征點(diǎn)的特征向量
 首區(qū)域上計算8個方向的梯度直方圖,繪制每個梯度方向的累加值,即可形成一個種子點(diǎn),因此,一共可以生成16個種子點(diǎn)。這樣,對于每個關(guān)鍵點(diǎn)就可以產(chǎn)生一個長度為128的數(shù)據(jù),即最終形成一個長度為128的 SIFT特征向量。此時SIFT特征向量已經(jīng)去除了尺度變化、旋轉(zhuǎn)等幾何變形因素的影響,再繼續(xù)將特征向量的長度歸一化,則可進(jìn)一步去除光照變化的影響。這種鄰域方向性信息聯(lián)合的思想增強(qiáng)了算法的抗噪聲能力,同時對含有定位誤差的特征匹配也提供了較好的容錯性。特征向量生成的示意圖如圖2所示。

2 人機(jī)交互原理
 人機(jī)交互主要是利用人自身的高速、準(zhǔn)確識別物體的能力對目標(biāo)進(jìn)行實時識別。其重要指標(biāo)是反應(yīng)時間[2]。反應(yīng)時間是指人從機(jī)器或外界獲得信息,經(jīng)過大腦加工分析發(fā)出指令,到運(yùn)動器官開始執(zhí)行動作所需的時間。反應(yīng)時間是從包括感覺反應(yīng)時間(從信息開始刺激到感覺器官有感覺所用時間)到開始動作所用時間(信息加工、決策、發(fā)令開始執(zhí)行所用時間)的總和。
 由于人的生理心理因素的限制,人對刺激的反應(yīng)速度是有限的。一般情況下,反應(yīng)時間約為0.1 s~0.5 s,而受過特殊訓(xùn)練的飛行員反應(yīng)時間可以在0.1 s左右。其反應(yīng)時間的判別表示為:

式中,k為常數(shù),n為等概率出現(xiàn)的選擇對象數(shù)。
3 實驗
 橋梁是重要軍事目標(biāo),實現(xiàn)對橋梁的實時打擊具有重要意義。本實驗的軟件平臺為Matlab r2009a,計算機(jī)平臺為AMD 7750雙核處理器(2 GB內(nèi)存),選用某城市的某一橋梁(空間分辨率為10 m)進(jìn)行實驗。
3.1 采集圖與模板圖角度相同
 圖3為已知橋梁模板圖,其像素值為26×57。圖4為第一幅采集圖,其像素值為200×112。圖3、圖4的視角高度為6 km。圖5為對模板圖的關(guān)鍵點(diǎn)分析。圖6為對模板圖的實時定位結(jié)果,其中在橫坐標(biāo)中,從0~26是模板圖,26~226是采集圖,從圖6可以看出,采用SIFT算法可以將目標(biāo)識別出來,并能精確定位該橋梁的位置。
3.2采集圖與模板圖角度不同

 圖7為發(fā)生旋轉(zhuǎn)的采集圖,其像素值為191×166,視角高度為6 km。圖8為實時定位結(jié)果,其中在橫坐標(biāo)中,0~26是模板圖,26~217是采集圖。

3.3 采集圖與模板圖角度、視角高度都不同
 圖9為角度、視角高度都與模板圖不同的采集圖,其像素值為196×161,視角高度為6.52 km。圖10是實時定位結(jié)果,其中在橫坐標(biāo)中,0~26是模板圖,26~222是采集圖。

 實驗關(guān)鍵參數(shù)如表1所示。從實驗結(jié)果可知,由于檢測出來的關(guān)鍵點(diǎn)較少,所以在人機(jī)交互的環(huán)境下,采用SIFT算法能實時地精確定位識別橋梁目標(biāo),定位的準(zhǔn)確度高于以往采用二值化圖像方法和提取邊緣線方法來識別遙感影像目標(biāo),識別的速度高于以往的改進(jìn)SIFT算法[3],并且其應(yīng)用范圍也比較廣[4]。但是本文提出的方法同其他改進(jìn)算法一樣存在不足,對于天氣較差時采集的影像,無法定位或識別率大大降低。如何提高特征向量的特征度,從而提高定位和識別的正確率,同時又可以保證實時性,將是下一步研究工作的重點(diǎn)。

參考文獻(xiàn)
[1] LOWE D G. Distinctive image features from scale—invariant keypoints[J]. International Journal of Computer Vision,2004, 60(2):91-110.
[2] http://zhidao. baidu. com/question/109629278. html? si=8. 2010-08-29.
[3] GRABNER M, GRABNER H, BISCHOF H. Fast approximated SIFT[C]. Asian Conference on Computer Vision, Hyderabad, India, 2006: 918-927.
[4] 裴聰,戴立玲,盧章平.基于SIFT的簡化算法下圖像快速匹配[J].制造業(yè)自動化,2010,32(1):132-135.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。