《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于屬性論的無監(jiān)督圖像聚類
基于屬性論的無監(jiān)督圖像聚類
來源:微型機與應用2012年第2期
李根根, 馮嘉禮
(上海海事大學 信息工程學院,上海 200135)
摘要: 提出了應用屬性論來實現(xiàn)無監(jiān)督圖像聚類的方法。首先提取圖像的底層特征,再利用屬性論方法中定性映射、轉換程度函數(shù)理論對圖像進行分類。由于一次聚類并未達到很好的效果,因此采取了多次聚類的策略。實驗結果表明,本方法簡單明了并且有效。
Abstract:
Key words :

摘   要: 提出了應用屬性論來實現(xiàn)無監(jiān)督圖像聚類的方法。首先提取圖像的底層特征,再利用屬性論方法中定性映射、轉換程度函數(shù)理論對圖像進行分類。由于一次聚類并未達到很好的效果,因此采取了多次聚類的策略。實驗結果表明,本方法簡單明了并且有效。
關鍵詞: 屬性論;定性映射;轉換程度函數(shù);圖像聚類;HSV

    隨著多媒體技術的飛速發(fā)展以及圖像獲取與存儲技術的提高,圖像數(shù)據(jù)庫得到了快速發(fā)展。面對如此龐大的圖像數(shù)據(jù)庫,各個領域的圖像都非常多,想要檢索其中用戶感興趣的圖像十分不容易。因此,有必要對圖像數(shù)據(jù)庫中的圖像進行聚類以減少圖像檢索的代價。俗話說“物以類聚”,圖像的聚類即是將圖像數(shù)據(jù)庫中最為相似的部分劃為一類,使得類內(nèi)的相似度盡可能高,而類間的相似度盡可能低。
    本文中的圖像聚類采用圖像的顏色以及輪廓兩種特征。利用熟知的HSV模型來得到圖像的顏色譜,以此作為顏色特征。輪廓特征則利用屬性論方法來獲取。在提取了特征之后,利用轉換程度函數(shù)來完成聚類。
1 圖像聚類
    在聚類之前,先來介紹本文所用到的一些理論知識。好的聚類結果離不開兩個重要方面:準確有效的圖像特征以及合適的理論與方法。這兩方面缺任何一個都有可能達不到預期的效果。
1.1 定性映射[1-2]
    眾所周知,事物有質(zhì)和量的兩種規(guī)定性,質(zhì)和量之間有質(zhì)量互變規(guī)律:只有超過度的范圍的量變才導致質(zhì)的變化,而限于度的范圍之內(nèi)的量變不導致質(zhì)變。 這一性質(zhì)可用如下定理表示:



 
1.3 輪廓特征提取
    對圖像提取輪廓,首先將圖像進行灰度化,然后獲得圖像的灰度直方圖,再確定圖像二值化的閾值,最后對圖像進行二值化。
    二值化后的圖像只有兩種顏色,從屬性論的觀點出發(fā),每幅圖片只有黑色和白色兩種屬性,它們所對應的量值分別為0和255。由于圖像輪廓產(chǎn)生在這兩種屬性發(fā)生轉變的臨界部分,這樣圖像的輪廓就很容易提取出來了。將圖像分成若干個區(qū)域,在這些區(qū)域中利用表示白色與黑色屬性的定性映射做一個差,這個差值的絕對值不外乎兩種情況:1和0, 1表示發(fā)生了性質(zhì)的轉變,0表示未發(fā)生性質(zhì)的轉變。當每一個區(qū)域中有1值時,就將這個區(qū)域劃為輪廓,否則不劃為輪廓部分并將這個區(qū)域變成白色。
1.4  顏色特征提取
    圖像顏色的表達有許多種方式,如比較常見的RGB空間、HSV空間、HIS空間等。HSV空間具有如下特點:三個分量相對于人的視覺彼此獨立,信息結構更緊湊;能夠獲得對彩色的直觀表示;各彩色值根據(jù)主觀評價均勻量化,彩色距離的大小與人眼的感覺一致;人對顏色的感覺比較均勻。因此,本文以此空間來表示圖像的顏色。HSV空間中,H表示色調(diào),S表示飽和度,V表示亮度。
    HSV空間中,根據(jù)參考文獻[5],各分量的計算公式如下:
 

其中,Qs、Qv分別表示S、V的量化級數(shù),通過式(11)可知它們都取值為2。由式(12)式很容易得到l的取值范圍,然后再統(tǒng)計圖像中各值的分布,即可得到圖像的顏色譜。
1.5 聚類算法
    將上面得到的顏色特征記為向量C,輪廓特征記為向量P。由于應用的不同,可能想要得到的結果也就不同。通常的做法是為每一種特征都賦一個權值,由于并無確定權值的具體算法,因此只能從反復實驗中獲得一組合理的。
    聚類的步驟如下:
    (1)由于開始時并無類別之分,因此就將第一個待歸類的作為一個類別。
    (2)若待匹配的類別中只有一個元素,則可以用普通

 



    本文將屬性論方法應用在圖像聚類中,從表1中的結果可以看出該方法的有效性。但是本文提出的算法還存在很多不足,如權值以及相似度閾值的確定都比較依賴于人們的經(jīng)驗值或反復實驗所獲得的合理值,在無監(jiān)督的聚類中,將這些值變?yōu)槌绦蛴嬎愠鰜硎呛芾щy的。實驗所用圖像庫是對物體做360°全方位拍攝所得的圖片,本文只對圖片做了一種變換(即對稱變換)。下一步的工作就是對圖像做一個三維的變換來提高聚類的正確率以及減少聚類的次數(shù)。
參考文獻
[1] 李文佩. 基于定型映射和轉化程度函數(shù)的漢字識別[D]. 上海:上海海事大學,2004.
[2] 馮嘉禮. 定性映射、基準變換、轉化程度函數(shù)、人工神經(jīng)元和集合模糊化[J].模糊數(shù)學與系統(tǒng),2004,18:53-56.
[3] 馮嘉禮. 基于屬性坐標學習和分析的核事故評估與決策模型[J].應用基礎與工程科學學報,2006,5(14):1-8.
[4] 馮嘉禮. 基于定性映射的程度函數(shù)及其誘導的模糊拓撲空間[J].計算機科學,2003,30(5):106-108.
[5] 孫即祥. 圖像處理[M].北京:科學出版社,2009.
[6] 謝從華,沈鈞毅,宋余慶,等. 一種圖像數(shù)據(jù)庫聚類與歸類方法的研究[J].控制與決策,2008,6(6):701-704.
 

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。