《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > DBSCAN算法與數(shù)學(xué)形態(tài)學(xué)在巖石薄片圖像分割中的應(yīng)用
DBSCAN算法與數(shù)學(xué)形態(tài)學(xué)在巖石薄片圖像分割中的應(yīng)用
2016年微型機與應(yīng)用第17期
蔣宜勤1,周基賢1,馮俊羲2,滕奇志2
1.新疆油田分公司實驗檢測研究院,新疆 克拉瑪依 834000;2.四川大學(xué) 電子信息學(xué)院 圖像信息研究所,四川 成都 610065
摘要: 在巖石薄片圖像處理中,針對巖屑礦物個數(shù)未知、成像多為聚集的點狀的特點,提出了一種基于DBSCAN(DensityBased Spatial Clustering of Applications with Noise)算法與數(shù)學(xué)形態(tài)學(xué)的礦物分割方法。首先,標記出每個顆粒目標,求得其中心坐標;其次,利用DBSCAN算法對巖屑顆粒目標中心進行聚類,將不同區(qū)域的巖屑目標分離出來;最后,利用數(shù)學(xué)形態(tài)學(xué)方法對聚類結(jié)果做膨脹、填孔、腐蝕等處理,得到顆粒的邊界。實驗分析表明:該方法聚類效果良好,參數(shù)容易控制并有一定的抗噪性能,對巖屑顆粒目標的提取有較好的效果。
Abstract:
Key words :

  1,周基賢1,馮俊羲2,滕奇志2

  (1.新疆油田分公司實驗檢測研究院,新疆 克拉瑪依 834000;2.四川大學(xué) 電子信息學(xué)院 圖像信息研究所,四川 成都 610065)

     摘要:巖石薄片圖像處理中,針對巖屑礦物個數(shù)未知、成像多為聚集的點狀的特點,提出了一種基于DBSCAN(DensityBased Spatial Clustering of Applications with Noise)算法與數(shù)學(xué)形態(tài)學(xué)的礦物分割方法。首先,標記出每個顆粒目標,求得其中心坐標;其次,利用DBSCAN算法對巖屑顆粒目標中心進行聚類,將不同區(qū)域的巖屑目標分離出來;最后,利用數(shù)學(xué)形態(tài)學(xué)方法對聚類結(jié)果做膨脹、填孔、腐蝕等處理,得到顆粒的邊界。實驗分析表明:該方法聚類效果良好,參數(shù)容易控制并有一定的抗噪性能,對巖屑顆粒目標的提取有較好的效果。

  關(guān)鍵詞:DBSCAN聚類;圖像分割;巖石薄片圖像;數(shù)學(xué)形態(tài)學(xué)

0引言

  利用巖石薄片圖像進行巖石顆粒的粒度分析是地質(zhì)實驗室的一種常用方法,而巖石顆粒的分割是粒度分析和礦物識別的前提。根據(jù)顆粒的光學(xué)性質(zhì)和礦物成分,可以分為以下兩類:

 ?。?)碎屑顆粒。該類顆粒成分較為單一,在正交偏光下,明暗變化比較一致,通常呈現(xiàn)整體地變亮變暗。其特點是顆粒目標面積較大,邊界清晰,容易確定。隨著圖像處理技術(shù)的發(fā)展,目前已經(jīng)有一些典型顆粒分割方法應(yīng)用在碎屑顆粒分割上,取得了較好的效果,已經(jīng)在一定程度上解決了分割的問題。

 ?。?)巖屑顆粒。該類顆粒成分較為復(fù)雜,在正交偏光下明暗變化不一致,通常呈現(xiàn)出點狀。特點是目標面積較小,邊界模糊,難以確定。目前有一些學(xué)者提出了超像素分割方法[1],該方法應(yīng)用到巖石薄片圖像的分割上,能夠大致地擬合出顆粒的邊界,但是存在目標過分割及區(qū)域合并易出錯的問題。

  針對巖屑礦物的光學(xué)特性和成像特點,本文提出一種基于算法密度的聚類算法(DensityBased Spatial Clustering of Applications with Noise,DBSCAN)與數(shù)學(xué)形態(tài)學(xué)的巖屑顆粒分割方法。該方法首先利用顆粒中心代表本身來簡化模型,然后利用DBSCAN算法對目標中心進行聚類,標記出不同的顆粒目標;最后再結(jié)合改進的數(shù)學(xué)形態(tài)學(xué)方法,近似地得到顆粒邊界。實驗結(jié)果表明,本文方法對顆粒的分割和邊界提取有較好的效果,為顆粒邊界的刻畫提供了一種有效的途徑。

1問題描述與分析

  圖1是一幅巖石薄片樣本的單偏光圖像,其中既包含碎屑顆粒,又包含巖屑顆粒。對顆粒進行分割的目的就是確定其邊界,但是僅通過這一張單片光圖片是很難對兩種顆粒進行分割的。

圖像 001.png

  碎屑顆粒目標成分單一,在正交偏光下成像簡單,通常為一整個顆粒,邊界比較容易確定,利用礦物在正交偏光下的這一消光特性[2],目前已有學(xué)者提出了一些分割算法[3],在工程應(yīng)用中取得了較好的效果;而對于巖屑顆粒而言,在正交偏光下成像復(fù)雜,通常呈現(xiàn)若干聚集的點狀,邊界模糊難以確定,常用的顆粒分割方法沒有明顯的效果。針對巖屑顆粒的光學(xué)特性和成像的特點,考慮利用聚類的方法來進行分割,再結(jié)合數(shù)學(xué)形態(tài)學(xué)做后期處理,就可以擬合出目標邊界。

  1.1聚類算法分類

  目前的聚類算法大致可以分為以下4種:(1)基于分割的算法,如k均值[4]、k中心等。這類算法是將數(shù)據(jù)集分成若干的子集。特點是需要設(shè)定簇的數(shù)量,根據(jù)對象間的相似程度將每個對象劃歸最近的簇。(2)層次聚類算法。層次聚類是把數(shù)據(jù)按層次進行分解,最終的結(jié)果形成了一顆類別樹,每個子集是樹的節(jié)點。算法有最近鄰、最遠鄰和CURE等。(3)基于模型的算法。這類算法基于統(tǒng)計理論,假定給定的數(shù)據(jù)集是按照一個確定的模型產(chǎn)生的,找出數(shù)據(jù)集的最佳擬合模型。如期望最大化(EM)[5]算法。(4)基于密度的算法。主要思路是在數(shù)據(jù)集中,根據(jù)密度的高低,分隔出低密度區(qū)域,尋找到高密度區(qū)域,并將每個獨立的高密度區(qū)域作為一個簇。比較典型的算法有DBSCAN[6] 、OPTICS[7]等。

  1.2基于密度的聚類算法特點

  基于密度的聚類方法,是根據(jù)數(shù)據(jù)集在空間分布上的密集程度來進行聚類,不需要人為設(shè)定簇的數(shù)量,非常適用于數(shù)據(jù)集的簇數(shù)量未知的場合。本文所使用的DBSCAN算法是一種經(jīng)典的基于密度聚類算法,它以單位超球狀區(qū)域內(nèi)所包含數(shù)據(jù)對象的數(shù)量作為依據(jù),來衡量此區(qū)域密度的高低[8],它的特點是可以自動確定簇的數(shù)量,能夠在帶有噪聲的數(shù)據(jù)空間中發(fā)現(xiàn)任意形狀的簇,并且可以標記出離群點。

2基于DBSCAN算法與數(shù)學(xué)形態(tài)學(xué)的分割方法

  2.1DBSCAN算法基本理論

  DBSCAN算法最早由ESTER M[6]等人提出,是一種經(jīng)典的基于密度聚類算法,已經(jīng)在交通監(jiān)控[9]、數(shù)據(jù)挖掘等方面有著廣泛的應(yīng)用。DBSCAN算法的主要定義[6,8]如下:

  定義1(Eps鄰域):給定一個數(shù)據(jù)對象p,p的Eps鄰域NEps定義為以p為核心,以Eps為半徑的d維超球體區(qū)域,即:

  NEps(p)={q∈D|dist(p,q)≤Eps}

  定義2(核心點與邊界點):對于某個數(shù)據(jù)對象p∈D,給定一個整數(shù)minPts,若p的Eps鄰域內(nèi)對象的數(shù)量滿足|NEps(p)|≥minPts條件,則稱p為(Eps,minPts)條件下的核心點;若p不滿足此條件,則它不是核心點,又若p落在某個核心點的Eps鄰域內(nèi),則稱它為邊界點。

  定義3(直接密度可達):給定(Eps,minPts),如果對象p和q滿足以下兩個條件:p∈NEps(q);|NEps(q)|≥minPts,(即q是核心點),則稱對象p是從對象q出發(fā),直接密度可達的。

  定義4(直接密度可達):給定一個數(shù)據(jù)集D,當存在一個對象鏈p1,p2,p3,...,pn,其中p1=q,pn=p對于pi∈D,如果在條件(Eps,minPts)下pi+1從pi直接密度可達,則稱對象p從對象q在條件(Eps,minPts)下密度可達。

  定義5(密度相連):如果數(shù)據(jù)集D中存在一個對象o,使得對象p和q是從o在(Eps,minPts)條件下密度可達的,那么就稱對象p和q密度相連,密度相連是對稱的。

  定義6(簇和噪聲):由任意一個核心點對象開始,從該對象密度可達的所有對象構(gòu)成一個簇。不屬于任何簇的對象為噪聲。

  在巖石薄片圖像中,巖屑顆粒目標就是呈現(xiàn)的聚集的點狀。而噪聲分布是雜亂無章的,聚集程度較低,與巖屑顆粒目標的分布有著差別。在工程中,無法獲得顆粒數(shù)量等先驗知識,而DBSCAN算法在目標簇的數(shù)量未知的情況下,可以尋找到任意形狀的簇。因此,DBSCAN算法很適合這種場景下的應(yīng)用。

  2.2巖屑顆粒分割及邊界提取步驟

  實際中本文得到的是一幅復(fù)雜多樣的圖片,首先要進行面積預(yù)處理,然后為了簡化模型,利用目標中心來代表本身,進一步需要聚類、去噪、數(shù)學(xué)形態(tài)學(xué)處理等過程,最終才能得到分割的結(jié)果。

  在本文中,分割的結(jié)果是多值的,傳統(tǒng)二值圖像的形態(tài)學(xué)處理是不適用的,需要做一些改進,如對目標進行膨脹,邊界的顏色需要與當前處理的目標顏色一致。

  在實際中,巖石薄片圖像里既有大面積的碎屑顆粒目標,也有小面積、呈現(xiàn)出聚集點狀的巖屑顆粒目標,如圖2所示。提取巖屑顆粒目標需要以下幾個步驟:

圖像 002.png

 ?。?)利用兩種顆粒面積大小不同的特點,通過設(shè)定面積閾值,提取出巖屑顆粒目標,對其進行單獨處理;

 ?。?)標記出每個連通區(qū)域,并求出其中心坐標;

 ?。?)運用DBSCAN算法對各區(qū)域進行聚類,標記出不同的巖屑顆粒和噪聲點;

 ?。?)去除噪聲點并進行膨脹、填孔等數(shù)學(xué)形態(tài)學(xué)的處理,得到巖屑顆粒的邊界。

3實驗結(jié)果與分析

  對于實際中的一幅圖片,如圖2所示,先進行面積的預(yù)處理,去除大面積的碎屑顆粒目標,便得到了含有噪聲的巖屑顆粒目標,如圖3所示。首先標記出每個連通區(qū)域并求得其中心坐標;其次運用DBSCAN算法對顆粒中心進行聚類,提取出巖屑顆粒目標,并標識出噪聲點,其中灰色的為巖屑顆粒目標,純白色的為噪聲點,結(jié)果如圖4所示。去除噪聲并對巖屑顆粒進行膨脹,得到的結(jié)果如圖5所示。對膨脹結(jié)果進行填孔、腐蝕處理得到最終的結(jié)果,如圖6所示。 

圖像 003.png

圖像 004.png

圖像 005.png

  對比圖3和圖4可以看出,DBSCAN算法可以有效地去除噪聲點,能夠提取出巖屑顆粒,具有較好的抗噪性能。得到了巖屑顆粒目標后,由于它們是呈散點狀的,還需要通過膨脹和后期的填孔處理。從圖5可以看出,膨脹后在顆粒邊界周圍,存在著一些小面積目標,這些目標是孤立的,并不影響顆粒的總體輪廓,所以可以去除它們。從總體上看,經(jīng)過多次膨脹,目標面積增大了,需要進行適當?shù)母g或開操作的處理,

圖像 006.png

4結(jié)論

  基于DBSCAN算法和數(shù)學(xué)形態(tài)學(xué)的巖石薄片圖像分割方法,首先經(jīng)過面積預(yù)處理,去除碎屑顆粒目標,保留巖屑顆粒目標;然后利用DBSCAN算法對含有噪聲的巖屑顆粒中心坐標進行聚類,從而去除大部分的噪聲點;再對結(jié)果進行改進的膨脹、填孔、腐蝕等形態(tài)學(xué)處理,最終得到分割結(jié)果和顆粒目標的邊界。

  實驗結(jié)果表明,本文方法對巖屑顆粒的分割與邊界提取有一定的效果,為顆粒目標提取和粒度分析提供了一種途徑。但該方法也存在著一些不足,如經(jīng)過數(shù)學(xué)形態(tài)學(xué)處理的結(jié)果邊緣不夠平滑;DBSCAN算法需要人為設(shè)定經(jīng)驗性的參數(shù),目前還不能很好地自適應(yīng)。如何根據(jù)實際中復(fù)雜多樣的情況做出相應(yīng)的改進,將是需要進一步解決的問題。

  參考文獻

  [1] ACHANTA R, SHAJI A, SMITH K, et al. SLIC superpixels compared to stateoftheart superpixel methods[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(11): 2274 2282.

 ?。?] 常麗華,陳曼云,金巍,等. 透明礦物薄片鑒定手冊[M]. 北京:地質(zhì)出版社, 2006.

 ?。?] 吳擁, 蘇桂芬, 滕奇志, 等. 巖石薄片正交偏光圖像的顆粒分割方法[J]. 科學(xué)技術(shù)與工程, 2013,13(31): 92019206.

  [4] MACQUEEN J. Some methods for classification and analysis of multivariate observations[C].Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1967, 1(14): 281297.

  [5] MOON T K. The expectationmaximization algorithm[J]. Signal Processing Magazine, IEEE, 1996, 13(6): 47 60.

 ?。?] ESTER M, KRIEGEL H P, SANDER J, et al. A densitybased algorithm for discovering clusters in large spatial databases with noise[C]. Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining (KDD′96).AAAI Press,1996: 226231.

 ?。?] ANKERST M, BREUNIG M M, KRIEGEL H P, et al. OPTICS: ordering points to identify the clustering structure[C]. In: Proceedings of the 1999 ACM SIGMOD International Conference on Management of Data, SIGMOD 1999:4960.

 ?。?] 夏魯寧, 荊繼武. SADBSCAN: 一種自適應(yīng)基于密度聚類算法[J]. 中國科學(xué)院研究生院學(xué)報, 2009, 26(4): 530 538.

 ?。?] 劉衛(wèi)寧,曾嬋娟,孫棣華. 基于DBSCAN算法的營運車輛超速點聚類分析[J]. 計算機工程,2009,35(5):268 270.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。