《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 顯示光電 > 設(shè)計(jì)應(yīng)用 > 基于Labelme的參考圖像的手工分割
基于Labelme的參考圖像的手工分割
2015年微型機(jī)與應(yīng)用第17期
吉江燕,方 挺
(安徽工業(yè)大學(xué) 電氣與信息工程學(xué)院,安徽 馬鞍山 243032)
摘要: 圖像分割算法雖然已經(jīng)有了大量的研究,但沒(méi)有適用于所有圖像的通用分割算法。因此針對(duì)不同圖像的實(shí)際情況,需要進(jìn)行大量的實(shí)驗(yàn)來(lái)選擇最優(yōu)的分割算法。通過(guò)比較算法分割得到的結(jié)果圖像與對(duì)應(yīng)手工分割得到的參考圖像之間的差異,可以得到一種圖像分割算法的性能評(píng)價(jià),因此本文提出一種參考圖像的獲取方法。通過(guò)結(jié)合算法和LabelMe在線注釋軟件,該方法能夠方便地完成圖像中各種目標(biāo)邊界的定位并保存圖像。
關(guān)鍵詞: 圖像分割 參考圖像 LabelMe
Abstract:
Key words :

  摘  要圖像分割算法雖然已經(jīng)有了大量的研究,但沒(méi)有適用于所有圖像的通用分割算法。因此針對(duì)不同圖像的實(shí)際情況,需要進(jìn)行大量的實(shí)驗(yàn)來(lái)選擇最優(yōu)的分割算法。通過(guò)比較算法分割得到的結(jié)果圖像與對(duì)應(yīng)手工分割得到的參考圖像之間的差異,可以得到一種圖像分割算法的性能評(píng)價(jià),因此本文提出一種參考圖像的獲取方法。通過(guò)結(jié)合算法和LabelMe在線注釋軟件,該方法能夠方便地完成圖像中各種目標(biāo)邊界的定位并保存圖像。

  關(guān)鍵詞: 圖像分割;參考圖像;LabelMe

0 引言

  參考圖像的手工分割對(duì)衡量圖像分割算法的性能具有非常重要的意義。目前衡量圖像分割算法性能的主要方法是通過(guò)其與手工分割的參考圖像進(jìn)行差異性對(duì)比來(lái)實(shí)現(xiàn)。由于差異性可以通過(guò)定義相關(guān)分割評(píng)價(jià)指標(biāo)來(lái)具體完成,所以該方法具有很高的評(píng)價(jià)分辨率。本文將以多目標(biāo)的礦石圖像為例,使用基于種子標(biāo)記的分水嶺算法獲取算法分割的礦石圖像,通過(guò)LabelMe在線注釋并結(jié)合離散點(diǎn)連線和閉合多邊形內(nèi)部填充算法完成手工分割的參考圖像的獲取,并將礦石目標(biāo)的等面積直徑作為分割評(píng)價(jià)指標(biāo)來(lái)衡量礦石圖像分割的效果。

1 礦石圖像的算法分割

001.jpg

  圖1給出了640×512的礦石灰度圖像,由于該圖像中有大量的細(xì)碎鐵礦石目標(biāo)且相互粘連,所以本文先通過(guò)預(yù)處理獲取圖2所示的種子標(biāo)記圖像,在此基礎(chǔ)上采用基于種子標(biāo)記的分水嶺算法完成圖像分割[1-2]?;诜N子標(biāo)記的分水嶺算法是通過(guò)標(biāo)記所在的區(qū)域?qū)υ瓐D像進(jìn)行區(qū)域生長(zhǎng),以此抑制噪聲對(duì)圖像分割的影響,標(biāo)記區(qū)域的結(jié)果影響圖像分割的準(zhǔn)確性。圖3給出了基于種子標(biāo)記分水嶺算法的分割結(jié)果圖像。該礦石圖像被基于種子標(biāo)記的分水嶺算法分割成為246個(gè)礦石目標(biāo)。

  為了檢驗(yàn)礦石圖像分割算法的可行性,本文將重點(diǎn)介紹如何使用LabelMe在線標(biāo)識(shí)工具完成礦石圖像的手動(dòng)分割并保存參考圖像。

2 LabelMe在線注釋

  LabelMe[3]是由麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(MIT CSAIL)創(chuàng)建的一個(gè)開放的注釋工具。目的是以此來(lái)創(chuàng)建計(jì)算機(jī)視覺研究所需要的圖像集并通過(guò)網(wǎng)絡(luò)立即共享,且隨著時(shí)間的推移與時(shí)俱進(jìn)。圖像的注釋以XML文件進(jìn)行保存。用戶可以下載平臺(tái)上已有的帶注釋的圖像集,包括原始圖像集和對(duì)應(yīng)的XML文件集,并通過(guò)LabelMe提供的MATLAB工具箱幫助對(duì)其進(jìn)行處理。MATLAB工具箱提供一些函數(shù),包括顯示注釋的圖像、查詢特定的注釋內(nèi)容、下載圖像集等。用戶同時(shí)也可以上傳圖像到該平臺(tái)上,并對(duì)該圖像中感興趣的區(qū)域進(jìn)行在線注釋。

002.jpg

  圖4給出了圖像中的一個(gè)礦石目標(biāo)在線注釋示意圖。通過(guò)點(diǎn)擊該礦石目標(biāo)的邊界來(lái)描繪包含該目標(biāo)的多邊形輪廓且命名為stone1。用戶可以對(duì)圖像中任意目標(biāo)進(jìn)行注釋,不同的注釋目標(biāo)在圖像中會(huì)用不同的顏色進(jìn)行標(biāo)記。對(duì)應(yīng)圖像注釋的XML文件中保存了各目標(biāo)的名稱和點(diǎn)擊目標(biāo)邊界所形成的多邊形的離散坐標(biāo)點(diǎn),可通過(guò)LabelMe提供的MATLAB工具箱中的LMplot函數(shù)將離散坐標(biāo)點(diǎn)進(jìn)行連接以完成注釋圖像的顯示。

003.jpg

  圖5給出了通過(guò)LabelMe完成的所有礦石目標(biāo)的在線注釋,該礦石圖像總共注釋了272個(gè)礦石目標(biāo)。在線注釋完畢后,下載對(duì)應(yīng)圖像的XML文件并結(jié)合MATLAB來(lái)作進(jìn)一步處理。

3 參考圖像的獲取

  由于XML文件中保存的是點(diǎn)擊目標(biāo)邊界所形成多邊形的離散坐標(biāo)點(diǎn),函數(shù)LMplot僅能夠在圖像上對(duì)各多邊形的離散坐標(biāo)點(diǎn)連線顯示,并不能為此保存參考圖像。因此本文通過(guò)更改LMplot函數(shù)實(shí)現(xiàn)參考圖像的存儲(chǔ)功能。具體完成的功能包括兩點(diǎn):離散點(diǎn)連線和閉合多邊形內(nèi)部填充。

  由于LMplot函數(shù)是先將XML文件中的一個(gè)礦石多邊形對(duì)應(yīng)的離散坐標(biāo)點(diǎn)取出并在圖像上進(jìn)行描繪,再循環(huán)取出下一個(gè)多邊形對(duì)應(yīng)的離散坐標(biāo)點(diǎn)予以描繪,所以只需在其循環(huán)描繪多邊形時(shí)對(duì)離散點(diǎn)連線并賦予相同且唯一標(biāo)識(shí)的顏色即RGB值構(gòu)成閉合的區(qū)域并進(jìn)行內(nèi)部填充,在圖像中所有礦石描繪完畢的同時(shí)便可獲取手動(dòng)分割的礦石圖像。

004.jpg

  如圖6所示,假設(shè)礦石目標(biāo)此時(shí)由6個(gè)離散點(diǎn)組成,且對(duì)應(yīng)在圖像上連線的順序是從①到⑥,分別對(duì)6個(gè)離散點(diǎn)進(jìn)行兩兩連線,即①與⑥連接,②與①連接,…,⑥與⑤連接?,F(xiàn)在考慮兩點(diǎn)之間的連線方式,假設(shè)兩點(diǎn)的始末坐標(biāo)值分別為(x0,y0)和(x1,y1)。為使兩點(diǎn)之間的連線順滑,本文以兩點(diǎn)之間的斜率值為基礎(chǔ)進(jìn)行連線。根據(jù)起點(diǎn)和終點(diǎn)之間(x,y)坐標(biāo)值的大小變化可分為8種情況,分別為(x↑(↓),y↑(↓))、(x不變,y↑(↓))和(x↑(↓),y不變)。由于后四種情況下都有一個(gè)坐標(biāo)軸的值不改變,所以兩點(diǎn)之間的連線非常簡(jiǎn)單,不再贅述。

  本文將以(x↑,y↑)即x1>x0,y1>y0為例說(shuō)明連線過(guò)程,其余的三種情況是同樣的原理。首先通過(guò)式(1)計(jì)算參數(shù)k,k的整數(shù)部分記為kint,余數(shù)部分記為krem。

  ]88Z$U03DRZ@TQO4JT6V1GF.png

  若x1-x0>y1-y0(x1-x0<y1-y0),則x(y)沿著增大的方向每填充kint個(gè)坐標(biāo)點(diǎn),y(x)沿增大的方向填充1個(gè)坐標(biāo)點(diǎn),直到填充到y(tǒng)1-1(x1-1)為止,記錄此時(shí)的x(y)值,再補(bǔ)齊y1(x1)的余數(shù)部分krem。圖7給出了(x↑,y↑)時(shí)x1-x0>y1-y0情況下兩點(diǎn)之間連線的示意圖。

005.jpg

  將描繪礦石目標(biāo)多邊形的離散點(diǎn)連線后,再對(duì)該閉合輪廓進(jìn)行內(nèi)部填充。首先找到該區(qū)域x的取值范圍,對(duì)該取值范圍內(nèi)的每一個(gè)x值根據(jù)輪廓的顏色標(biāo)識(shí)找到對(duì)應(yīng)y方向上的兩個(gè)端點(diǎn),并逐個(gè)用相同的顏色填充y方向兩端點(diǎn)之間的坐標(biāo)點(diǎn)。同理找到該區(qū)域y方向的取值范圍,并填充x方向兩端點(diǎn)之間的坐標(biāo)點(diǎn),最終的填充結(jié)果是兩者重疊的部分,以此消除單獨(dú)對(duì)一種方向上填充出現(xiàn)的填充錯(cuò)誤。圖8給出了加注釋的礦石圖像,圖9給出了通過(guò)算法獲取的手動(dòng)分割圖像。

4 分割效果評(píng)估

  本文采用等面積直徑來(lái)分析算法分割的效果[4]。等面積直徑d由式(2)計(jì)算得到,其中s代表了圖像中每個(gè)礦石目標(biāo)所包含的像素總個(gè)數(shù)。

  IE`7R8%}FAP0O@)N{90TC7M.png

006.jpg

  獲取礦石圖像中所有礦石目標(biāo)的等面積直徑后,利用核密度估計(jì)求出等面積直徑的概率密度分布,本文選用的核函數(shù)是高斯函數(shù),再由此求出等面積直徑的累積概率分布,得到累積粒度分布信息。圖10給出了手動(dòng)分割圖像和算法分割圖像的累積粒度分布圖。從圖10可知,真實(shí)粒度分布和估算粒度分布曲線很相近,說(shuō)明基于標(biāo)記的分水嶺算法分割所獲取的礦石目標(biāo)邊緣與實(shí)際礦石的邊緣較吻合。

5 結(jié)束語(yǔ)

  本文提出了一種基于LabelMe的手工分割參考圖像的獲取方法,該方法能夠很方便地標(biāo)記圖像中的各目標(biāo),并且通過(guò)算法可以實(shí)現(xiàn)圖像的保存,由此可以方便地對(duì)圖像分割算法的性能進(jìn)行評(píng)價(jià)。

  參考文獻(xiàn)

  [1] 王蘭莎.多目標(biāo)礦業(yè)復(fù)雜圖像特征提取與分類[D].北京:北京化工大學(xué),2011.

  [2] 王鳳娥.改進(jìn)后的分水嶺算法在圖像分割中的應(yīng)用研究[D].濟(jì)南:山東大學(xué),2008.

  [3] RUSSELL B C, TORRALBA A, MURPHY K P, et al. LabelMe: a database and web-based tool for image annotation[J]. International Journal of Computer Vision, 2008,77(1-3):157-173.

  [4] ZHANG Z, SU X, DING L, et al. Multi-scale image segmentation of coal piles on a belt based on the Hessian matrix [J]. Particuology, 2013,11(5):549-555.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。