吳宇翔,龔濤,梁文宇
?。|華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海 201600)
摘要:傳統(tǒng)模糊C-均值聚類算法需要輸入初始聚類中心,但是輸入錯誤的初始聚類中心會產(chǎn)生較差的圖像分割結(jié)果。對此提出一種改進(jìn)的醫(yī)學(xué)圖像分割算法——基于免疫模糊聚類的醫(yī)學(xué)圖像分割。該算法能夠快速有效地找出合適的初始聚類中心值,使之最大可能地趨近于理想值,從而大大提高算法的效率,避免陷入局部解。同時,將免疫克隆選擇算法融入到模糊聚類算法中。實驗結(jié)果表明,該算法能快速有效地找到合適的初始聚類中心,能有效提高搜索效率和準(zhǔn)確率,得到較理想的分割效果。
關(guān)鍵詞:免疫模糊聚類;圖像分割;克隆選擇
0引言
醫(yī)學(xué)圖像分割是醫(yī)學(xué)圖像處理的重要手段,圖像分割的優(yōu)良會直接影響醫(yī)生對病情的診斷,所以醫(yī)學(xué)圖像分割一直是熱點問題。對于一般對比度明顯的圖片,直接利用簡單閾值算法進(jìn)行分割即可,但是對于醫(yī)學(xué)圖像,灰度差異不明顯,圖像呈現(xiàn)模糊性。模糊聚類算法可以有效解決模糊圖像分割的問題。
模糊C-均值聚類算法目前應(yīng)用已相當(dāng)廣泛[1],如果初始聚類中心選擇不恰當(dāng),容易造成算法收斂到局部極值,會對結(jié)果產(chǎn)生較大影響,造成圖像誤分割。本文提出一種針對初始聚類中心改進(jìn)的免疫模糊聚類算法(FCMAIA)。運用輪盤賭的思想產(chǎn)生接近目標(biāo)函數(shù)極值的初始聚類中心,之后加入免疫克隆算法提高算法的搜索能力,以防止算法早熟,陷入局部解。
1模糊C-均值聚類算法(FCM)
聚類算法中,目前FCM算法是一種主流的迭代聚類算法[2],基于其模糊性的處理優(yōu)勢,對醫(yī)學(xué)模糊圖像處理效果較佳。FCM算法分為以下幾步:待求解樣本數(shù)據(jù)集合R={r1,r2,r3,…,rn},根據(jù)先驗知識將樣本數(shù)據(jù)集合R中的數(shù)據(jù)分成c組,聚類中心V={v1,v2,…,vn},模糊隸屬度矩陣U={uij|i=1,2…,n,j=1,2,…,c},uij表示第i個樣本屬于第j個聚類中心的隸屬度,通過反復(fù)循環(huán)迭代調(diào)整V和U的值,使得目標(biāo)函數(shù)J值最小,其目標(biāo)函數(shù)定義為:
在滿足∑ci=1uij=1的條件下,根據(jù)拉格朗日乘數(shù)法,可得目標(biāo)函數(shù)式(1)取得極小值的必要條件:
其中,m為權(quán)重系數(shù),一般取值范圍是[1.5,2.5],本文令m=2;dij=xi-vj表示樣本點xi到聚類中心vj的歐式距離。
2基于人工免疫的模糊聚類算法
免疫系統(tǒng)具有無監(jiān)督學(xué)習(xí)和自適應(yīng)性的特性[3]。將人工免疫算法融入模糊聚類算法中,可以加強全局搜索能力,使解不易陷入局部峰值。相關(guān)概念定義如下:
圖1算法流程
?。?)抗原:灰度圖像數(shù)據(jù);
(2)抗體:聚類中心;
?。?)抗體的產(chǎn)生過程:圖像數(shù)據(jù)的歸類過程。
算法流程圖如圖1所示。
2.1免疫模糊聚類迭代過程
算法流程如下。
?。?)初始化聚類數(shù)目c,聚類中心V1(1),隸屬度矩陣U(1);
(2)在迭代過程中不斷修正聚類中心,將待求解存入記憶抗體庫;
?。?)對記憶抗體庫中的抗體根據(jù)親和度大小進(jìn)行克隆操作;
?。?)將克隆抗體庫中的抗體按照親和力大小進(jìn)行不等步長的變異;
?。?)對更新后的記憶抗體庫根據(jù)抗體之間的親和度進(jìn)行相應(yīng)抑制操作;
?。?)對隸屬度矩陣U不斷進(jìn)行調(diào)整;
?。?)計算免疫模糊聚類迭代當(dāng)前代的親和度f,如果與前一代親和度相差結(jié)果小于某個閾值ε則迭代結(jié)束,否則轉(zhuǎn)至步驟(2)循環(huán)。
2.2初始化聚類中心計算
由于醫(yī)學(xué)圖像模糊性的特點,如果初始聚類中心選擇得不恰當(dāng),容易導(dǎo)致圖像分割效果較差。本文初始聚類中心查找過程如下:
(1)做出肺部圖像灰度直方圖,令直方圖中的最高點所對應(yīng)的灰度值作為第一個聚類中心,如果出現(xiàn)多個相等峰值,隨機選擇其中一個即可;
?。?)計算數(shù)據(jù)集中的樣本點r離最近聚類中心的距離L(r);
?。?)選擇L(r)較大的點作為下一個聚類中心;
?。?)不斷重復(fù)步驟(2)和步驟(3)直到找出所需初始聚類中心個數(shù)。
其中關(guān)鍵步驟是步驟(3)中D(X)能夠反映被選取點的概率,算法實現(xiàn)過程如下(類似輪盤賭原理):
①對于每個點,計算其與最近的一個聚類中心的距離D(X);
?、趯⑺蠨(X)相加,得到Sum(D(X))+=D(X);
?、廴∫粋€[0,1]之間的隨機值random(n),令S=random(n)*Sum(D(x));
?、芾肧-=D(X),直到S<0,此時對應(yīng)的點就是下一個初始聚類中心。
2.3親和度計算
基于免疫計算的圖像聚類算法[4],通過不斷優(yōu)化隸屬度U和聚類中心V,使圖像數(shù)據(jù)達(dá)到較理想的聚類效果,本文采用基于誤差平方和準(zhǔn)則定義抗體親和度f。
親和度f的公式定義如下:
從式(4)可以看出,目標(biāo)函數(shù)J值越小,親和度越大,圖像數(shù)據(jù)聚類分割效果越好。如式(5)所示。
2.4記憶抗體克隆選擇操作
本文中記憶抗體庫存儲待求解聚類中心,為使結(jié)果不陷入局部最優(yōu)解,加速全局搜索能力,需要對記憶抗體庫抗體進(jìn)行比例不一的克隆選擇操作[5]。抗體克隆個數(shù)由式(6)確定:
其中,fi表示第i個抗體的親和度值,N表示抗體總數(shù),mi表示相似抗體濃度因子。
相似抗體過多會導(dǎo)致克隆抗體庫的抗體趨向均等化,不利于增加抗體的多樣性。針對此問題,本文加入可調(diào)節(jié)相似濃度因子。設(shè)定閾值δ,當(dāng)抗體之間親和度差值小于該值時,稱為相似抗體??贵wi的相似抗體因子mi=p·NiN。其中,p為調(diào)節(jié)系數(shù),Ni為相似抗體數(shù)。
2.5克隆抗體庫選擇性高頻變異
本文根據(jù)抗體親和度大小相應(yīng)地采用小步長和大步長相結(jié)合的變異過程。對親和度高的抗體采用小步長的高斯變異,提高局部搜索能力,不斷提高解的精度。對親和度低的抗體采用大步長的柯西變異,使親和度低的抗體向優(yōu)良抗體靠攏。
(1)高斯變異——小步長變異
其中,gi表示第i代抗體,g′i為變異后的抗體,N(0,1)為均值μ=0、方差σ=1的隨機高斯分布,β是控制函數(shù)衰減的因子,f為親和度。
(2)柯西變異——大步長變異
g′i=gi+α·φm(9)
其中,φm為柯西方程產(chǎn)生的隨機概率數(shù),α為修正步長參數(shù)。
經(jīng)過記憶抗體克隆選擇操作和克隆抗體庫選擇性高頻變異之后,通過將變異后的抗體進(jìn)行排序,選擇克隆抗體庫中親和度高的一部分抗體替換記憶抗體庫中親和度較低的抗體,完成記憶抗體庫更新操作。
2.6記憶抗體庫免疫抑制操作過程
在記憶抗體庫不斷迭代的過程中,需要對抗體作免疫抑制操作[6],避免抗體集中分布,防止記憶抗體庫抗體趨于無差別化。在此,定義抗體之間的親和度為:
其中,dij=xi-xj為第i個抗體與第j個抗體之間的歐式距離,歐氏距離越小,表明抗體之間的親和度越高,就越需要抑制操作,保持記憶抗體庫多樣性;反之,則保留。
免疫抑制過程如下:
(1)根據(jù)歐式距離公式得出記憶抗體庫中任意兩個抗體之間的距離,根據(jù)式(10),得出fij;
(2)設(shè)定閾值τ,當(dāng)任意抗體對親和度fij>τ時,隨機刪除其中一個抗體并隨機從克隆抗體庫篩選一個抗體補充記憶抗體庫。
3實驗與分析
本文所用算法均在MATLAB 2010a環(huán)境進(jìn)行。為了驗證新算法的有效性,準(zhǔn)備一張肺部原始圖像,圖像大小為225×224,圖像整體偏暗,對比度較低,邊界較模糊,如圖1所示。將本文算法應(yīng)用于該肺部圖像分割中,為了進(jìn)行對比,將普通C均值聚類算法與經(jīng)典遺傳算法進(jìn)行比較,比較內(nèi)容分為圖像質(zhì)量和分割效率。在免疫模糊聚類分割中,設(shè)置c=2,最大迭代次數(shù)n=50。
表1列出本文算法與普通C均值聚類算法分別應(yīng)用于上述肺部圖片得到最佳閾值對和所消耗時間。由表可看出,本文算法搜索到最佳閾值對的時間相對普通C均值聚類算法時間效率大大提高,主要是因為利用本文算法可以有效地選取接近最佳閾值對的聚類中心,并加入克隆選擇,通過抗體克隆、變異,選擇加速全局收斂。可以看出,本文算法用于醫(yī)學(xué)圖像處理可行。
表2給出本文算法與經(jīng)典遺傳算法對肺部圖像分割結(jié)果迭代次數(shù)的比較,本文算法迭代10次可以得到最優(yōu)聚類中心,但是經(jīng)典遺傳算法在10次迭代以內(nèi)無法搜尋 到最優(yōu)值,經(jīng)過20~30次迭代,搜索能力才有所加強,勉強找到最優(yōu)值。本文算法中的克隆選擇過程通過克隆選擇、變異、免疫抑制確保優(yōu)秀抗體可以得到保存,從而加速收斂效果。
本文算法與C均值聚類算法和經(jīng)典遺傳算法的圖像分割結(jié)果如圖2所示。
4結(jié)論
本文提出一種基于改進(jìn)的免疫模糊聚類算法,通過算法初步得出最佳的初始聚類中心,防止其落入局部極值附近,加速搜索速度。在此基礎(chǔ)上加入免疫克隆算法,保證抗體的多樣性和全局尋優(yōu)能力。實驗證明,肺部圖像分割較清晰,有助于醫(yī)生對肺部疾病的判斷。后期改進(jìn)工作中,需要不斷提高算法精度,使其達(dá)到醫(yī)學(xué)圖像的精準(zhǔn)分割,真正適用于臨床醫(yī)學(xué)研究。
參考文獻(xiàn)
?。?] 高洪波.模糊聚類分析及其應(yīng)用[M].西安:西安電子科技大學(xué)出版社,2004.
?。?] BEZDEK J C, PAL S K. Fuzzy models for pattern recognition[M]. Piscataway, New Jersey: IEEE Press, 1999.
?。?] 葛紅.免疫算法綜述[J].華南師范大學(xué)學(xué)報(自然科學(xué)版),2002 (3):120126.
?。?] 王磊,潘進(jìn),焦李成.免疫規(guī)劃[J].計算機學(xué)報,2000,23(8):806812.
?。?] 肖人彬,王磊.人工免疫系統(tǒng):原理、模型 、分析及展望[J].計算機報,2002,25(12):12811293.
?。?] 劉麗玨,唐琎,蔡自興.一種用于函數(shù)優(yōu)化的免疫算法[J].電子技術(shù)應(yīng)用,2006,32(6):2224.