陳舒,陳若寒
?。ǜ=ň鞂W院 計算機與信息安全管理系,福建 福州 350007)
摘要:腫瘤癌變細胞FISH圖像分析系統(tǒng)中,需要解決粘連細胞核的分割問題。FISH屬于新興技術(shù),產(chǎn)生的是特殊的熒光彩色細胞圖,現(xiàn)有細胞圖像分析方法并不適用。文章創(chuàng)新設(shè)計了基于深度凹陷檢測和構(gòu)造自然凹陷力的方法,分離粘連細胞核。首先,針對參差不齊的實驗成像,在RGB模型下結(jié)合統(tǒng)計思想,將圖像分為三類,分別進行預處理。繼而,利用融合了Kmeans聚類算法的改進馬爾科夫隨機場(MRF)方法,將細胞核與癌變信號點進行有效提取。在此基礎(chǔ)上,利用幾何原理,創(chuàng)新設(shè)計了一套粘連細胞核分離算法。最后,給出細胞核快速計數(shù)和信號點提取方法。該系統(tǒng)設(shè)計基本完整,并達到預期效果。
關(guān)鍵詞:FISH圖像;細胞核提取;MRF模型;細胞核粘連;自然凹陷力
中圖分類號:R857.3;TP391文獻標識碼:ADOI: 10.19358/j.issn.1674-7720.2017.01.015
引用格式:陳舒,陳若寒. 腫瘤癌變細胞FISH圖像分析系統(tǒng)的研究[J].微型機與應用,2017,36(1):48-51,55.
0引言
較多研究表明,癌變細胞中都存在HER2蛋白的過表達或基因擴增現(xiàn)象。當前的檢測技術(shù)有很多種,其中的FISH技術(shù)雖是一項新興技術(shù)但已經(jīng)被公認為業(yè)界的“黃金標準”[12]。
經(jīng)過FISH技術(shù)處理后產(chǎn)生的腫瘤癌變細胞圖像中,包含三個主要成分:背景(黑色)、細胞核(藍色)、信號點(紅色和綠色)。通過統(tǒng)計、分析細胞核與信號點的個數(shù),就可以實現(xiàn)對HER2蛋白擴增現(xiàn)象的檢測。
1預處理
FISH圖像中,具有研究價值的區(qū)域恰好與RGB顏色模型的三個通道相吻合,不需要進行復雜的映射或者換算,所以選用RGB模型來進行設(shè)計。通過批量觀察以及相應資料的查閱,F(xiàn)ISH技術(shù)呈現(xiàn)的細胞核大致具有3個特點:邊緣模糊(熒光強度不同)、核外輪廓各異(探針手工著色)、核內(nèi)結(jié)構(gòu)復雜(孔洞),需要進行預處理使得圖像呈現(xiàn)最佳效果,從而簡化算法。
1.1FISH圖像分類
首先,根據(jù)成像的熒光效果,將圖像分為三類:(1)弱熒光信號圖;(2)暈染嚴重信號圖;(3)理想信號圖。分別如圖1(a)、(b)、(c)所示。在專家指導下進行手工分類作為訓練樣本,得出圖像在藍色通道上的分布規(guī)律,借助統(tǒng)計學原理,進行自動分類。
1.2非理想圖片的改善
需要對弱熒光圖進行增強,對暈染現(xiàn)象進行去除。
1.2.1弱熒光圖自適應增強
?。?)原圖像進行疊加,I=1.5×I(這步操作的實質(zhì)是對亮度進行疊加);
?。?)重新判斷是否為弱熒光,如果是,則重新轉(zhuǎn)入步驟(1),否則停止。實驗效果如圖2所示。
1.2.2暈染現(xiàn)象的自動去除
(1)將判別為“暈染嚴重”的原始圖像轉(zhuǎn)化為藍色亮度圖;
?。?)運用Otsu法進行閾值分割,目標標記為1(白),背景標注為0(黑);
?。?)填補小于閾值Pc個像素點的連通區(qū)域(孔洞);
?。?)去除小于閾值Pc個像素點的連通區(qū)域(非細胞核區(qū)域);
(5)將標記為目標的區(qū)域恢復成RGB圖,其他部分保持黑色背景;
?。?)重新判斷是否暈染嚴重,如果是,則重新轉(zhuǎn)入步驟(2),否則停止。實驗效果如圖3。
其中Pc默認為原圖總像素點的4%,這個百分比是根據(jù)多次實驗效果得出的經(jīng)驗值,表示該圖片中的細小孔洞,可以自適應各種尺寸的原始圖像。
2FISH圖像細胞核的提取
2.1傳統(tǒng)方法
對細胞核提取的常用方法主要依據(jù)四類原理,分別是:閾值分割、邊緣檢測、傳統(tǒng)區(qū)域思想以及基于特殊算法的理論[34]。
閾值分割雖然快速簡便、不需要先驗知識,卻沒有考慮與鄰域像素點之間的關(guān)聯(lián)性,分割較為粗糙,容易發(fā)生誤判;邊緣檢測雖然是基于各個像素點與其鄰域的差異,但是細胞核內(nèi)熒光信號產(chǎn)生了大量的梯度變化,給真實邊緣的檢測增加了困難;傳統(tǒng)區(qū)域思想需要先驗知識并對圖像有一定要求,且不考慮空間信息,容易造成過分割;而基于特殊算法的理論,則因為其特定的應用條件、復雜的參數(shù)或?qū)D像計算量的要求等,在FISH圖像的細胞核提取中并不適用。
2.2本文方法
綜合以上算法的優(yōu)缺點,本文考慮到像素點間的關(guān)聯(lián),選取馬爾科夫隨機場(MRF)[57]與無監(jiān)督的聚類算法相結(jié)合來進行圖像分割,提取FISH圖像的細胞核。
從算法計算量和精度的角度考慮,在MRF建模中,選用二階8鄰域系統(tǒng)的Potts模型作為標記場模型,有限高斯混合模型(FGMM)建立觀測場,迭代條件模式(ICM)作為最優(yōu)化分割算法,其中Potts模型中的勢函數(shù)β改進為可變勢函數(shù)βb。
2.2.1可變勢函數(shù)
勢函數(shù)β的大小對分割結(jié)果影響很大。以圖4a為例進行分割,選取其中β=0.5和β=5的情況,分割結(jié)果如圖4(b)和圖4(c)。
顯然,當勢函數(shù)β增大時,標記場就越占主導,區(qū)域性就越好,分割結(jié)果細節(jié)也就越差;當勢函數(shù)β變小時,標記場的影響就弱了,觀測場占的比重變大,分割結(jié)果細節(jié)信息豐富,區(qū)域性差。由此引入可變勢函數(shù)βb,符合“前期著重在區(qū)域性的控制,后期集中在細節(jié)信息的判斷”的規(guī)律,勢函數(shù)應該是逐漸變小的。
綜上所述,設(shè)計可變勢函數(shù)如下:
令初始勢函數(shù)β=1,總迭代次數(shù)限制為maxIter,當前迭代次數(shù)為Iter,則當Iter<maxIter時,構(gòu)造可變勢函數(shù)βb,表達式為:
上式保證在迭代次數(shù)Iter增加時,勢函數(shù)βb是緩慢變小的,并且不會偏離最初由經(jīng)驗確定的β值太多。
2.2.2FISH圖像細胞核的提取具體步驟
(1)將原始圖像轉(zhuǎn)化為藍色亮度圖;
(2)設(shè)定實驗圖像分類數(shù)K=2,初始勢函數(shù)β=1,最大迭代次數(shù)maxIter=10;
(3)應用Kmeans聚類算法得到初始分割;
(4)估計觀測場參數(shù)μ和σ2;
(5)計算FGMM模型建立的觀測場能量;
(6)計算Potts模型建立的標記場能量;
(7)根據(jù)能量最小原則,估計新的分割;
(8)判斷是否滿足迭代終止條件(MAP準則和最大迭代次數(shù)),滿足則算法停止,得到最佳分割,否則更新勢函數(shù)βb的值,并重新轉(zhuǎn)入步驟(3)。
2.2.3實驗效果
分別用Otsu自動閾值法、傳統(tǒng)的Kmeans聚類算法以及本文算法對FISH細胞圖像進行分割,效果如圖5所示??梢钥闯?,本文算法比前兩種產(chǎn)生的分割結(jié)果更加連續(xù),且錯判產(chǎn)生的孔洞現(xiàn)象更少。這說明:融合了MRF模型的Kmeans聚類分割方法,在兼顧了區(qū)域完整性的同時較好地保有了細節(jié)信息。而引入可變的勢函數(shù)βb的優(yōu)勢,在前文已有分析。在判定為細胞核的一些區(qū)域內(nèi),仍然存在一些細小的孔洞,用前文處理暈染圖片時使用的方法修復,效果如圖6所示。
3粘連細胞核的分離
對粘連細胞核分離的常用方法主要依據(jù)三類原理,分別是:基于數(shù)學形態(tài)學、基于形狀特征以及特定理論的方法。
3.1傳統(tǒng)方法
當目標粘連緊密時,應用基于數(shù)學形態(tài)學的方法通常得不到理想的種子點個數(shù)。
基于形狀特征原理,主要是采用尋找凹點進而分離的方法。將細胞核的粘連方式分為串聯(lián)和并聯(lián)兩類,根據(jù)每個區(qū)域凹點奇偶性或者其他準則,來判斷屬于哪一類粘連。然后運用不同的凹點匹配策略,進行凹點連線劃分。但大部分的方法并沒有考慮更加復雜的串并聯(lián)混合情況,F(xiàn)ISH細胞核恰屬于復雜粘連情況,同時,F(xiàn)ISH細胞核邊緣不規(guī)則,容易出現(xiàn)“假凹點”。
基于特定理論的方法中,比較適合FISH圖像復雜結(jié)構(gòu)的是文獻[8]中提出的基于水平集和隨機霍夫圓檢驗方法來分離原生質(zhì)細胞核。但該算法融入了水平集算法,需要設(shè)定的參數(shù)非常多,隨著粘連細胞核個數(shù)的增加和粘連情況的復雜,相應的參數(shù)也更加難以全面設(shè)置,并且需要用到統(tǒng)計學的霍夫投票法決定區(qū)域的分割歸屬問題,計算量較大,影響了總體分析效率,故不采用。此外,其他文獻中基于主動輪廓模型[910]和圖論[1112]等方法的改進,都因計算量比較大,不予采用。
3.2本文方法
在Harris和Susan算法的基礎(chǔ)上,改進設(shè)計出“深度凹陷點”的檢測方法,尋找因粘連造成的真正凹陷,同時判斷出粘連現(xiàn)象的存在與否。接著,創(chuàng)新引入“自然凹陷力”的概念,令深度凹陷點的凹陷有規(guī)律有方向地加深,并逐漸產(chǎn)生區(qū)域斷裂,最終實現(xiàn)粘連的分離。
3.2.1深度凹陷點檢測
本文將角點分為以下4種點情況:鈍角凸點、銳角凸點、輕微凹陷點、深度凹陷點。本文定義的深度凹陷點必須滿足以下條件:以該角點作為圓形模板的中心,角點的兩條線段在目標區(qū)域內(nèi)構(gòu)成的夾角必須大于225°。
本文設(shè)計的深度凹陷檢測方法:
?。?)設(shè)FISH細胞核二值圖I中,目標(細胞核區(qū)域)標記為1,背景標記為0,同時構(gòu)造半徑R=5的圓形模板M,模板內(nèi)標記為1的像素點總個數(shù)為MMAX;
?。?)利用Harris角點檢測算法對I進行掃描,得到一個角點集合J(j1,j2,...,jn);
(3)將圓形模板M的中心與J(j1,j2,...,jn)逐點重合;
(4)借鑒Susan算法的思想,得到每一個角點位置上的USAN值MUSAN;
(5)當MUSAN>5/8×MMAX時,該角點判定為深度凹陷點,存入集合H中,用于下一階段運算。
3.2.2粘連判斷
當某個目標連通區(qū)域內(nèi)存在深度凹陷點時,該區(qū)域存在粘連現(xiàn)象,需要實現(xiàn)細胞分離,否則是獨立細胞核。
3.2.3自然凹陷力
設(shè)想:在現(xiàn)實世界中,要讓這些粘連的細胞核產(chǎn)生分離,可以對每一個深度凹陷處施加作用力,要求該作用力的大小一致,方向順應每個凹陷處的凹陷方向,這樣在凹陷處就會不斷地加深凹陷程度,粘連的細胞核們也會逐漸被擠壓得分離開。當某幾處作用力匯集到一點時,該局部的粘連區(qū)域就被分離;當圖像中所有深度凹陷處施加的作用力都匯集到某一處時,則粘連部分被完全分離。
為了滿足實時性的需求,本文采用純幾何的線性思想來模擬自然凹陷力的作用,如圖7所示。
本文設(shè)計的自然凹陷力具體作用過程為:
?。?)取深度凹陷點集合H(H1,H2,...,Hn);
?。?)定位至其中一點Hi(i=1,2...,n),以該點為圓心、R=8(多次實驗的經(jīng)驗值)為半徑構(gòu)造一個圓,設(shè)該圓交Hi兩條邊的交點分別為J1和J2;
(3)作線段J1J2的中垂線(圖中HiHi′→所指的方向即為凹陷方向),在目標內(nèi)交圓于Hi′點,將凹點Hi移動至Hi′,則該凹陷局部區(qū)域的邊界,由原先的弧J1Hi⌒和弧HiJ2⌒,變?yōu)橛删€段J1Hi′和線段Hi′J2 構(gòu)成,實現(xiàn)該區(qū)域凹陷程度的加深;
(4)逐個定位至H中的其他點,重復步驟(2)和(3),遍歷一輪后,將產(chǎn)生的集合H′作為新的凹陷點集合H,完成一輪自然凹陷力作用;
(5)定位至更新過的Hi點,重復步驟(2)~(4),直至新產(chǎn)生的Hi′不再在目標內(nèi)時,停止Hi點的繼續(xù)凹陷,跳至H中的其他點繼續(xù)操作,直至所有的H′都在背景中時(表示粘連產(chǎn)生的凹陷區(qū)域都完成分離),停止所有操作。
3.2.4本文粘連分離方法
(1)讀取一張原始FISH細胞核圖Iy;
(2)利用前文設(shè)計的方法,將Iy分類并預處理為理想圖I,使用前文設(shè)計的細胞核提取方法,將I中的細胞核提取出來,并將圖像轉(zhuǎn)化為二值圖I0;
(3)對I0做邊界提取,記錄目標初始邊緣ED0;
(4)利用半徑R=3的近圓形結(jié)構(gòu)元素SE,對I0圖像做腐蝕運算,分離輕微粘連的細胞核;
(5)利用前文設(shè)計的“深度凹陷檢測方法”,檢測出當前圖中深度凹陷點,存入集合H;
(6)利用前文“自然凹陷力”,逐點加深H點處的凹陷,最終使得細胞核粘連區(qū)域全部得以分離;
(7)對分離后的各個區(qū)域進行連續(xù)粗化運算(保持不連通性),使各個區(qū)域復原成原始大小,直至區(qū)域邊緣達到ED0的極限,且結(jié)果不再變化為止;
(8)對當前二值圖I0做邊界提取,記錄當前目標的邊緣ED,則ED為細胞核的分離界線;
(9)將分離界線轉(zhuǎn)化為紅色,疊加于圖像I上,作為輸出結(jié)果。
3.2.5實驗效果
分別選取“簡單粘連”和“復雜粘連”的FISH細胞核圖像進行分離實驗,結(jié)果如圖8、圖9所示,實驗效果理想。
4細胞核計數(shù)和信號點提取
4.1細胞核計數(shù)
讀取一張經(jīng)過粘連分離后的細胞核二值圖I0,繼而計算標記為目標(標記為1)的連通區(qū)域數(shù),即為細胞核個數(shù)。
4.2信號點提取
紅色信號點的提取方法:先將G和B的值減為0,得到R紅色熒光圖,再通過閾值分割和極限腐蝕法得到幾何中心,用于后續(xù)分析。同理,可用于綠色信號點的提取。
5結(jié)論
系統(tǒng)主要實現(xiàn)4個功能:(1)FISH圖像預處理;(2)FISH細胞核的提??;(3)粘連細胞核的分離;(4)細胞核技術(shù)和信號點提取。上述設(shè)計,都在滿足精確度和視覺效果要求的范圍內(nèi),盡可能構(gòu)造計算量小、直觀性強的方法。但仍存在著不足:無法實現(xiàn)某些特殊情況下的粘連分離,比如在細胞核嚴重團簇、細胞核發(fā)生多層粘連時,內(nèi)層細胞核相互擠壓,沒有形成凹陷,使之無法分離。這有待進一步改善。
參考文獻
[1] 柳威, 謝鳳, 陳臨溪. CAbl在腫瘤發(fā)生及治療中的重要作用[J]. 臨床與病理雜志, 2012, 32(6):516-523.
?。?] 唐磊. 基于腫瘤分類與生長建模的癌癥藥物療效預測平臺設(shè)計與應用[D]. 合肥:中國科學技術(shù)大學, 2012.
[3] 楊澤新.基于顏色和形狀的圖像檢索技術(shù)研究與實現(xiàn)[D].武漢:華中科技大學,2006.
?。?] 許新征,丁世飛,史忠植,等 .圖像分割的新理論和新方法[J].電子學報,2010,38(Z1):76-82.
?。?] 劉國英. 基于Markov隨機場的小波域圖像建模及分割[M]. 北京:科學出版社, 2010.
?。?] 白雪. 基于三馬爾可夫場的SAR圖像分割[D]. 西安:西安電子科技大學, 2012.
[7] 段汕, 陳曉惠, 鄭晨. 基于區(qū)域特征的模糊多尺度Markov模型在紋理圖像分割中的應用[J]. 中南民族大學學報(自然科學版), 2010, 29(3):93-99.