123,123,123

腫瘤癌變細胞FISH圖像分析系統(tǒng)的研究

2017年微型機與應用第1期

陳舒，陳若寒

福建警察學院計算機與信息安全管理系，福建福州 350007

摘要： 腫瘤癌變細胞FISH圖像分析系統(tǒng)中，需要解決粘連細胞核的分割問題。FISH屬于新興技術，產(chǎn)生的是特殊的熒光彩色細胞圖，現(xiàn)有細胞圖像分析方法并不適用。文章創(chuàng)新設計了基于深度凹陷檢測和構造自然凹陷力的方法，分離粘連細胞核。首先，針對參差不齊的實驗成像，在RGB模型下結合統(tǒng)計思想，將圖像分為三類，分別進行預處理。繼而，利用融合了Kmeans聚類算法的改進馬爾科夫隨機場（MRF）方法，將細胞核與癌變信號點進行有效提取。在此基礎上，利用幾何原理，創(chuàng)新設計了一套粘連細胞核分離算法。最后，給出細胞核快速計數(shù)和信號點提取方法。該系統(tǒng)設計基本完整，并達到預期效果。

關鍵詞： FISH圖像細胞核提取 MRF模型細胞核粘連

Abstract：

Key words :

　　陳舒，陳若寒

　?。ǜ＝ň鞂W院計算機與信息安全管理系，福建福州 350007）

摘要：腫瘤癌變細胞FISH圖像分析系統(tǒng)中，需要解決粘連細胞核的分割問題。FISH屬于新興技術，產(chǎn)生的是特殊的熒光彩色細胞圖，現(xiàn)有細胞圖像分析方法并不適用。文章創(chuàng)新設計了基于深度凹陷檢測和構造自然凹陷力的方法，分離粘連細胞核。首先，針對參差不齊的實驗成像，在RGB模型下結合統(tǒng)計思想，將圖像分為三類，分別進行預處理。繼而，利用融合了Kmeans聚類算法的改進馬爾科夫隨機場（MRF）方法，將細胞核與癌變信號點進行有效提取。在此基礎上，利用幾何原理，創(chuàng)新設計了一套粘連細胞核分離算法。最后，給出細胞核快速計數(shù)和信號點提取方法。該系統(tǒng)設計基本完整，并達到預期效果。

　　關鍵詞：FISH圖像；細胞核提取；MRF模型；細胞核粘連；自然凹陷力

　　中圖分類號：R857.3;TP391文獻標識碼：ADOI： 10.19358/j.issn.1674-7720.2017.01.015

　　引用格式：陳舒，陳若寒. 腫瘤癌變細胞FISH圖像分析系統(tǒng)的研究［J］.微型機與應用，2017,36（1）：48-51，55.

0引言

　　較多研究表明，癌變細胞中都存在HER2蛋白的過表達或基因擴增現(xiàn)象。當前的檢測技術有很多種，其中的FISH技術雖是一項新興技術但已經(jīng)被公認為業(yè)界的“黃金標準”［12］。

　　經(jīng)過FISH技術處理后產(chǎn)生的腫瘤癌變細胞圖像中，包含三個主要成分：背景（黑色）、細胞核（藍色）、信號點（紅色和綠色）。通過統(tǒng)計、分析細胞核與信號點的個數(shù)，就可以實現(xiàn)對HER2蛋白擴增現(xiàn)象的檢測。

1預處理

　　FISH圖像中，具有研究價值的區(qū)域恰好與RGB顏色模型的三個通道相吻合，不需要進行復雜的映射或者換算，所以選用RGB模型來進行設計。通過批量觀察以及相應資料的查閱，F(xiàn)ISH技術呈現(xiàn)的細胞核大致具有3個特點：邊緣模糊（熒光強度不同）、核外輪廓各異（探針手工著色）、核內結構復雜（孔洞），需要進行預處理使得圖像呈現(xiàn)最佳效果，從而簡化算法。

　　1.1FISH圖像分類

　　首先，根據(jù)成像的熒光效果，將圖像分為三類：（1）弱熒光信號圖；（2）暈染嚴重信號圖；（3）理想信號圖。分別如圖1（a）、（b）、（c）所示。在專家指導下進行手工分類作為訓練樣本，得出圖像在藍色通道上的分布規(guī)律，借助統(tǒng)計學原理，進行自動分類。

　　1.2非理想圖片的改善

　　需要對弱熒光圖進行增強，對暈染現(xiàn)象進行去除。

　　1.2.1弱熒光圖自適應增強

　?。?）原圖像進行疊加，I=1.5×I（這步操作的實質是對亮度進行疊加）；

　?。?）重新判斷是否為弱熒光，如果是，則重新轉入步驟（1），否則停止。實驗效果如圖2所示。

　　1.2.2暈染現(xiàn)象的自動去除

　?。?）將判別為“暈染嚴重”的原始圖像轉化為藍色亮度圖；

　　（2）運用Otsu法進行閾值分割，目標標記為1（白），背景標注為0（黑）；

　?。?）填補小于閾值Pc個像素點的連通區(qū)域（孔洞）；

　?。?）去除小于閾值Pc個像素點的連通區(qū)域（非細胞核區(qū)域）；

　?。?）將標記為目標的區(qū)域恢復成RGB圖，其他部分保持黑色背景；

　　（6）重新判斷是否暈染嚴重，如果是，則重新轉入步驟（2），否則停止。實驗效果如圖3。

　　其中Pc默認為原圖總像素點的4%，這個百分比是根據(jù)多次實驗效果得出的經(jīng)驗值，表示該圖片中的細小孔洞，可以自適應各種尺寸的原始圖像。

2FISH圖像細胞核的提取

　　2.1傳統(tǒng)方法

　　對細胞核提取的常用方法主要依據(jù)四類原理，分別是：閾值分割、邊緣檢測、傳統(tǒng)區(qū)域思想以及基于特殊算法的理論［34］。

　　閾值分割雖然快速簡便、不需要先驗知識，卻沒有考慮與鄰域像素點之間的關聯(lián)性，分割較為粗糙，容易發(fā)生誤判；邊緣檢測雖然是基于各個像素點與其鄰域的差異，但是細胞核內熒光信號產(chǎn)生了大量的梯度變化，給真實邊緣的檢測增加了困難；傳統(tǒng)區(qū)域思想需要先驗知識并對圖像有一定要求，且不考慮空間信息，容易造成過分割；而基于特殊算法的理論，則因為其特定的應用條件、復雜的參數(shù)或對圖像計算量的要求等，在FISH圖像的細胞核提取中并不適用。

　　2.2本文方法

　　綜合以上算法的優(yōu)缺點，本文考慮到像素點間的關聯(lián)，選取馬爾科夫隨機場（MRF）［57］與無監(jiān)督的聚類算法相結合來進行圖像分割，提取FISH圖像的細胞核。

　　從算法計算量和精度的角度考慮，在MRF建模中，選用二階8鄰域系統(tǒng)的Potts模型作為標記場模型，有限高斯混合模型（FGMM）建立觀測場，迭代條件模式（ICM）作為最優(yōu)化分割算法，其中Potts模型中的勢函數(shù)β改進為可變勢函數(shù)βb。

　　2.2.1可變勢函數(shù)

　　勢函數(shù)β的大小對分割結果影響很大。以圖4a為例進行分割，選取其中β=0.5和β=5的情況，分割結果如圖4（b）和圖4（c）。

　　顯然，當勢函數(shù)β增大時，標記場就越占主導，區(qū)域性就越好，分割結果細節(jié)也就越差；當勢函數(shù)β變小時，標記場的影響就弱了，觀測場占的比重變大，分割結果細節(jié)信息豐富，區(qū)域性差。由此引入可變勢函數(shù)βb，符合“前期著重在區(qū)域性的控制，后期集中在細節(jié)信息的判斷”的規(guī)律，勢函數(shù)應該是逐漸變小的。

　　綜上所述，設計可變勢函數(shù)如下：

　　令初始勢函數(shù)β=1，總迭代次數(shù)限制為maxIter，當前迭代次數(shù)為Iter，則當Iter<maxIter時，構造可變勢函數(shù)βb，表達式為：

　　 4M4AGD)I}C}J5]B$O`B$MZC.png

　　上式保證在迭代次數(shù)Iter增加時，勢函數(shù)βb是緩慢變小的，并且不會偏離最初由經(jīng)驗確定的β值太多。

　　2.2.2FISH圖像細胞核的提取具體步驟

　　(1)將原始圖像轉化為藍色亮度圖;

　　(2)設定實驗圖像分類數(shù)K=2，初始勢函數(shù)β=1，最大迭代次數(shù)maxIter=10；

　　(3)應用Kmeans聚類算法得到初始分割；

　　(4)估計觀測場參數(shù)μ和σ2；

　　(5)計算FGMM模型建立的觀測場能量；

　　(6)計算Potts模型建立的標記場能量；

　　(7)根據(jù)能量最小原則，估計新的分割；

　　(8)判斷是否滿足迭代終止條件（MAP準則和最大迭代次數(shù)），滿足則算法停止，得到最佳分割，否則更新勢函數(shù)βb的值，并重新轉入步驟（3）。

　　2.2.3實驗效果

　　分別用Otsu自動閾值法、傳統(tǒng)的Kmeans聚類算法以及本文算法對FISH細胞圖像進行分割，效果如圖5所示?？梢钥闯?，本文算法比前兩種產(chǎn)生的分割結果更加連續(xù)，且錯判產(chǎn)生的孔洞現(xiàn)象更少。這說明：融合了MRF模型的Kmeans聚類分割方法，在兼顧了區(qū)域完整性的同時較好地保有了細節(jié)信息。而引入可變的勢函數(shù)βb的優(yōu)勢，在前文已有分析。在判定為細胞核的一些區(qū)域內，仍然存在一些細小的孔洞，用前文處理暈染圖片時使用的方法修復，效果如圖6所示。

3粘連細胞核的分離

　　對粘連細胞核分離的常用方法主要依據(jù)三類原理，分別是：基于數(shù)學形態(tài)學、基于形狀特征以及特定理論的方法。

　　3.1傳統(tǒng)方法

　　當目標粘連緊密時，應用基于數(shù)學形態(tài)學的方法通常得不到理想的種子點個數(shù)。

　　基于形狀特征原理，主要是采用尋找凹點進而分離的方法。將細胞核的粘連方式分為串聯(lián)和并聯(lián)兩類，根據(jù)每個區(qū)域凹點奇偶性或者其他準則，來判斷屬于哪一類粘連。然后運用不同的凹點匹配策略，進行凹點連線劃分。但大部分的方法并沒有考慮更加復雜的串并聯(lián)混合情況，F(xiàn)ISH細胞核恰屬于復雜粘連情況，同時，F(xiàn)ISH細胞核邊緣不規(guī)則，容易出現(xiàn)“假凹點”。

　　基于特定理論的方法中，比較適合FISH圖像復雜結構的是文獻［8］中提出的基于水平集和隨機霍夫圓檢驗方法來分離原生質細胞核。但該算法融入了水平集算法，需要設定的參數(shù)非常多，隨著粘連細胞核個數(shù)的增加和粘連情況的復雜，相應的參數(shù)也更加難以全面設置，并且需要用到統(tǒng)計學的霍夫投票法決定區(qū)域的分割歸屬問題，計算量較大，影響了總體分析效率，故不采用。此外，其他文獻中基于主動輪廓模型［910］和圖論［1112］等方法的改進，都因計算量比較大，不予采用。

　　3.2本文方法

　　在Harris和Susan算法的基礎上，改進設計出“深度凹陷點”的檢測方法，尋找因粘連造成的真正凹陷，同時判斷出粘連現(xiàn)象的存在與否。接著，創(chuàng)新引入“自然凹陷力”的概念，令深度凹陷點的凹陷有規(guī)律有方向地加深，并逐漸產(chǎn)生區(qū)域斷裂，最終實現(xiàn)粘連的分離。

　　3.2.1深度凹陷點檢測

　　本文將角點分為以下4種點情況：鈍角凸點、銳角凸點、輕微凹陷點、深度凹陷點。本文定義的深度凹陷點必須滿足以下條件：以該角點作為圓形模板的中心，角點的兩條線段在目標區(qū)域內構成的夾角必須大于225°。

　　本文設計的深度凹陷檢測方法：

　?。?）設FISH細胞核二值圖I中，目標（細胞核區(qū)域）標記為1，背景標記為0，同時構造半徑R=5的圓形模板M，模板內標記為1的像素點總個數(shù)為MMAX；

　?。?）利用Harris角點檢測算法對I進行掃描，得到一個角點集合J(j1,j2,...,jn)；

　　(3)將圓形模板M的中心與J(j1,j2,...,jn)逐點重合；

　　(4)借鑒Susan算法的思想，得到每一個角點位置上的USAN值MUSAN；

　　(5)當MUSAN>5/8×MMAX時，該角點判定為深度凹陷點，存入集合H中，用于下一階段運算。

　　3.2.2粘連判斷

　　當某個目標連通區(qū)域內存在深度凹陷點時，該區(qū)域存在粘連現(xiàn)象，需要實現(xiàn)細胞分離，否則是獨立細胞核。

　　3.2.3自然凹陷力

　　設想：在現(xiàn)實世界中，要讓這些粘連的細胞核產(chǎn)生分離，可以對每一個深度凹陷處施加作用力，要求該作用力的大小一致，方向順應每個凹陷處的凹陷方向，這樣在凹陷處就會不斷地加深凹陷程度，粘連的細胞核們也會逐漸被擠壓得分離開。當某幾處作用力匯集到一點時，該局部的粘連區(qū)域就被分離；當圖像中所有深度凹陷處施加的作用力都匯集到某一處時，則粘連部分被完全分離。

　　為了滿足實時性的需求，本文采用純幾何的線性思想來模擬自然凹陷力的作用，如圖7所示。

　　本文設計的自然凹陷力具體作用過程為：

　?。?）取深度凹陷點集合H(H1,H2,...,Hn)；

　?。?）定位至其中一點Hi(i=1,2...,n)，以該點為圓心、R=8（多次實驗的經(jīng)驗值）為半徑構造一個圓，設該圓交Hi兩條邊的交點分別為J1和J2；

　?。?）作線段J1J2的中垂線（圖中HiHi′→所指的方向即為凹陷方向），在目標內交圓于Hi′點，將凹點Hi移動至Hi′，則該凹陷局部區(qū)域的邊界，由原先的弧J1Hi⌒和弧HiJ2⌒，變?yōu)橛删€段J1Hi′和線段Hi′J2 構成，實現(xiàn)該區(qū)域凹陷程度的加深；

　　(4)逐個定位至H中的其他點，重復步驟（2）和（3），遍歷一輪后，將產(chǎn)生的集合H′作為新的凹陷點集合H，完成一輪自然凹陷力作用；

　?。?）定位至更新過的Hi點，重復步驟（2）~（4），直至新產(chǎn)生的Hi′不再在目標內時，停止Hi點的繼續(xù)凹陷，跳至H中的其他點繼續(xù)操作，直至所有的H′都在背景中時（表示粘連產(chǎn)生的凹陷區(qū)域都完成分離），停止所有操作。

　　3.2.4本文粘連分離方法

　　(1)讀取一張原始FISH細胞核圖Iy；

　　(2)利用前文設計的方法，將Iy分類并預處理為理想圖I，使用前文設計的細胞核提取方法，將I中的細胞核提取出來，并將圖像轉化為二值圖I0；

　　(3)對I0做邊界提取，記錄目標初始邊緣ED0；

　　(4)利用半徑R=3的近圓形結構元素SE，對I0圖像做腐蝕運算，分離輕微粘連的細胞核；

　　(5)利用前文設計的“深度凹陷檢測方法”，檢測出當前圖中深度凹陷點，存入集合H；

　　(6)利用前文“自然凹陷力”，逐點加深H點處的凹陷，最終使得細胞核粘連區(qū)域全部得以分離；

　　(7)對分離后的各個區(qū)域進行連續(xù)粗化運算（保持不連通性），使各個區(qū)域復原成原始大小，直至區(qū)域邊緣達到ED0的極限，且結果不再變化為止；

　　(8)對當前二值圖I0做邊界提取，記錄當前目標的邊緣ED，則ED為細胞核的分離界線；

　　(9)將分離界線轉化為紅色，疊加于圖像I上，作為輸出結果。

　　3.2.5實驗效果

　　分別選取“簡單粘連”和“復雜粘連”的FISH細胞核圖像進行分離實驗，結果如圖8、圖9所示，實驗效果理想。

4細胞核計數(shù)和信號點提取

　　4.1細胞核計數(shù)

　　讀取一張經(jīng)過粘連分離后的細胞核二值圖I0，繼而計算標記為目標（標記為1）的連通區(qū)域數(shù)，即為細胞核個數(shù)。

　　4.2信號點提取

　　紅色信號點的提取方法：先將G和B的值減為0，得到R紅色熒光圖，再通過閾值分割和極限腐蝕法得到幾何中心，用于后續(xù)分析。同理，可用于綠色信號點的提取。

5結論

　　系統(tǒng)主要實現(xiàn)4個功能：（1）FISH圖像預處理；（2）FISH細胞核的提?。唬?）粘連細胞核的分離；（4）細胞核技術和信號點提取。上述設計，都在滿足精確度和視覺效果要求的范圍內，盡可能構造計算量小、直觀性強的方法。但仍存在著不足：無法實現(xiàn)某些特殊情況下的粘連分離，比如在細胞核嚴重團簇、細胞核發(fā)生多層粘連時，內層細胞核相互擠壓，沒有形成凹陷，使之無法分離。這有待進一步改善。

　　參考文獻

　?。?］柳威, 謝鳳, 陳臨溪. CAbl在腫瘤發(fā)生及治療中的重要作用［J］. 臨床與病理雜志, 2012, 32(6):516-523.

　?。?］唐磊. 基于腫瘤分類與生長建模的癌癥藥物療效預測平臺設計與應用［D］. 合肥：中國科學技術大學, 2012.

　　［3］楊澤新.基于顏色和形狀的圖像檢索技術研究與實現(xiàn)［D］.武漢：華中科技大學,2006.

　?。?］許新征,丁世飛,史忠植,等 .圖像分割的新理論和新方法［J］.電子學報,2010,38(Z1):76-82.

　?。?］劉國英. 基于Markov隨機場的小波域圖像建模及分割［M］. 北京：科學出版社, 2010.

　?。?］白雪. 基于三馬爾可夫場的SAR圖像分割［D］. 西安：西安電子科技大學, 2012.

　?。?］段汕, 陳曉惠, 鄭晨. 基于區(qū)域特征的模糊多尺度Markov模型在紋理圖像分割中的應用［J］. 中南民族大學學報(自然科學版), 2010, 29(3):93-99.

原創(chuàng)聲明：此內容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權禁止轉載。

相關內容