摘 要: 提出了一種基于胃鏡圖像的計(jì)算機(jī)輔助病灶檢測(cè)方法。首先,引入超像素理論,將胃鏡圖像分割成大小均勻且包含相似像素的若干區(qū)域;然后,分別提取顏色特征和紋理特征,并將其融合作為特征描述符;最后,采用二級(jí)串聯(lián)分類器進(jìn)行胃鏡圖像內(nèi)干擾區(qū)域的去除以及病灶區(qū)域的識(shí)別。實(shí)驗(yàn)結(jié)果表明,本方法病灶檢測(cè)正確率(AUC)可達(dá)到91.588%。
關(guān)鍵詞: 病灶檢測(cè);顏色直方圖;超像素;LBP
隨著人類生活方式和日常飲食的改變,加之現(xiàn)代生活快節(jié)奏性與不規(guī)律性,胃腸道疾病的發(fā)病率越來(lái)越高。目前,胃部疾病的檢測(cè)主要借助于電子胃鏡。醫(yī)學(xué)電子胃鏡主要由內(nèi)窺鏡、視頻處理器和視頻顯示器組成。應(yīng)用電子胃鏡可以采集到高分辨率的醫(yī)學(xué)圖像,如圖1所示。臨床醫(yī)生可以靈活地操控電子胃鏡來(lái)實(shí)時(shí)地觀察胃鏡的病變區(qū)域。盡管如此,由于診斷過(guò)程主要憑借臨床醫(yī)生的主觀性,加之病理特征的多樣性和胃部環(huán)境的復(fù)雜性,胃病診斷的誤診率和漏診率仍居高不下。因此,研究與設(shè)計(jì)一種基于胃鏡圖像的計(jì)算機(jī)輔助檢測(cè)系統(tǒng)十分必要。
就目前來(lái)看,此方面的研究主要集中在無(wú)線膠囊內(nèi)窺鏡圖像上,其研究的焦點(diǎn)主要集中于小腸和結(jié)腸的病灶區(qū)域檢測(cè)。而針對(duì)于傳統(tǒng)胃鏡圖像的研究尚處于起步階段,對(duì)于胃部病變的檢測(cè)尚未形成一種有效的方法??v觀前人的工作,雖然檢測(cè)方法多種多樣,但可以粗略概括為圖像預(yù)處理、特征提取和用分類器進(jìn)行識(shí)別3個(gè)步驟。在圖像預(yù)處理階段,圖像通常會(huì)被分割成小矩形塊[1]或相互重疊的圓形區(qū)域[2];接下來(lái),從分割后得到的區(qū)域提取各種不同特征,包括顏色直方圖、局部二進(jìn)制模式(LBP)和小波域共生矩陣特征等。在最近幾年中,機(jī)器學(xué)習(xí)被廣泛地應(yīng)用到醫(yī)學(xué)圖像的病灶檢測(cè)領(lǐng)域當(dāng)中,例如支持向量機(jī)(SVM)[3]、貝葉斯推理和神經(jīng)網(wǎng)絡(luò)等。
前人方法的主要缺陷在于過(guò)少地考慮了干擾因素的影響,提取特征相對(duì)單一。針對(duì)以上問(wèn)題,本文提出了一種新的基于胃鏡圖像的病灶方法。首先,運(yùn)用超像素的思想將圖像進(jìn)行分割;然后,針對(duì)每一個(gè)分割后的區(qū)域,分別提取適合于排除干擾和識(shí)別病灶的組合特征;最后,采用二級(jí)串聯(lián)分類器進(jìn)行干擾區(qū)域的去除和病灶區(qū)域的識(shí)別。
1 本方法中的相關(guān)技術(shù)
胃腸道不同于人體其他器官,作為消化系統(tǒng)的一部分,它的生理環(huán)境十分復(fù)雜,其表面經(jīng)常會(huì)被粘液、氣泡和食物殘?jiān)雀采w。除此之外,胃鏡的光照條件也極大地影響了圖像的質(zhì)量。綜合前人工作的分析可知,過(guò)多的噪聲極大地影響了病灶區(qū)域的識(shí)別準(zhǔn)確率。針對(duì)此種情況,本文方法在圖像分割、特征提取以及分類器的設(shè)計(jì)上進(jìn)行了相應(yīng)改進(jìn)。
1.1 基于超像素的區(qū)域劃分
超像素在計(jì)算機(jī)視覺(jué)中得到了廣泛應(yīng)用,但是在病灶檢測(cè)領(lǐng)域尚未得到應(yīng)用。參考文獻(xiàn)[4]提出了一種簡(jiǎn)單線性迭代聚集算法(SLIC)來(lái)減少計(jì)算量。相比較于歸一化分割算法和快速漂移算法,該算法具有耗時(shí)短、超像素的尺寸和矩形度可調(diào)節(jié)的特點(diǎn)。
從實(shí)驗(yàn)結(jié)果可以看出,對(duì)于干擾區(qū)域,15維的HIS_I、30維的HSV_HV、15維的Normalized RGB和15維的Opponent顏色特征表現(xiàn)出色,其受試者工作特征曲線(ROC曲線)下面積均可達(dá)到97.32%、98.78%、97.62%和99.27%。對(duì)于病灶區(qū)域,45維的HSV_HV、30維的RGB、45維的RG、15維的Opponent特征表現(xiàn)良好,其ROC曲線下面積均可達(dá)到90.76%、91.19%、92.83%和91.68%。然而單一的特征其代表性也比較單一,在實(shí)際復(fù)雜的應(yīng)用環(huán)境中仍達(dá)不到理想的效果,因此本文方法將多種特征進(jìn)行融合,通過(guò)多種特征的疊加來(lái)加強(qiáng)特征的魯棒性,從而可以應(yīng)對(duì)復(fù)雜多變的應(yīng)用環(huán)境,其實(shí)驗(yàn)結(jié)果如圖2和圖3所示。圖2中,(1)表示HIS_I(15維)+HSV_HV(30維),NormRGB(45維)+OPPO(30維)+RGB(30維);(2)表示OPPO(30維)+LBP(15維);(3)表示OPPO(30維)+HUE(45維);(4)表示OPPO(30維)+HUE(45維)+LBP(15維);(5)表示所有單個(gè)特征表現(xiàn)最好的組合。圖3中,(1)表示HIS_I(45維)+LBP(30維)+NormRGB(45維)+HUE(45維);(2)表示LBP(30維),NormRGB(15維)+RG(30維);(3)表示LBP(30維)+NormRGB(45-d)+RG(45維)+OPPO(15維);(4)表示LBP(30維)+RG(30維);(5)表示LBP(30維)+RG(45維)+OPPO(45維);(6)表示RG(45維)+OPPO(15維)+RGB(30維);(7)表示RG(45維)+OPPO(15維)+RGB(30維)+LBP(30維);(8)表示所有單個(gè)特征表現(xiàn)最好的組合。
實(shí)驗(yàn)結(jié)果證明,其組合后的特征性能平均高于任何一個(gè)單一特征,達(dá)到了預(yù)期效果。在干擾區(qū)域排除階段,特征組合(2)(30維的Opponent顏色直方圖串聯(lián)15維的LBP紋理特征)表現(xiàn)最為突出,AUC達(dá)到99.50%。在病灶區(qū)域識(shí)別階段,特征組合(5)(30維LBP紋理特征串聯(lián)45維的RG和45維的Opponent顏色特征)表現(xiàn)出色,AUC達(dá)到93.34%。本方法最終采用以上兩種最優(yōu)特征組合方式,為后續(xù)的去除干擾和病灶識(shí)別工作奠定了基礎(chǔ)。
1.3 分類器設(shè)計(jì)
Adaboost衍生于Boosting算法,自從Schapire提出以來(lái)得到了廣泛的應(yīng)用。Adaboost屬于一種迭代算法,其核心思想是將多個(gè)弱分類器組合成一個(gè)強(qiáng)分類器。本文選取決策樹(shù)作為子分類器,為避免過(guò)度學(xué)習(xí)的情況發(fā)生,本文將樹(shù)的深度設(shè)置為2。其次需要確定算法迭代的次數(shù),綜合考慮算法的識(shí)別率及分類器的訓(xùn)練時(shí)間,最終確定迭代次數(shù)為60最為合適。
為減少胃鏡圖像中噪聲對(duì)檢測(cè)結(jié)果的影響,本文方法將兩個(gè)Adaboost分類器串聯(lián)起來(lái),形成一個(gè)三分類器,通過(guò)此分類器,待檢測(cè)區(qū)域?qū)⒈蛔R(shí)別為正常區(qū)域、干擾區(qū)域或病灶區(qū)域3類。其工作流程如圖4所示。
2 方法實(shí)現(xiàn)
首先,采用超像素的思想將圖像分割成像素相對(duì)緊湊一致的區(qū)域;其次,通過(guò)實(shí)驗(yàn)分別找出適用于干擾區(qū)域和病灶區(qū)域的特征的組合;最后,采用二級(jí)分類器完成干擾區(qū)域的去除以及病灶區(qū)域的識(shí)別工作。本文方法的整個(gè)流程下。
算法:
?。?)設(shè)置期望的分割塊數(shù)K及區(qū)域的矩形度m。
?。?)在邊長(zhǎng)為S的區(qū)域內(nèi)隨機(jī)初始化起始聚集中心CK=[lk,ak,bk,xk,yk]T。
(3)采用3×3大小的鄰域?qū)ふ姨荻茸钚〉狞c(diǎn)作為聚集中心點(diǎn)。
(4)repeat
?。?)for對(duì)于每一個(gè)中心點(diǎn)CK do
(6)利用式(2),在中心點(diǎn)周圍2S×2S范圍內(nèi)尋找與中心點(diǎn)最匹配的像素點(diǎn)。
(7)end for
?。?)重新計(jì)算中心點(diǎn)的位置,并計(jì)算新中心點(diǎn)與前中心點(diǎn)位置坐標(biāo)的歐式距離E。
?。?)until E≤threshold
(10)將孤立存在的小區(qū)域強(qiáng)制劃分到相鄰的最大區(qū)域。
?。?1)for每一個(gè)分割后的區(qū)域do
?。?2)if區(qū)域內(nèi)像素個(gè)數(shù)≥N then
(13)提取適合于干擾區(qū)域識(shí)別的特征組合。
(14)利用第一級(jí)分類器進(jìn)行識(shí)別。
?。?5)if該區(qū)域被識(shí)別為干擾區(qū)域then
(16)提取適合于病灶區(qū)域識(shí)別的特征組合。
(17)利用第二級(jí)分類器進(jìn)行識(shí)別。
(18)end if
?。?9)end if
?。?0)end for
3 實(shí)驗(yàn)與結(jié)果分析
3.1實(shí)驗(yàn)設(shè)計(jì)
本實(shí)驗(yàn)的數(shù)據(jù)來(lái)源于120個(gè)臨床病例,共計(jì)3 000張醫(yī)學(xué)胃鏡圖像,其中包含1 500張含有病灶區(qū)域的圖像和1 500張完全健康的圖像。圖像的大小為489像素×409像素,存儲(chǔ)格式為JPEG。每一幅含有病灶區(qū)域的圖像都配有專業(yè)醫(yī)師標(biāo)注的標(biāo)注圖,在實(shí)驗(yàn)中作為地面真值。
在實(shí)驗(yàn)中,規(guī)定對(duì)于完全健康的圖像,只要有一個(gè)區(qū)域被識(shí)別為病灶區(qū)域,則認(rèn)為檢測(cè)失敗;反之,則認(rèn)為檢測(cè)成功。對(duì)于含有病灶區(qū)域的圖像,只要有識(shí)別為病灶的區(qū)域與醫(yī)生標(biāo)注區(qū)域有重疊,則認(rèn)為檢測(cè)成功;否則,認(rèn)為檢測(cè)失敗。
在實(shí)驗(yàn)中,采用4種不同的方法對(duì)相同一批圖像進(jìn)行檢測(cè),用來(lái)進(jìn)行檢測(cè)效果的分析對(duì)比。方法1,SLIC分割+組合特征+二級(jí)串聯(lián)分類器;方法2,SLIC分割+組合特征+單級(jí)分類器;方法3:按30×30矩形分割圖像+組合特征+二級(jí)串聯(lián)分類器;方法4:按30×30矩形分割圖像+組合特征+單級(jí)分類器。
3.2 實(shí)驗(yàn)結(jié)果與分析
本文采用ROC曲線對(duì)實(shí)驗(yàn)進(jìn)行分析。ROC曲線將靈敏度與特異性以圖示方法結(jié)合在一起,可以準(zhǔn)確反映分析方法中特異性和敏感性的關(guān)系,是試驗(yàn)準(zhǔn)確性的綜合代表。在ROC曲線圖表中,X軸表示假陽(yáng)性率FPR(False Positive Rate),Y軸表示真陽(yáng)性率TPR(True Positive Rate)。ROC曲線展示了當(dāng)評(píng)判標(biāo)準(zhǔn)變化時(shí)這兩個(gè)變量之間的相互關(guān)系。ROC曲線下方的面積可以用來(lái)評(píng)判一個(gè)系統(tǒng)性能的好壞[5]。
實(shí)驗(yàn)結(jié)果如圖5所示,本文所提出的方法(方法1)的檢測(cè)效果遠(yuǎn)好于其他方法,其正確率遠(yuǎn)好于其他3種方法,正確率(AUC)達(dá)到91.588%。方法2、方法3和方法4的正確率(AUC)分別為86.058%、76.458%和70.727%。
部分實(shí)驗(yàn)效果如圖6所示,其中第1排為含有病灶區(qū)域的胃鏡圖像;第2排為臨床醫(yī)師給出的地面真值圖;第3排為本文方法檢測(cè)后的結(jié)果圖。
醫(yī)療器械的限制以及胃部特殊生理環(huán)境的影響,使得有些病灶區(qū)域很難用肉眼識(shí)別??紤]到胃鏡圖像的成像質(zhì)量受多方面因素的影響,圖像噪聲多的特點(diǎn),本文方法在預(yù)處理階段采用SLIC分割算法,將圖像分割成大小均勻的超像素,相較于簡(jiǎn)單的人工劃分區(qū)域,具有區(qū)域內(nèi)像素更加統(tǒng)一和緊湊的特點(diǎn)。此外,本文方法還采用了多種特征組合的形式替代了單一特征。最后通過(guò)使用二級(jí)串聯(lián)分類器將去干擾和病灶檢測(cè)步驟串聯(lián)進(jìn)行。實(shí)驗(yàn)表明,本文方法的病灶檢測(cè)正確率優(yōu)于傳統(tǒng)方法。
參考文獻(xiàn)
[1] Liang Pan, Cong Yang, Guan Mo. A computer-aided lesion diagnose method based on gastroscope image[C]. 2012 IEEE International Conference on Information and Automation, ICIA 2012, Washington, DC. IEEE Computer Society, 2012: 871-875.
[2] SZCZYPINSKI P, KLEPACZKO A, PAZUREK M, et al. Texture and color based image segmentation and pathology detection in capsule endoscopy videos[J]. Computer Methods and Programs in Biomedicine, 2014,13(1):396-411.
[3] LI B, MENG M Q H. Tumor CE image classification using SVM-based feature selection[C]. Intelligent Robots and Systems (IROS), 2010: 1322-1327.
[4] ACHANTA R, SHAJI A, SMITH K, et al. Slic superpixels[J]. Ecole Polytechnique Federal de Lausssanne(EPFL), Technical Report, 2010: 149300.
[5] SWETS J A, DAWES R M, MONAHAN J. Psychological science can improve diagnostic decisions[J]. Psychological Science in the Public Interest, 2000, 1(1): 1-26.