文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.190314
中文引用格式: 聶雄,陳華,伍思霖. 基于灰度共生矩陣和BP神經(jīng)網(wǎng)絡(luò)的乳腺腫瘤識別[J].電子技術(shù)應(yīng)用,2019,45(7):97-101,116.
英文引用格式: Nie Xiong,Chen Hua,Wu Silin. Recognition of breast tumor based on gray level co-occurrence matrix and BP neural network[J]. Application of Electronic Technique,2019,45(7):97-101,116.
0 引言
乳腺腫瘤是女性病發(fā)率極高的一種腫瘤疾病,但也是一種可以通過早期確診,提早治療,從而降低病死率的一種疾病。現(xiàn)有乳腺檢查運用的手段是以鉬靶、超聲為主,其識別率普遍低于75%,這種檢查方法都有自己的局部優(yōu)勢,但也受到了一定局限[1-4],如:鉬靶對鈣化敏感,但對東方女性的腺體型乳腺層次分辨不夠,有射線,屬有創(chuàng)檢查,不宜做體檢篩查使用。超聲對囊性和實性的占位反映敏感,但對醫(yī)生技術(shù)水平要求較高,檢查速度較慢,不宜大規(guī)模體檢篩查使用。核磁共振(MRI)檢查方式雖然準(zhǔn)確度可以達(dá)到90%以上[5],但其成本高,設(shè)備復(fù)雜,農(nóng)村醫(yī)院及一些小型醫(yī)院沒有配備。近年來,基于紅外圖像的乳腺腫瘤診斷逐漸成為學(xué)者研究的熱點[6-8]。
本文提出基于紅外成像技術(shù),通過灰度共生矩陣提取乳腺等灰度曲線圖像的紋理特征,通過BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類,實現(xiàn)乳腺腫瘤計算機診斷識別的算法。具體過程為:首先通過紅外乳腺透像儀獲取乳腺紅外圖像,然后將乳腺圖像均勻分塊,并劃分為病變區(qū)域和正常區(qū)域,通過分析不同的紋理特征,并找出能有效區(qū)分出病變區(qū)域和正常區(qū)域的特征值,統(tǒng)計好數(shù)據(jù)作為樣本數(shù)據(jù),然后通過將訓(xùn)練樣本數(shù)據(jù)導(dǎo)入BP神經(jīng)網(wǎng)絡(luò)之中進(jìn)行訓(xùn)練,使該BP神經(jīng)網(wǎng)絡(luò)具有組織分類的功能,能有效地將病變區(qū)域識別出來。
1 乳腺圖像預(yù)處理
乳腺紅外圖像的預(yù)處理包括圖像平滑、等灰度曲線處理、圖像增強等操作。
1.1 高斯平滑
高斯濾波是對圖像進(jìn)行去噪處理的有效方法。從圖1中可以看出,經(jīng)過高斯平滑處理后的乳腺圖像,明顯較之前柔和,沒有明顯的噪點,突出圖像的邊緣效果,消除噪聲的干擾影響。
1.2 灰度曲線處理
由于乳腺腫瘤組織呈浸潤性生長,在發(fā)生病變的乳腺中,腫瘤以及周邊血管的紋理包絡(luò)都會呈現(xiàn)不規(guī)則的狀態(tài),并反映了病變區(qū)的邊緣特征。為了突出病變區(qū)域的包絡(luò)紋理特征,需將近紅外圖像轉(zhuǎn)化為等灰度曲線圖像,這一轉(zhuǎn)變可以通過Sobel算子與圖像的每一個點進(jìn)行卷積實現(xiàn)[8-10]。
Sobel算子包括兩組3×3的矩陣,A1表示垂直,A2表示水平。將它和原圖像作平面卷積,即可分別得出垂直及水平的亮度差分近似值。
圖2(b)是利用上述方法將近紅外乳腺圖像轉(zhuǎn)化而成的等灰度曲線圖像,可以看出病變區(qū)域灰度曲線包絡(luò)紋理不均勻,為病變部位。
1.3 圖像增強
在圖像處理中,為了突出目標(biāo)區(qū)域,需要對圖像進(jìn)行圖像增強。直方圖均衡化是圖像處理領(lǐng)域中利用圖像直方圖對對比度進(jìn)行調(diào)整的方法。這種方法通常用來增加許多圖像的局部對比度,尤其是當(dāng)圖像的有用數(shù)據(jù)的對比度相當(dāng)接近的時候。通過這種方法,亮度可以更好地在直方圖上分布。
由于乳房邊緣區(qū)域的包絡(luò)紋理會對實驗造成誤判的影響,在此只截取乳腺圖像較為中心的區(qū)域作為研究。圖像增強處理如圖3所示。
經(jīng)過圖像增強后的等灰度曲線圖像紋理更加清晰明顯,病變區(qū)域的邊緣包絡(luò)紋理也更為突出。
2 建立灰度共生矩陣提取紋理特征
2.1 建立灰度共生矩陣原理
紋理是組成圖像的色調(diào)基元空間匯總相互作用的一種依賴于尺度效應(yīng)的現(xiàn)象,它反映了圖像灰度值分布的某種規(guī)律?;叶裙采仃?CLCM)因為其簡單有效的優(yōu)點被廣泛應(yīng)用于紋理特征提取研究[11-13]。本文中選取了能量、對比度、相關(guān)性、熵、逆差距共5個參數(shù)作為乳腺圖像的特征值[11]。
2.2 灰度級量化
由于灰度共生矩陣反映了兩個不同位置的像素的聯(lián)合概率分布,當(dāng)原圖像灰度級為0~255時,灰度共生矩陣的大小為256×256,計算時間比較長,實際應(yīng)用中,將圖像灰度等級降為16級,對應(yīng)灰度共生矩陣的灰度級設(shè)為16,并對等灰度曲線圖像進(jìn)行直方圖均衡化處理。
2.3 提取特征數(shù)據(jù)
在對乳腺腫瘤樣本圖像提取紋理特征之后,得到了關(guān)于能量、對比度、相關(guān)性、熵、逆差距這5個特征值的大量數(shù)據(jù),對這些數(shù)據(jù)進(jìn)行分析,研究它們的變化趨勢。以圖4病變?nèi)橄賵D像為例進(jìn)行特征提取。
圖4的圖像中分割為16個圖像子塊,并按從左到右、從上到下順序命名為m1~m16。利用文獻(xiàn)[11]的式(3-6)~式(3-8)以及式(3-10)、式(3-12)計算出每個圖像子塊對應(yīng)的能量、對比度、相關(guān)性、熵、逆差距5個特征值的均值(如表1所示)和特征值的標(biāo)準(zhǔn)差(如表2所示)。類別有2個取值,其中1表示正常區(qū)域,2表示病變區(qū)域。
2.4 特征值數(shù)據(jù)分析
通過以上數(shù)據(jù)可以觀察到:病變區(qū)域的能量值均值總體偏小,標(biāo)準(zhǔn)差總體偏小,反映的是病變區(qū)域灰度共生矩陣元素不集中,紋理較粗;病變區(qū)域的熵均值總體偏大,標(biāo)準(zhǔn)差總體偏小,反映的是病變區(qū)域灰度共生矩陣元素分散分布;病變區(qū)域的對比度均值總體偏小,標(biāo)準(zhǔn)差總體偏小,反映的是病變區(qū)域效果模糊,灰度差??;病變區(qū)域的相關(guān)性均值總體偏大,標(biāo)準(zhǔn)差總體偏小,反映的是病變區(qū)域灰度共生矩陣元素值相差大;病變區(qū)域的逆差矩均值總體偏小,標(biāo)準(zhǔn)差總體偏小,反映的是病變區(qū)域變化多,局部不均勻。
上述規(guī)律表明灰度共生矩陣提取出的紋理特征值可以作為區(qū)分乳腺病變區(qū)域和正常區(qū)域的依據(jù)。
3 建立BP神經(jīng)網(wǎng)絡(luò)
3.1 BP神經(jīng)網(wǎng)絡(luò)
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò)。圖5為BP神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)圖。
一般BP神經(jīng)網(wǎng)絡(luò)會抽取具有某種變化規(guī)律的樣本特征參數(shù),通過樣本訓(xùn)練建立對樣本的記憶信息,然后將未知樣本作為BP神經(jīng)網(wǎng)絡(luò)的輸出,通過BP神經(jīng)網(wǎng)絡(luò)識別該樣本所屬類別[14-17]。
通過不斷調(diào)整權(quán)值和閾值,可以使BP神經(jīng)網(wǎng)絡(luò)越來越逼近理想模型。
3.2 確定BP神經(jīng)網(wǎng)絡(luò)參數(shù)
BP神經(jīng)網(wǎng)絡(luò)的輸入層個數(shù)由樣本數(shù)據(jù)種類確定,輸出層個數(shù)由分類的個數(shù)確定。紅外乳腺腫瘤BP神經(jīng)網(wǎng)絡(luò)采用了能量、對比度、相關(guān)性、熵、逆差距這5個特征值4個方向的平均值和方差作為輸入,其輸入層節(jié)點數(shù)應(yīng)該為10個;輸出層節(jié)點數(shù)確定為2個:病變區(qū)域、正常區(qū)域。隱藏層節(jié)點數(shù),則由試湊法得出。最終確定的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖6所示。
3.3 BP神經(jīng)網(wǎng)絡(luò)的創(chuàng)建
在提取了等灰度曲線圖像的5個特征值后,就可以創(chuàng)建BP神經(jīng)網(wǎng)絡(luò)。圖7為BP神經(jīng)網(wǎng)絡(luò)算法流程示意圖。
本文建立的BP神經(jīng)網(wǎng)絡(luò)是一個10輸入、2輸出的神經(jīng)網(wǎng)絡(luò),其中輸出1表示該區(qū)域為正常區(qū)域或干擾區(qū)域,輸出2表示該區(qū)域為病變區(qū)域。根據(jù)訓(xùn)練樣本數(shù)據(jù)和訓(xùn)練樣本輸出送入BP神經(jīng)網(wǎng)絡(luò)中訓(xùn)練,不斷地調(diào)整輸入層和隱藏層之間的權(quán)值,隱藏層和輸出層之間的閾值,使BP神經(jīng)網(wǎng)絡(luò)的模型不斷逼近最優(yōu)解。
3.4 BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
在MATLAB中,神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練的步驟為:
(1)設(shè)置生成的網(wǎng)絡(luò)對象;
(2)調(diào)用train函數(shù)對網(wǎng)絡(luò)進(jìn)行訓(xùn)練:
①從訓(xùn)練集中取出訓(xùn)練樣本,將數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)中;
②通過各節(jié)點的連接情況正向逐層處理后,得到神經(jīng)網(wǎng)絡(luò)的實際輸出;
③計算網(wǎng)絡(luò)實際輸出與期望輸出的誤差;
④將誤差逐層反向回傳至之前各層,并按一定原則將誤差信號加載到連接權(quán)上,使整個神經(jīng)網(wǎng)絡(luò)的連接權(quán)值向誤差減少的方向轉(zhuǎn)化;
⑤對訓(xùn)練集中每一個輸入輸出樣本對重復(fù)以上步驟,直到整個訓(xùn)練集的誤差減小到符合要求位置。
3.5 BP神經(jīng)網(wǎng)絡(luò)的測試
在完成BP網(wǎng)絡(luò)訓(xùn)練之后,將待測圖片的紋理特征數(shù)據(jù)以矩陣形式讀入MATLAB中,BP神經(jīng)網(wǎng)絡(luò)就能根據(jù)訓(xùn)練好的映射關(guān)系給出每一個子塊相應(yīng)的輸出,輸出1為正常區(qū)域,輸出2為病變區(qū)域,具體流程如圖8所示。
由于每一個BP神經(jīng)網(wǎng)絡(luò)都要結(jié)合自身的實際,特別是輸入層和輸出層,輸入層的個數(shù)主要是由特征值的個數(shù)決定的,輸出層個數(shù)則由需要分類的個數(shù)決定。將等灰度曲線圖像中提取出來的5個紋理特征值的均值以及標(biāo)準(zhǔn)差作為輸入,輸出則定義了一個輸出層,如果輸出為1,則為正常區(qū)域;輸出如果為2,則為病變區(qū)域。
4 實驗結(jié)果與分析
4.1 實驗方案
假設(shè)Cn為訓(xùn)練樣本正常圖片數(shù),Cc為訓(xùn)練樣本腫瘤圖片數(shù),Tn為測試樣本正常圖片數(shù),Tc為測試樣本腫瘤圖片數(shù)。實驗步驟如下:
(1)準(zhǔn)備200張乳腺紅外圖像作為實驗樣本圖像,其中正常乳腺的紅外圖像為100張,患者乳腺的紅外圖像為100張,實驗時,根據(jù)需要將所有圖像按不同比例分為訓(xùn)練樣本集和測試樣本集,如表3所示,每種樣本比例重復(fù)訓(xùn)練和測試20次。
(2)對樣本圖像進(jìn)行分塊,并分別提取其對應(yīng)的能量、對比度、相關(guān)性、熵、逆差距5個特征值的均值和特征值的標(biāo)準(zhǔn)差,保存為特征數(shù)據(jù)庫文件,并對每個分塊的類別進(jìn)行標(biāo)注,正常塊(區(qū)域)標(biāo)注為1,病變塊(區(qū)域)標(biāo)注為2。
(3)抽取不同比例的圖像對應(yīng)的特征數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù)集,導(dǎo)入到已經(jīng)創(chuàng)建好的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
(4)除測試樣本集以外的其他圖像作為測試樣本,將測試樣本集對應(yīng)的特征數(shù)據(jù)導(dǎo)入到經(jīng)過訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行測試。
(5)記錄BP神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果,每種樣本比例重復(fù)測試30次,實驗結(jié)果如圖9所示,不同訓(xùn)練樣本比例條件下的平均識別率記錄在表3中。
4.2 結(jié)果分析
從圖9和表3的數(shù)據(jù)分析,不同樣本比例條件下,乳腺腫瘤的正確識別率有所差別,其中第4、5、6組對應(yīng)的樣本比例訓(xùn)練效果較好,識別率可達(dá)80%以上。本方法具有成本低、便攜的特點。
5 結(jié)論
實驗結(jié)果表明,本文所采用的灰度共生矩陣結(jié)合BP神經(jīng)網(wǎng)絡(luò)的乳腺腫瘤圖像識別方法對乳腺腫瘤病變區(qū)域具有較為良好的識別效果,可提高乳腺腫瘤早期的診斷率。
參考文獻(xiàn)
[1] 陳麗君,黃崇權(quán).不同影像學(xué)方法對乳腺癌診斷價值的比較[J].中國婦幼健康研究,2018,29(8):1031-1035.
[2] 杜睿,薛玉.超聲造影及彈性成像技術(shù)在乳腺腫瘤診斷的現(xiàn)狀與進(jìn)展[J].醫(yī)學(xué)研究生學(xué)報,2013,26(4):435-437.
[3] Wang Cong,Yang Guang,Wang Hui.Diagnostic accuracy of real-time tissue elastography for breast cancer:a metaanalysis[J].Oncology and Translational Medicine,2016,2(1):21-25.
[4] 林其忠,余建國,趙暖,等.乳腺腫瘤超聲圖像的特征分析[J].儀器儀表學(xué)報,2006(S1):744-746,752.
[5] 鄭樺,符孔.MRI擴散峰度成像對乳腺病變性質(zhì)的鑒別診斷[J].青島大學(xué)學(xué)報(醫(yī)學(xué)版),2018,54(6):652-655.
[6] 薛雯,楊柳茵,范麗,等.超微血管成像技術(shù)鑒別乳腺良惡性病變[J].中國醫(yī)學(xué)影像技術(shù),2019,35(1):77-81.
[7] 朱曉娟,趙華,徐祎,等.乳腺纖維瘤病臨床病理分析[J].臨床與實驗病理學(xué)雜志,2019(1):93-95.
[8] 王亞麗,王金星,陳龍舟,等.三算子及血氧功能成像系統(tǒng)在乳腺癌診斷中的應(yīng)用[J].中國微創(chuàng)外科雜志,2014(5):417-419.
[9] 胡徐怡,王超,厲丹.基于改進(jìn)Sobel算子的邊緣檢測算法研究[J].福建電腦,2018,34(9):13-15.
[10] 凌軍,宋啟祥,房愛東,等.基于局部熵的邊緣檢測算子選擇算法[J].南京理工大學(xué)學(xué)報,2018,42(4):424-429.
[11] 謝菲.圖像紋理特征的提取和圖像分類系統(tǒng)研究及實現(xiàn)[D].成都:電子科技大學(xué),2009.
[12] 汪友明,張菡玫,湯少杰.數(shù)字乳腺層析圖像紋理特征聯(lián)合提取與識別[J].西安郵電大學(xué)學(xué)報,2018,23(3):65-68.
[13] 焦蓬蓬,郭依正.灰度共生矩陣紋理特征提取的Matlab實現(xiàn)[J].計算機技術(shù)與發(fā)展,2012,22(11):169-171,175.
[14] 趙景波,趙德安,蔣春彬.基于神經(jīng)網(wǎng)絡(luò)的電子鼻肺癌早期診斷系統(tǒng)[J].電子技術(shù)應(yīng)用,2006,32(7):8-10.
[15] 劉標(biāo),周曉軍.解讀2012年WHO乳腺腫瘤分類[J].臨床與實驗病理學(xué)雜志,2012,28(11):1185-1187.
[16] 周進(jìn)凡,張榮芬,馬治楠,等.基于深度學(xué)習(xí)的胸部X光影像分析系統(tǒng)[J].電子技術(shù)應(yīng)用,2018,44(11):29-32.
[17] 王波,杜曉昕,金梅.LVQ神經(jīng)網(wǎng)絡(luò)在乳腺腫瘤診斷中的應(yīng)用[J].計算機仿真,2012,29(8):171-174.
作者信息:
聶 雄1,2,陳 華1,2,伍思霖1
(1.廣西大學(xué) 計算機與電子信息學(xué)院,廣西 南寧530004;2.廣西多媒體通信與網(wǎng)絡(luò)技術(shù)重點實驗室,廣西 南寧530004)