《電子技術應用》
欢迎订阅(电子2025)
欢迎订阅(网数2025)
您所在的位置:首頁 > 其他 > 業(yè)界動態(tài) > 基于細胞神經(jīng)網(wǎng)絡的生物芯片圖像實時處理
NI-LabVIEW 2025

基于細胞神經(jīng)網(wǎng)絡的生物芯片圖像實時處理

2008-12-10
作者:律睿慜1,2,楊 勇1,2,王淑

??? 摘?? 要: 運用CNN設計了一套生物芯片樣點識別算法。算法實現(xiàn)的目標:改善已有方法的缺陷,達到良好的圖像質(zhì)量增強效果;將CNN輸出的模擬信號圖像轉(zhuǎn)化為樣點數(shù)據(jù)信息,使得后續(xù)的信息分析成為可能。最后利用實際CNN芯片參數(shù)估算了整套算法的運算時間,結果顯示其速度達到實時處理" title="實時處理">實時處理的標準。?

??? 關鍵詞: 生物芯片; 微陣列芯片; 樣點識別; 細胞神經(jīng)網(wǎng)絡

?

??? 生物芯片又稱為微陣列芯片,是近年來生命科學領域迅速發(fā)展起來的一項高新技術。生物芯片是在面積不大的基片上點陣排列一系列可尋址的生物識別分子,這些陣列點稱為探針。探針在相同的條件下與各種待測定的靶分子同時進行結合或反應,各個探針的反應程度各不相同,反應結果用同位素法、化學熒光法、化學發(fā)光法或酶標法顯示,用精密掃描儀記錄為灰度圖像形式。然后,對這些灰度圖像進行分析處理,提取出各個樣點的強度值,并結合數(shù)據(jù)庫關于芯片探針排列形式以及各個探針代表的生物識別分子的描述,確定試驗結果。?

??? 圖2(e)是一幅典型的生物芯片樣點圖像(局部),各個樣點的灰度值代表了對應探針的反應程度,對其進行圖像處理" title="圖像處理">圖像處理的目標是提取各個樣點的強度值。一般做法就是將樣點與背景分離,并依據(jù)樣點中所有像素的灰度值計算樣點強度。?

??? 近年來出現(xiàn)了多種樣點自動識別算法,這些算法的速度都受限于微處理器本身的計算能力,對于數(shù)據(jù)量極大的生物芯片樣點圖像,運算速度" title="運算速度">運算速度始終沒有質(zhì)的突破。?

??? 新型探測技術的出現(xiàn)大大提高了樣點圖像的獲取速度,這使得生物芯片信息實時分析成為可能。為了適應這一趨勢,P.arena等學者提出了運用細胞神經(jīng)網(wǎng)絡" title="細胞神經(jīng)網(wǎng)絡">細胞神經(jīng)網(wǎng)絡的生物芯片圖像處理方法[1],實現(xiàn)了實時生物芯片圖像處理,但其算法不完善,不便于實時信息分析。Shadrokh Samavi等學者提出了一系列硬件結構用于生物芯片實時處理[2],也達到了很高的速度。但是其每一步驟的電路結構都不同,完成任何運算都需要設計相應的電路,導致其通用性比較差。Md.Maruf Monward等學者通過MPI(Message Passing Interfacing) 技術[3],運用多個微處理器并行運算以提高運算速度,但其實質(zhì)上沒有改變傳統(tǒng)的算法,而且若要達到實時處理速度則需要采用很多微處理器,設備的體積將變得龐大且成本很高。?

??? 經(jīng)過比較與分析,認為基于細胞神經(jīng)網(wǎng)絡的方法是最有前景的。細胞神經(jīng)網(wǎng)絡CNN(Cellular Neural Networks)是1988年由蔡少堂和楊林提出的一種神經(jīng)網(wǎng)絡模型[4-5],其結構相比其他神經(jīng)網(wǎng)絡模型更容易制作成為大規(guī)模集成電路,現(xiàn)在已經(jīng)有了成熟的商用硬件,如CNNUM(CNN Universal Machine),并且隨著集成電路技術的進步,CNN芯片的運算速度也在不斷提高。CNN用于圖像處理時,由于其并行處理的方式,速度遠高于基于微處理器的算法。因此,CNN自誕生以來便得到了廣泛的研究,各種改進模型以及新算法層出不窮。參考文獻[1]將各種CNN基本運算巧妙組合用于生物芯片信息提取,但其算法只能應對噪聲、污染等少數(shù)幾種圖像缺陷,識別錯誤率較大,對不同規(guī)格的樣點圖像適應性也較差,并且最終的強度分析算法輸出的是CNN格式的模擬信號圖像,沒有將樣點強度信息作為數(shù)據(jù)輸出,無法再進一步進行數(shù)據(jù)分析。?

??? 本文首先對參考文獻[1]的算法進行改進,以提高識別的正確率,然后設計算法將CNN輸出的模擬圖像結果轉(zhuǎn)化為樣點強度數(shù)據(jù)。?

1 CNN模型簡介?

??? 圖1(a)是典型的CNN結構,圖中只顯示了4×4大小的區(qū)域,圖中的每個方框表示CNN的一個基本單元,稱為細胞(cell),每個細胞都有其輸入u、狀態(tài)x以及輸出y,y與x具有某種函數(shù)關系y=g(x),每個細胞與鄰近的細胞連接。CNN自從提出以來,已經(jīng)出現(xiàn)了多種改進形式,其動力學機制也有多種表述方式,根據(jù)最初提出CNN的參考文獻[4]、[5]以及本文算法采用的結構形式,可以把CNN的動力學方程總結如下:?

?????

式中,x、u、y分別表示細胞的狀態(tài)、輸入和輸出,下標α、β表示細胞在CNN網(wǎng)絡中的坐標,C、I為常值,坐標β涵蓋以α為中心、r為半徑的鄰域Nα(r)內(nèi)的所有細胞,它們的輸入uβ與輸出yβ通過連接權值Aαβ、Bαβ作用于坐標α的細胞,影響細胞α的狀態(tài)變化率

?

?

??? 如圖1(b)所示,將待處理圖像轉(zhuǎn)化為一組初始輸入u和狀態(tài)x的數(shù)據(jù),輸入CNN網(wǎng)絡,每個細胞都通過式(1)不斷迭代運算,最終網(wǎng)絡將收斂到某一狀態(tài),得到輸出圖像y。一組A、B、I便決定了這一收斂過程,稱為模板。模板運算便是CNN基本運算,將各種模板作為序列使用,便構建為功能復雜的CNN算法。?

2 基于CNN的樣點識別算法?

2.1圖像預處理" title="圖像預處理">圖像預處理算法設計?

??? 本文根據(jù)常見的生物芯片樣點圖像特點以及CNN的特性,集中考慮了如何解決以下問題:(1)未知的噪聲。(2)樣點內(nèi)部灰度不均勻。(3)不規(guī)則樣點形狀。(4)不可靠的樣點(包括過大的樣點和過小的樣點)。據(jù)此設計了如圖2所示的流程進行圖像預處理。首先對原圖像進行優(yōu)化,去除噪聲以及平滑樣點內(nèi)部灰度;然后制作一幅蒙板圖。蒙板圖是一幅二值圖像,將其作用于某圖像時,蒙板圖中黑色區(qū)域?qū)膱D像的像素將不發(fā)生改變。運用蒙板圖像可以將已優(yōu)化圖像中需要的樣點提取出來,并將其余部分填充為黑色。這套算法較好地解決了以上提及的四個問題。算法使用CSL CNN Software Library中提供的模板[6]。圖2所示的流程圖中,(a)為算法的整體步驟,(b)、(c)、(d)分別表示算法的模板運算系列,矩形框表示模板,平行四邊形表示各個步驟獲得的圖像,并且按其出現(xiàn)順序編號(如1,2……18,編號包括圖3中的);(e)為算法步驟中生成及使用的關鍵圖像,每幅圖的編號為對應算法框圖中平等四邊形框。?

?

?

??? 如圖2中(h)8是由生物芯片規(guī)格信息預先定義的一幅陣列網(wǎng)格圖像。蒙板圖像(i)12中黑色區(qū)域指定了需要去除的部分,將去除噪聲后的圖像(f)4中對應于這些區(qū)域的部分通過filblack模板運算填充為黑色,便完成了如圖2中(j)13所表示的圖像的預處理。?

2.2 樣點強度信息提取算法設計?

??? 對生物芯片樣點圖像進行分析,最終必須將樣點的強度作為數(shù)據(jù)輸出。采用CNN進行圖像預處理,可以達到極高的速度,但是其輸出結果卻是模擬信號。參考文獻[1]的方法雖然能夠進行樣點強度分析,但是最終輸出的是幾幅圖像,沒有轉(zhuǎn)化為樣點強度信息數(shù)據(jù),無法進行信息分析。若要將樣點強度信息提取出來,還需要對CNN輸出的圖像進行模數(shù)轉(zhuǎn)換后輸入微處理器,然后運用微處理器計算出各個樣點的強度值。但是基于微處理器的圖像處理算法速度相比CNN要慢許多,這將嚴重影響整個系統(tǒng)的處理速度。?

??? 為此,設計了CNN算法,該算法只需要對其輸出圖像的指定像素點作模數(shù)轉(zhuǎn)換即可得到對應樣點的強度信息,避免了用微處理器來計算。其算法流程如圖3(a)所示。?

?

?

??? 算法采用前面步驟生成的13號圖和8號圖作為樣點識別的原始圖像,最終將樣點分為三類:陽性樣點、無效樣點以及陰性樣點,如圖3(b)所示。輸出圖像的特征非常明顯,即各個樣點都轉(zhuǎn)化為一個方格,方格內(nèi)的像素值完全一樣,非黑即白,像素值表示了樣點的強度。因此,只需要對各個方格中心點作模數(shù)轉(zhuǎn)換便可得到整個方格的值。這樣就不需要設計微處理器算法來提取樣點強度值。在實際的試驗中,若最終需要準確的樣點強度值,也可以按類似的思路來擴充算法。例如,需要將樣點按照強弱劃分為8個灰度層次,則可以設定8個閾值分別計算出8幅圖像,每幅圖像表示大于相應閾值的樣點,再輔以邏輯減運算,就能識別出各個強度級對應的樣點。?

3 算法的試驗測試與分析?

3.1與已有算法的對比?

??? 采用同一張圖像分別運用本文提出的圖像預處理算法與參考文獻[1]的算法(算法只取灰度圖像處理部分,并且略去樣點強度分析步驟)來處理,兩種算法中的一些可調(diào)節(jié)的模板參數(shù)都根據(jù)試驗條件以及試驗圖像特點進行最優(yōu)化,試驗結果如圖4所示。?

?

?

??? 由圖4可見,參考文獻[1]的算法將許多有效樣點誤判為噪聲去除,并且算法對樣點形狀的損害較大。通過分析可知,本文的算法主要在以下兩個方面優(yōu)于參考文獻[1]的算法:(1)去除噪聲時,由于采用Median模板預先去除大量隨機噪聲并且最后用D_aniso模板,有效地減少了diffus模板對于樣點形狀的損害;(2)去除過大以及過小樣點時,本文算法采用了可調(diào)節(jié)參數(shù)的模板patchmak,能夠有效避免將有效樣點誤判為噪聲,并且對于不同規(guī)格尺寸的樣點圖像將有更好的適應性。?

??? 參考文獻[1]中的樣點強度分析輸出的是幾幅CNN模擬信號圖像而非數(shù)據(jù)結果,而本文的算法能將預處理的結果轉(zhuǎn)化為數(shù)據(jù),這無疑是實現(xiàn)生物芯片信息實時處理的必要步驟。?

3.2 算法速度估算?

??? 雖然本文算法是在計算機上通過模擬仿真平臺 CNN visual mouse platform進行,沒有用實際芯片實現(xiàn),但是可以通過芯片的參數(shù)來估算運行速度。?

??? ACE4K芯片的胞元陣列數(shù)為64×64,單位運算速度為98M(XPS/cell),灰度圖像的運算分辨率為8bit,二值圖像的運算分辨率為1bit。對于3×3的標準CNN模板,在ACE4K.芯片上所能使用的最大胞元陣列數(shù)為63×63,對圖像每一個像素完成一次處理需進行9次模板運算。本文選用斯坦福公共基因數(shù)據(jù)庫(http://genome-www5.stanford.edu/)中的一幅典型樣點圖像來進行算法速度估算,圖像樣點數(shù)為120×360點,圖像大小為1 916×5 564像素, 由于圖像大于ACE4K的胞元陣列,則需要把圖像分塊處理(需要分解成2 759塊子圖像)。由此,根據(jù)“單次運算時間=[單位運算速度/(運算分辨率×一次處理的模板運算次數(shù)×圖像分解數(shù))]-1”計算,對于整個圖像進行一次灰度圖像運算,需要時間為:?

?????

進行一次二值圖像運算,需要時間為:?

?????

??? 再根據(jù)CNN算法中各個模板運算需要次數(shù),將流程各個步驟的運算時間累加,可以計算出總運算時間為32.5ms(毫秒量級),也即達到了每秒三十幀以上的處理速度。?

??? 運用細胞神經(jīng)網(wǎng)絡進行圖像處理遠遠快于傳統(tǒng)的基于微處理器的圖像處理算法,這為實現(xiàn)生物芯片信息實時處理提供了硬件基礎。本文運用細胞神經(jīng)網(wǎng)絡設計了生物芯片圖像預處理算法,仿真結果顯示本文的算法比已有算法具有更高的識別正確率。本文還首次提出了基于細胞神經(jīng)網(wǎng)絡的樣點強度識別算法,將CNN模擬運算結果轉(zhuǎn)化為數(shù)字信息,使得后續(xù)的信息分析成為可能。通過實際的CNN芯片參數(shù),估算了算法速度,結果顯示整套算法的一次運算時間為毫秒級,達到了實時處理的要求。?

參考文獻?

[1] ARENA P, BUCOLO M, FORTUNA L, et al. Cellular?neural networks for real-time DNA Microarray Analysis[J].IEEE Engineering in Medicine and Biology,?? Mar.2002:?17-25.?

[2] SAMAVI S, KARIMI N. Real-time processing and compression of DNA microarray image[J].IEEE Transactions on??Image Processing, Mar. 2006,15(3):754-766.?

[3] MONWAR M M, REZAEI S. A parallel processing?approach for information extraction from microarray images[J]. IEEE CCECE/CCGEI, 2006:123-126.?

[4] CHUA L O, YANG L. Cellular neural networks:theory[J].IEEE Trans. Circuits Syst. I, 1988,35(10):1257-1272.?

[5] CHUA L O, YANG L. Cellular neural networks: Applications[J]. IEEE Trans. Circuits Syst. I, 1988,35(10):1273-1290.?

[6] ROSKA T, KEK L, NEMES L, et al. CSL CNN software?library(templates and algorithms) Vers. 7.3[M]. Budapest,Hungary, August 1999:1-175.

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。