摘 要: 介紹了多核數(shù)字信號處理器(DSP)相較于傳統(tǒng)處理器的優(yōu)勢、具體應用、解決方案,以及如何滿足便攜式醫(yī)學成像設備在靈活性、可擴展性以及功率效率方面的要求。
關鍵詞: 多核數(shù)字信號處理器;醫(yī)學成像;同質多核DSP,異構多核片上系統(tǒng)GPP
不斷攀高的醫(yī)療費用受到人們前所未有的關注,而醫(yī)學成像處理器技術的發(fā)展給人們帶來一絲希望。特別是對于更為便攜、低功耗、高性價比和高成像質量的醫(yī)學成像系統(tǒng)的需求,多處理引擎(每個引擎專用于其最適合的任務)系統(tǒng)的出現(xiàn)正逢其時。
基于一個硬連線、不可編程處理器或者一個專用圖形處理器的成像系統(tǒng),無法滿足下一代便攜式醫(yī)學成像設備對靈活性、可擴展性以及功率效率的要求。相反,多核數(shù)字信號處理器(DSP),不管是具有DSP內核和通用處理器(GPP)的異構片上系統(tǒng),還是使用多個類似DSP內核的同質片上系統(tǒng),均是一種兩全其美的方法,并能夠克服醫(yī)學成像面臨的諸多挑戰(zhàn)。新興的醫(yī)學成像系統(tǒng)反過來又會產生新的診斷方法和治療方法,最終不斷提高醫(yī)療保健的服務質量。
迎接醫(yī)療保健挑戰(zhàn)
醫(yī)療保健正處于快速發(fā)展之中,而基于多核DSP的成像系統(tǒng)可有效地推動這種發(fā)展。
過去,由于成本和規(guī)模問題,高級醫(yī)療診斷系統(tǒng)的使用大多集中在人口密集的城市地區(qū),因為這些地區(qū)擁有專業(yè)診斷醫(yī)生以及技術人員。而嵌入式處理器技術方面的進展,讓高質量和功能強大的醫(yī)學成像系統(tǒng)變得更加便攜并且具有更高性價比。如果偏遠地區(qū)的小診所里也配有高級醫(yī)學成像設備,當?shù)丶夹g人員可以把診斷圖像傳送給城市醫(yī)療中心,由這些中心的專家給出診斷建議和實時遠程支持,則可直接將醫(yī)療診斷服務帶給偏遠地區(qū)的患者,而不是將生命垂危的患者運送到某個醫(yī)療成像機構。
處理器能力的提高,在醫(yī)療領域引發(fā)了許多討論。在一些情況下,這些問題看似相互矛盾。例如,許多醫(yī)學專家呼吁提高成像質量的同時,又要求減少人體在來自于X光和核成像技術的有害輻射環(huán)境下暴露的時間。過去,只能通過增加輻射或者利用一些侵入性技術才能提高成像質量。
多核DSP成像系統(tǒng)的使用則提供了另一種替代方案。利用多核DSP,一些創(chuàng)新型高效成像增強技術(如邊緣檢測、對比增強、噪聲過濾等)可以輕松地編程至一顆或者多顆DSP內核中,從而在不增加輻射水平甚至幫助降低患者輻射暴露的情況下,提高成像質量。
多核DSP強大的實時處理能力促進了診斷和治療方法的創(chuàng)新。通過多核DSP的簡單編程,可以更快地完成研究實驗,并可開發(fā)和優(yōu)化新的實時成像處理技術。例如,研究人員正在探討如何應用超聲波來無創(chuàng)檢測甲狀腺癌、燒灼創(chuàng)口、殺死小腫瘤。光學相干斷層成像術(OCT)領域正在研究使用光波來進行各種診斷,包括耳部感染檢測和一些更為復雜的診斷(如通過描述眼睛對糖尿病進行早期檢測等)。這些傳統(tǒng)成像技術的新應用,讓其迅速轉向真正的多核DSP產品。
今天的多核DSP通過降低功耗以及使用更小的體積,實現(xiàn)了高水平的系統(tǒng)集成。這就意味著,電路板上的處理器更少、電源更小、冷卻要求更低,并且總系統(tǒng)成本更低。它讓全世界更多的人受益于醫(yī)療保健,手術室、急診室和救護車里可以配置更多的高級醫(yī)療設備,或許在某一天,這些設備甚至會出現(xiàn)在家庭中。
多核的優(yōu)勢
如圖1所示,典型的醫(yī)學成像處理鏈可以分為3個主要階段:圖像獲取、圖像調試和圖像顯示。
同質多核DSP可提供計算密集型應用所需的處理能力,特別在圖像獲取后和圖像顯示前進行的圖像調節(jié)和重建中。異構多核片上系統(tǒng)可分離GPP內核和DSP內核之間的系統(tǒng)管理/用戶互動和圖像顯示準備功能。
圖像獲取
所有5種不同類型的模擬波形(聲音、光線、無線電、X光和核能)都已被用于醫(yī)學成像系統(tǒng)中。成像系統(tǒng)接收模擬波,將其轉換為數(shù)字信號,然后使用一套預定義前端處理參數(shù)和算法,基于事先確定的人體部位對原始數(shù)字數(shù)據(jù)進行解釋。例如,心臟超聲波設備具有一套與心臟和胸腔有關的前端參數(shù),而OB/GYN超聲波設備則使用參數(shù)和算法獲取子宮胎兒的原始數(shù)據(jù)。
一般而言,圖像獲取面臨的挑戰(zhàn)是如何實時管理和處理大量的圖像數(shù)據(jù)。為了滿足這些需求,這一代多核DSP擁有幾個高帶寬I/O選項(與智能DMA引擎一起使用),可以無縫地將來自模擬前端的圖像數(shù)據(jù)存入片上或者片下內存進行處理。共用內存構架允許多顆內核對圖像不同部分進行并行操作,或者對圖像數(shù)據(jù)的相同部分按順序執(zhí)行不同的處理功能。這讓設計團隊可以靈活地搭建系統(tǒng),并讓使用相同圖像獲取系統(tǒng)完成多個成像應用變得更容易。
圖像調節(jié)
獲取圖像數(shù)據(jù)后,必須將之重建為一個或者多個可視圖像。除此之外,成像系統(tǒng)還要對圖像進行增強處理,以提高其清晰度。在以前的醫(yī)學成像系統(tǒng)中,圖像獲取過程的質量是重建圖像質量的一個限制因素。然而現(xiàn)在,高級信號調節(jié)算法可以過濾外來噪聲和其他異常情況,從而增強顯示受檢查的人體組織和其他相關結構,幫助彌補這些局限性。實時完成這些信號調節(jié)算法,是DSP的真正優(yōu)勢所在。
在醫(yī)學成像系統(tǒng)中,圖像重建通常是最大的瓶頸。例如,典型的CT掃描要獲取檢查部位的許多切片圖像,然后提交給系統(tǒng),通過這些切片圖像重建一幅合成圖像。多核DSP通過讓多顆DSP內核并行執(zhí)行圖像重建任務,大大縮短了圖像重建所需的時間,從而打破了這種瓶頸限制。
多核DSP還賦予了系統(tǒng)可擴展性,可以在不影響圖像處理和顯示時間的情況下,將處理任務分配給多顆同類內核,從而或多或少地改進現(xiàn)有圖像增強技術。
除此以外,當出現(xiàn)更新、更先進的成像增強算法時,DSP內核的可編程屬性使其更容易獲得升級,從而讓設備可以在現(xiàn)有硬件平臺通過軟件升級。
圖像顯示
醫(yī)學成像系統(tǒng)的后端處理包括實際用戶圖像報告以及系統(tǒng)所有的操作員界面要求。由一顆GPP內核和DSP內核組成的多核異構處理器可相互協(xié)作,以提供不同功能所需的相應處理能力。圖像在屏幕上顯示之前,DSP內核可實現(xiàn)許多功能,如數(shù)據(jù)添寫、量值估計、日志壓縮、掃描轉換等。
與此同時,GPP內核(如ARM產品)可提供與PC處理器等價的功能,但功耗卻低得多。嵌入式ARM內核的平均功耗小于2 W,而大多數(shù)PC處理器的功耗均大于50 W或60 W。對于功耗和溫度敏感的醫(yī)學成像系統(tǒng)而言,節(jié)能是一個基本要求。GPP內核還可以運行擁有豐富功能的操作系統(tǒng),例如Linux或者Windows CE等,它們構成系統(tǒng)操作員界面的基礎,并讓系統(tǒng)設計人員能夠輕松地開發(fā)出差異化創(chuàng)新功能。
今天的多核DSP都是一些具有豐富功能的片上系統(tǒng),片上已經集成了許多外圍器件。這些外圍器件通常包括以太網接口、存儲器件、高清顯示和其他連接。通過把這些外圍接口的控制芯片集成到一個多核片上系統(tǒng),可以同時減少系統(tǒng)的空間使用和成本。便攜式醫(yī)學成像系統(tǒng)有一些特殊的限制。
顧名思義,便攜式系統(tǒng)體積要小。這樣,實際部件(旋鈕、開關和其他控制裝置)通常受到限制??删幊潭嗪似舷到y(tǒng)允許系統(tǒng)開發(fā)人員使用智能控制進行設計,將操作員從設置大量成像和測量參數(shù)的工作中解脫出來。
例如,心臟診斷時只需進行一次選擇設置,超聲波成像系統(tǒng)便會自動加載參數(shù)、算法和其他處理資源,實現(xiàn)具體的成像應用。系統(tǒng)會捕捉和顯示血流速度和動力的測量結果。這種自動化還讓高級醫(yī)療成像系統(tǒng)可以部署在偏遠的地區(qū)。這些地方的診所里,專家技術人員很少。偏遠診所的技術人員可以利用這種智能系統(tǒng)獲取圖像和檢查結果,然后將其發(fā)送給診斷專家。
多核應用
開發(fā)任何精密、復雜的嵌入式系統(tǒng)(如醫(yī)學成像系統(tǒng)),都會給設計團隊帶來許多挑戰(zhàn)。一般而言,所有嵌入式系統(tǒng)都必須在嚴格控制功耗預算和體積的同時滿足一些關鍵的性能需求。對現(xiàn)貨硬件進行用戶定制(通常不可避免),存在成本限制。由于可視程度有限,硬件和軟件調試及測試常常很困難。
在多核處理器解決方案中資源更多,特別是有一些特殊功能,可以幫助緩解嵌入式系統(tǒng)設計面臨的一些挑戰(zhàn)。但也存在其他一些復雜性,例如內核間的負載平衡、內核間通信和共用資源管理等。德州儀器擁有超過10年的開發(fā)經驗,提供開發(fā)與調試工具和軟件構架,它們可以簡化多核處理器與嵌入式系統(tǒng)的集成,特別是醫(yī)學成像系統(tǒng)。
為了實現(xiàn)最佳性能,設計人員需要謹慎地劃分任務,這樣內核操作可實現(xiàn)對其他內核的最低依賴度。這種處理工作所要求的數(shù)據(jù)應存儲于本地內存中,并以一種全局方式(即所有內核之間)管理共享資源的使用。如果處理得當,使用多核處理器的系統(tǒng)相比使用多個離散處理器的系統(tǒng)將擁有巨大的優(yōu)勢。如數(shù)據(jù)訪問更迅速、單元之間的通信延遲時間更短,及理論開銷最小。
為了促進多核DSP開發(fā),TI擁有幾個多核軟件構架和一套調試與描述工具,如圖2和圖3所示。
為了讓軟件開發(fā)人員能夠集中精力解決其應用中存在的一些重要問題,可使用一種能夠同時提供硬件抽象和常見支持任務(如內核間通信、DMA資源分配、內存管理等)的中間件。必須對這些軟件層進行優(yōu)化,以用于具體硬件平臺,這樣它們便不會阻礙用戶應用。
在圖2所示的簡單軟件構架中,處理器內核編程被實時操作系統(tǒng)抽象化,通常有非常小的內存、一個低延遲任務切換調度程序和高效中斷服務程序。通過原始寄存器讀/寫功能芯片支持庫或者支持標準驅動器接口結構(如開、閉、讀、寫等)的底層驅動器,分兩個層級抽象化外圍器件。該構架中內核間利用TMS320C6472器件的共用內存構架實現(xiàn)快速、可預知通信;DMA資源管理通過軟件庫實現(xiàn)。這些服務對用戶應用有效。
多核調試的一些重要需求包括所有內核間代碼執(zhí)行的系統(tǒng)級瀏覽;所有內存的相關可視性(共用和內核專用都包括在內);可在對一顆內核進行代碼調試時,保持其余內核繼續(xù)正常運行。當對應用進行優(yōu)化時,需要理解內核的平均和峰值負載,知道數(shù)據(jù)傳輸瓶頸或者系統(tǒng)死鎖,并捕獲事件或者I/O事務的時間戳統(tǒng)計。這些多核調試和系統(tǒng)執(zhí)行描述功能在TI的Code Composer StudioTM開發(fā)工具和數(shù)據(jù)分析可視化工具中獲得較好的支持。
多核DSP解決方案
十多年以來,多核DSP已經在各行各業(yè)的各種應用中證明了它的價值。從無線基站到語音網關,多核同質DSP都是理想的選擇,它可滿足計算密集型信號處理要求,并且功耗預算更低、物理體積更小。
在一些應用中,有些任務的處理需求存在本質的不同,對處理能力的要求也不一樣,而異構多核處理器讓這種應用的實現(xiàn)成為可能。
這種方法并非提供解決現(xiàn)今嵌入式系統(tǒng)各種復雜信號處理需求的通用型辦法,但是它為廣大醫(yī)學成像系統(tǒng)設計人員提供了眾多業(yè)內最佳屬性的組合:低功耗、可預知實時信號與數(shù)據(jù)處理、降低系統(tǒng)尺寸和成本的高集成度以及縮短產品開發(fā)時間的可編程能力。
通過提供完整的信號鏈,TI正讓醫(yī)學成像開發(fā)變得簡單和低成本。欲了解更多詳情并觀看TI醫(yī)學成像資源,請訪問www.ti.com/medicalimaging。