1、引言
近年來,導航領域?qū)Ω咝阅苓\算及信號處理的要求越來越高。對目前大多數(shù)基于VME總線的并行多處理器系統(tǒng)而言,總線帶寬已經(jīng)成為制約系統(tǒng)處理能力的瓶頸。VME64X的總線帶寬為320Mb/s,已經(jīng)不能滿足要求高吞吐量、低延遲的系統(tǒng),迫切需要一種新的運算架構(gòu)來滿足實時高性能的導航和信號處理需求。PICMG協(xié)會在ATCA構(gòu)架的基礎上提出了一種MicroTCA構(gòu)架。
2、AdvancedTCA構(gòu)架
ATCA(advanced telecom computing architecture)高級電信計算構(gòu)架采用點對點交換互連結(jié)構(gòu)以實現(xiàn)高速數(shù)據(jù)傳輸$接口信道建立在LVDS(低壓差分信號)差分對基礎之上,電氣特性達到3.125GHz,數(shù)據(jù)編碼使用8b/10b編碼機制。交換互連拓撲結(jié)構(gòu)分為:雙星型、雙-雙星型和全網(wǎng)狀。
ATCA構(gòu)架能夠?qū)崿F(xiàn)6.25Gbit/s的速率,高達2.5Tbps的總帶寬,支持熱插拔和冗余備份,99.999%的可靠性,每板高達200W的散熱功率。此外還支持不同通訊協(xié)議之間的互連,包括以太網(wǎng)和光纖傳輸、InfiniBand、RapidIO、PCI Express等。
由于成本較高,占用空間大,設備管理和冷卻供電復雜,以及必須使用載板來容納AMC模塊,使得ATCA構(gòu)架適用于大規(guī)模、集中式的電信應用。
3、MicroTCA構(gòu)架
3.1 MicroTCA主要標準
兼容ATCA、AMC.0規(guī)范;可裁減的成本、尺寸以及模塊;模塊化的設計;可擴展的背板帶寬,1~40Gb/s;300mm、19英寸可上架機箱,支持高級系統(tǒng)管理;每個AMC模塊20~80W的散熱;支持-40℃~+65℃的溫度范圍;可靠性99.9%~99.999%;最低8年的使用壽命;支持星型、雙星型和全網(wǎng)狀拓撲結(jié)構(gòu);支持熱插拔。
3.2 MicroTCA系統(tǒng)構(gòu)成
1個典型的MicroTCA系統(tǒng)包括:12塊AMC模塊、1個或2個MCH(MicroTCA Carrier Hub)、互連背板以及電源、散熱等模塊(見圖1)。MicroTCA系統(tǒng)支持AMC.0的所有規(guī)格的板卡。MCH是MicroTCA系統(tǒng)的主要組成部分之一,功能類似于載板,以容納AMC模塊。作為載板集中器,MCH能夠同時進行12個AMC模塊之間的互連和管理。
圖1 MicroTCA系統(tǒng)架構(gòu)
4、AMC構(gòu)架
AMC是新一代擴展卡的規(guī)范,支持熱插拔,支持高速互連,支持豐富的處理器構(gòu)架,主要面向于通信和嵌入式領域,同時具有低成本和模塊化的靈活配置。
AMC模塊是MicroTCA系統(tǒng)的重要組成部分,通過對AMC模塊的使用能很容易地實現(xiàn)系統(tǒng)擴展、模塊化設計,從而方便地實現(xiàn)各種系統(tǒng)功能。AMC模塊包括CPU、DSP模塊、網(wǎng)絡處理器(NPU)、存儲模塊以及各種各樣的I/O模塊。
MicroTCA系統(tǒng)支持如圖2所示的6種尺寸的AMC模塊。
圖2 AMC模塊的規(guī)格
不同尺寸的AMC模塊能夠容納的器件是不同的,并且都有自己潛在的應用范圍。用戶可以根據(jù)自己的應用領域靈活地選擇相應的模塊。
5、MicroTCA信號處理機
采用如圖3所示的MicroTCA雙冗余構(gòu)架構(gòu)造了一套信號處理機。
該系統(tǒng)主要由CPU控制板、DSP信號處理板、網(wǎng)絡通信板、數(shù)據(jù)采集板(A/D、D/A)、存儲模塊和機箱構(gòu)成。
AMC處理器模塊采用英國并行公司的PR AMC/33x,該處理器配備2.0GHz Intel Pentium M處理器,支持PCI Express x8(AMC.1)、2個千兆以太網(wǎng)(AMC.2)、2個串行ATA150(AMC.3)。具有強大的處理能力和高速的數(shù)據(jù)傳輸。
信號處理模塊(AMC DSP)采用Surf公司的DSP模塊SurfRider AMC板,單板可最多容納8顆TI C6455 DSP,板載FPGA管理接口通信。
存儲模塊采用Kontron公司的AM4500,最大120GB的存儲量。兼容AMC.3規(guī)范。
網(wǎng)絡模塊采用Kontron公司的AM4300,帶4個10/100/1000Mb自適應以太網(wǎng)接口,支持PCI Express x8、x4、x2、x1鏈路。兼容AMC.2規(guī)范。
MicroTCA機箱采用德國Rittal公司的3U 14槽19英寸可上架機箱。
圖3 信號處理機結(jié)構(gòu)圖
通過AM4300可同時將4路千兆網(wǎng)絡數(shù)據(jù)引入系統(tǒng),通過背板互連將數(shù)據(jù)送入SurfRider模塊進行DSP處理,同時可將數(shù)據(jù)送入AMC4500進行同步存儲。處理器AMC模塊PR AMC/33x負責整個系統(tǒng)的協(xié)調(diào)調(diào)度。該系統(tǒng)可運行VxWorks及Linux等主流操作系統(tǒng),還支持Vxworks進行實時信號處理。
5.1 硬件設計
系統(tǒng)的硬件結(jié)構(gòu)設計見圖4。整個系統(tǒng)采用MicroTCA并行構(gòu)架,由信號處理模塊、數(shù)據(jù)采集模塊、網(wǎng)絡通信模塊、存儲模塊和控制器模塊構(gòu)成。各模塊之間通過AMC規(guī)范定義的各種高速總線進行互連。本系統(tǒng)中包括Serial RapidIO、Fiber Channel、Ethernet、PCI Express。
圖4 系統(tǒng)結(jié)構(gòu)圖
信號處理模塊由兩塊DSP多處理器板構(gòu)成。從功能上劃分,用第一片DSP處理板C6455完成速度補償以及抗異步干擾模塊、脈沖壓縮模塊的功能;用第二片C6455完成動目標處理模塊、非相參積累模塊、雜波圖以及恒虛警檢測(CFAR)模塊及點跡提取模塊的功能。兩板之間通過Serial RapidIO進行數(shù)據(jù)通信。峰值速率高達3.125GBps。
每塊處理板包含8顆TI DSP定點處理器C6455,主頻高達1GHz,每DSP帶32M DDR2 DRAM,運算節(jié)點之間通過共享內(nèi)存提高系統(tǒng)通信能力。單顆DSP運算能力達8000 MIPS,每塊信號處理板運算能力高達64000 MIPS。8顆C6455之間也通過RapidIO進行連接構(gòu)成并行處理系統(tǒng)。存儲模塊和采集模塊完成導航數(shù)據(jù)的高速采集和實時存儲。DSP信號處理板硬件構(gòu)架見圖5。
圖5 信號處理板構(gòu)架
5.2 軟件設計
信號處理以及實時成像對運算量和實時性要求很高,往往無法由單顆DSP完成。本系統(tǒng)的硬件架構(gòu)可以對系統(tǒng)中的任一片或幾片DSP模塊進行相應功能的編程,多個模塊組成的并行處理系統(tǒng)保證實時的數(shù)字信號處理能力。用本系統(tǒng)進行脈沖壓縮時,采用串行處理方法,將數(shù)字脈壓的卷積過程轉(zhuǎn)化成三步運算,即先將輸入信號進行傅立葉變換,再乘上與輸入信號相匹配的濾波系數(shù),將乘積進行逆傅立葉變換,最終得到脈沖壓縮結(jié)果。于是,可將處理任務分解成三個流水處理過程:(1)FFT;(2)復數(shù)乘法;(3)IFFT。即將信號的卷積實現(xiàn)從(1)式到(3)式的變換。
y(n)=x(n)*h(n) (1)
式中x(n)為輸入信號,h(n)為匹配濾波系數(shù),用FFT法實現(xiàn)數(shù)字脈壓,即完成:
y(n)=IFFT(X(jω)·H(jω)) (2)
y(n)=IFFT(FFT(X(n))·FFT(h(n))) (3)
按照算法的數(shù)據(jù)流走向分別分配給相應的DSP芯片完成FFT、復乘和逆FFT,采用這樣的串行處理%能夠把數(shù)據(jù)在一個包內(nèi)處理并傳送至下一流程,無需考慮數(shù)據(jù)的等待和拼合,處理流程加快,程序容易編制。
6、結(jié)論
文中構(gòu)建的基于MicroTCA構(gòu)架的DSP并行處理導航系統(tǒng),克服了傳統(tǒng)VME、CPCI總線系統(tǒng)帶寬方面的不足,先進的構(gòu)架支持RapidIO、PCI Express、Fiber Channel以及Ethernet等高速總線的背板互連.系統(tǒng)的信號處理能力可以通過增加信號處理板很容易地進行擴張。該系統(tǒng)運行穩(wěn)定,處理能力強,帶寬高,實時性好且支持-40℃~+65℃的溫度范圍。隨著MicroTCA構(gòu)架被PICMG制定為標準發(fā)布,MicroTCA構(gòu)架將會更多地應用于地面導航、雷達成像等領域。