《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 面向SAR雷達(dá)信號(hào)處理的異構(gòu)多核SoC研究
面向SAR雷達(dá)信號(hào)處理的異構(gòu)多核SoC研究
2017年電子技術(shù)應(yīng)用第1期
宋立國(guó)1,胡承秀2,亓洪亮1
1.北京微電子技術(shù)研究所,北京100076;2.北京宇航系統(tǒng)工程研究所,北京100076
摘要: 首先介紹了目前星載SAR(合成孔徑雷達(dá)) 系統(tǒng)構(gòu)成,從中分析出開展高性能多核處理器的必要性和緊迫性。接下來(lái)介紹了正在研發(fā)的面向SAR雷達(dá)信號(hào)處理的異構(gòu)多核SoC,詳細(xì)介紹了芯片的系統(tǒng)結(jié)構(gòu)和片上網(wǎng)絡(luò)總線。芯片內(nèi)總線采用多層二維網(wǎng)格總線,每層總線內(nèi)部存在兩種傳遞模式:動(dòng)態(tài)傳遞和靜態(tài)傳遞。動(dòng)態(tài)面向數(shù)據(jù)包的靈活傳遞,靜態(tài)面向高速數(shù)據(jù)流傳遞。最后,在性能和功耗等方面與目前常用的數(shù)字信號(hào)處理器進(jìn)行了對(duì)比,并說(shuō)明此異構(gòu)多核SoC對(duì)SAR雷達(dá)信號(hào)處理結(jié)果。
關(guān)鍵詞: 異構(gòu)多核 SOC SAR 雷達(dá)
中圖分類號(hào): TN957.51
文獻(xiàn)標(biāo)識(shí)號(hào): A
DOI:10.16157/j.issn.0258-7998.2017.01.013
中文引用格式: 宋立國(guó),胡承秀,亓洪亮. 面向SAR雷達(dá)信號(hào)處理的異構(gòu)多核SoC研究[J].電子技術(shù)應(yīng)用,2017,43(1):50-52,56.
英文引用格式: Song Liguo,Hu Chengxiu,Qi Hongliang. Heterogeneous multi-core SoC architecture exploration of SAR radar digital system[J].Application of Electronic Technique,2017,43(1):50-52,56.
Heterogeneous multi-core SoC architecture exploration of SAR radar digital system
Song Liguo1,Hu Chengxiu2,Qi Hongliang1
1.Beijing Microelectronics Institute of Technology,Beijing 100076,China; 2.Beijing Aerospace Institute of Systems Engineering,Beijing 100076,China
Abstract: The SAR system framework which is used on space device is firstly presented and analyses were conducted on this framework. The function of real time processing could not be realized by available chips, it is necessary and urgently to research high performance multi-core processor. Then, a new heterogeneous multi-core SoC(System on a Chip) which is designed for SAR radar signal processing is introduced. The advanced technology of network on chip(NoC) is adopted in the heterogeneous multi-core SoC, and multi-layer mesh buses are integrated in it. There are two transfer modes supported by the bus: dynamic transfer used for data packets and static transfer used for data stream. Finally, the SoC compares performance and power with other traditional DSP, and the processing result is given.
Key words : heterogeneous multi-core;SoC;SAR;radar

0 引言

    合成孔徑雷達(dá)(SAR)作為一種全天時(shí)、全天候的有源主動(dòng)式微波成像系統(tǒng),以其優(yōu)越的二維高分辨率特性,在國(guó)防、地質(zhì)、自然資源勘探與監(jiān)測(cè)、地形繪測(cè)、災(zāi)害估計(jì)等領(lǐng)域中已經(jīng)得到了日益廣泛的應(yīng)用。SAR的搭載平臺(tái)也從機(jī)載到星載,向著更高的太空發(fā)展。日本、加拿大、美國(guó)以及俄羅斯都陸續(xù)展開星載SAR成像技術(shù)的研究。

    星載SAR系統(tǒng)結(jié)構(gòu)如圖1所示。傳統(tǒng)的SAR 成像處理需要將原始回波數(shù)據(jù)記錄下傳至地面站進(jìn)行, 采用原始SAR數(shù)據(jù)壓縮算法,即分塊自適應(yīng)量化(BAQ),但SAR原始數(shù)據(jù)熵值很高,無(wú)損壓縮算法壓縮比太低,這不僅要求雷達(dá)衛(wèi)星具有高帶寬的下行數(shù)據(jù)鏈路,而且還受到衛(wèi)星過(guò)頂時(shí)間的限制。現(xiàn)在普遍希望在星上完成原始數(shù)據(jù)的處理,只將處理結(jié)果下傳,但SAR系統(tǒng)龐大的數(shù)據(jù)量以及高實(shí)時(shí)性要求高性能信號(hào)處理器。

wdz4-t1.gif

    TS201是ADI公司TigerSHARC系列處理器,具有非常強(qiáng)的運(yùn)算能力,在雷達(dá)陣列信號(hào)處理中,TS201應(yīng)用非常廣泛。SAR處理系統(tǒng)中,普遍采用多顆TS201共同完成信號(hào)處理,文獻(xiàn)[1]中機(jī)載SAR系統(tǒng)采用12顆TS201,文獻(xiàn)[2]無(wú)人機(jī)SAR系統(tǒng)采用8顆TS201,文獻(xiàn)[3]星載SAR系統(tǒng)采用16顆TS201。利用幾十片TS201搭建星載SAR雷達(dá)系統(tǒng),無(wú)論從功耗、可靠性、重量、體積等方面都將很難滿足星上處理的要求。同時(shí),在研制過(guò)程中,由于系統(tǒng)采用多片DSP器件,系統(tǒng)過(guò)于復(fù)雜,調(diào)試?yán)щy。

1 異構(gòu)多核SoC

    隨著處理器設(shè)計(jì)技術(shù)的進(jìn)步,單核SoC邁向多核SoC,以提供更加強(qiáng)大的計(jì)算能力,如csx600[4],Tile-Gx36[5],QorIQT4080[6]。由于SAR雷達(dá)信號(hào)處理中計(jì)算密集型應(yīng)用的多樣性和復(fù)雜性,使得多核異構(gòu)成為面向這類復(fù)雜應(yīng)用的片上系統(tǒng)首選方案。異構(gòu)多核SoC優(yōu)勢(shì)是將結(jié)構(gòu)、功能、功耗、運(yùn)算性能各不相同的多個(gè)處理器集成在芯片上,并通過(guò)任務(wù)分工和劃分,將不同的任務(wù)分配給不同的處理單元,讓每個(gè)處理單元處理自己擅長(zhǎng)的任務(wù),這種多核異構(gòu)的組織方式執(zhí)行任務(wù)更有效率,實(shí)現(xiàn)了資源的最佳化配置,而且降低了整體功耗。同時(shí),芯片上各個(gè)處理器還可以動(dòng)態(tài)地改變可重構(gòu)資源之間的互連關(guān)系,控制數(shù)據(jù)流的流動(dòng),進(jìn)一步提高運(yùn)算的數(shù)據(jù)吞吐率。

1.1 異構(gòu)多核SoC系統(tǒng)結(jié)構(gòu)

    異構(gòu)多核SoC(MPSoC)是北京微電子技術(shù)研究所在成功研制出32位高可靠微處理器后,開發(fā)的一款高性能異構(gòu)多核嵌入式數(shù)字信號(hào)處理器。

    多核處理器芯片內(nèi)部主要由一個(gè)兼容SPARC V8的主控制器和16個(gè)DSP引擎組成。12個(gè)DSP引擎包括8個(gè)兼容SPARC V8的精簡(jiǎn)處理器和4個(gè)可重構(gòu)浮點(diǎn)蝶形運(yùn)算加速單元RBE、4個(gè)可重構(gòu)矢量加速單元RAE。芯片中DSP引擎按照2維網(wǎng)格結(jié)構(gòu)規(guī)則排列,形成并行的處理單元陣列,由高速片上互連總線鏈接,主控制器和16個(gè)DSP引擎能夠同時(shí)并行運(yùn)行。其整體結(jié)構(gòu)如圖2所示。

wdz4-t2.gif

    芯片采用片上網(wǎng)絡(luò)結(jié)構(gòu),所有的單元和模塊與具有自主知識(shí)產(chǎn)權(quán)的片上網(wǎng)絡(luò)總線(SANOC-BUS)相連接。SANOC-BUS呈規(guī)則的二維網(wǎng)格結(jié)構(gòu),連接有存儲(chǔ)器模塊(RAM)、PE、RAE、RBE、LINK、只讀存儲(chǔ)器(ROM,存儲(chǔ)旋轉(zhuǎn)因子)和64位SDRAM存儲(chǔ)器接口。

    在片上網(wǎng)絡(luò)系統(tǒng)中,各模塊主要功能為:

    (1)PE, 哈佛結(jié)構(gòu)DSP核,由整數(shù)單元(IU)、FPU、內(nèi)部存儲(chǔ)器和總線接口4部分組成。

    (2)RBE單元采用配置計(jì)算領(lǐng)域中可重構(gòu)的概念,根據(jù)不同的配置指令,RBE執(zhí)行單精度浮點(diǎn)蝶形運(yùn)算、乘累加運(yùn)算、復(fù)數(shù)乘和求模等不同的運(yùn)算,支持?jǐn)?shù)據(jù)流處理。

    (3)RAE以流處理的方式加速大量數(shù)據(jù)的規(guī)則運(yùn)算,此單元采用配置計(jì)算領(lǐng)域中可重構(gòu)的概念,根據(jù)不同的配置指令,RAE執(zhí)行矢量字節(jié)加減運(yùn)算、矢量字節(jié)乘累加等不同的運(yùn)算,支持?jǐn)?shù)據(jù)流處理。

    (4)LINK模塊功能與TS201的LINK模塊功能兼容,支持與RAM模塊和SDRAM之間DMA傳遞。

    (5)RAM中的數(shù)據(jù)既能夠被主控制器和PE讀寫,支持RAM模塊之間、RAM模塊和SDRAM之間DMA傳遞。

wdz4-t3.gif

1.2 片上網(wǎng)絡(luò)總線設(shè)計(jì)

    片上網(wǎng)絡(luò)SANOC_BUS由5層相同的總線系統(tǒng)組成,每層總線系統(tǒng)采用2維網(wǎng)格結(jié)構(gòu),包括4條水平線和4條垂直線。如圖3所示,這5層總線系統(tǒng)分別命名為:L_P2M、L_I2M、L_P2P、L_DMA、L_CMD,負(fù)責(zé)傳輸不同的數(shù)據(jù)包,規(guī)定如下:

    (1)L_P2M:負(fù)責(zé)為處理單元PE對(duì)存儲(chǔ)器的訪問(wèn)傳遞信息;

    (2)L_I2M:負(fù)責(zé)為link接口和SDRAM接口對(duì)存儲(chǔ)器的訪問(wèn)傳遞信息;

    (3)L_P2P:負(fù)責(zé)在處理單元PE間相互訪問(wèn)傳遞信息;

    (4)L_DMA:負(fù)責(zé)處理單元PE和存儲(chǔ)器之間的快速DMA數(shù)據(jù)傳遞;

    (5)L_CMD:負(fù)責(zé)傳遞主控制器和處理單元PE針對(duì)控制寄存器組和狀態(tài)寄存器組的訪問(wèn)。

    上圖中,在每層總線上,水平線和垂直線的交叉點(diǎn)在此層2維網(wǎng)格平面中擁有唯一的坐標(biāo)。規(guī)定坐標(biāo)原點(diǎn)定義為網(wǎng)格的左上角,坐標(biāo)以(x,y)方式表示,x軸方向向右,y軸方向向下。

    每層總線內(nèi)部存在兩種傳遞模式:動(dòng)態(tài)傳遞和靜態(tài)傳遞。

    (1)動(dòng)態(tài)傳遞

    對(duì)于動(dòng)態(tài)傳遞,不需要任何設(shè)置,芯片硬件自動(dòng)完成數(shù)據(jù)包的打包和解析。在多核內(nèi)部總線中,所有的數(shù)據(jù)傳遞按照X-Y蟲蠕維序動(dòng)態(tài)的方式進(jìn)行傳遞。在傳遞數(shù)據(jù)時(shí),不需要預(yù)先規(guī)劃好單獨(dú)的路徑,數(shù)據(jù)在觸發(fā)傳遞時(shí)自動(dòng)加入包頭信息,在傳遞過(guò)程中依靠路由結(jié)點(diǎn)內(nèi)部仲裁機(jī)制自動(dòng)尋找路徑的總線。動(dòng)態(tài)傳遞為分時(shí)復(fù)用,交叉結(jié)點(diǎn)間的傳遞通道在不同時(shí)刻傳遞不同的數(shù)據(jù)包,這些數(shù)據(jù)包的源和目的允許不同。

    動(dòng)態(tài)總線數(shù)據(jù)傳遞包頭格式定義如圖4所示。

wdz4-t4.gif

    在路由單元中,仲裁邏輯規(guī)定為:在沒(méi)有到達(dá)目的坐標(biāo)時(shí),按照XY蟲蠕維序路由機(jī)制傳遞;在到達(dá)目的坐標(biāo)后,傳遞到位于此坐標(biāo)處的DSP引擎。

    (2)靜態(tài)傳遞

    靜態(tài)傳遞功能,目的是快速處理規(guī)則的流運(yùn)算。數(shù)據(jù)流在靜態(tài)傳遞過(guò)程中,具有唯一確定的源坐標(biāo)地址和目的坐標(biāo)地址,并且傳遞通道完全被源和目的間的數(shù)據(jù)傳遞所獨(dú)占。在應(yīng)用靜態(tài)傳遞時(shí),需要設(shè)置目的地址和所占用的總線層,占用總線層一旦設(shè)定,就不能夠再傳遞其它動(dòng)態(tài)數(shù)據(jù)包。靜態(tài)傳遞數(shù)據(jù)包包頭格式如圖5所示。

wdz4-t5.gif

    靜態(tài)傳遞功能對(duì)總線具有獨(dú)占性,數(shù)據(jù)流在整個(gè)傳遞過(guò)程中,僅利用一個(gè)數(shù)據(jù)包頭標(biāo)志。總線中進(jìn)行靜態(tài)傳遞的路徑只被單一的處理單元或存儲(chǔ)器發(fā)出的數(shù)據(jù)所占用,其它處理單元若也想采用靜態(tài)傳遞的方式傳遞數(shù)據(jù),只能為其規(guī)劃一條單獨(dú)的數(shù)據(jù)傳遞通道。

    靜態(tài)傳遞包頭格式如圖5所示,“目的坐標(biāo)”,“預(yù)路由坐標(biāo)”,“傳遞層號(hào)”需要預(yù)先設(shè)置。

    “預(yù)路由坐標(biāo)”的功能描述如下:雖然依靠X-Y路由機(jī)制,數(shù)據(jù)包能夠主動(dòng)找到目的地址,但在靜態(tài)傳遞數(shù)據(jù)時(shí),每個(gè)數(shù)據(jù)包都會(huì)很長(zhǎng),由于對(duì)數(shù)據(jù)傳遞通道具有獨(dú)占性,可能會(huì)阻礙其它靜態(tài)數(shù)據(jù)包的傳遞,為此,增加“預(yù)路由坐標(biāo)”參數(shù)設(shè)計(jì)。數(shù)據(jù)包首先按照“預(yù)路由坐標(biāo)”傳遞,先按照X軸參數(shù)傳遞,再按照Y軸參數(shù)傳遞;當(dāng)“預(yù)路由坐標(biāo)”參數(shù)傳遞完后,再按照X-Y路由機(jī)制達(dá)到目的坐標(biāo)。

2 異構(gòu)多核SoC的應(yīng)用

2.1 性能比較

    在SAR雷達(dá)信號(hào)處理中,對(duì)FFT算法的處理速度是評(píng)價(jià)多核處理器性能非常重要和關(guān)鍵的指標(biāo)。表1為多核處理器與目前比較常用的數(shù)字信號(hào)處理器(DSP)快速處理32 K點(diǎn)單精度浮點(diǎn)FFT運(yùn)算性能比較。

wdz4-b1.gif

    多種不同可重構(gòu)加速處理單元結(jié)合在一起,發(fā)揮各自的優(yōu)勢(shì):主控制器發(fā)揮靈活的控制功能;RSIC架構(gòu)的PE適合非規(guī)則數(shù)據(jù)處理,可重配置的RBE/RAE適合數(shù)據(jù)流處理。不同功能單元相互獨(dú)立,每個(gè)單元的功能劃分相對(duì)單一,把運(yùn)算、存儲(chǔ)、控制、調(diào)度等功能分散在不同的功能單元中實(shí)現(xiàn),降低系統(tǒng)功耗,降低了每個(gè)處理單元的復(fù)雜度,改善了系統(tǒng)的可實(shí)現(xiàn)性。

2.2 SAR算法處理

    圖6為利用ERS-2衛(wèi)星數(shù)據(jù)處理結(jié)果。圖6(a)中方框中圍起來(lái)的部分為北京西邊官?gòu)d水庫(kù)的遙感圖像,圖6(b)為SAR雷達(dá)數(shù)據(jù)經(jīng)過(guò)CS算法處理的結(jié)果。

wdz4-t6.gif

3 結(jié)論

    異構(gòu)多核SoC具備高性能、高可靠性、擴(kuò)展能力強(qiáng)、低功耗的特點(diǎn),主要面向雷達(dá)信號(hào)處理,星載圖像處理等高數(shù)據(jù)吞吐率、計(jì)算密集型的應(yīng)用領(lǐng)域,也可用于對(duì)可靠性要求非常高的多任務(wù)實(shí)時(shí)控制系統(tǒng)。SoC內(nèi)采用多層二維網(wǎng)格總線結(jié)構(gòu),每一層總線傳遞各自特定的信息包,互不干擾,片內(nèi)總線帶寬非常高,不會(huì)成為影響性能的瓶頸,能夠在此基礎(chǔ)上開發(fā)面向各種應(yīng)用的異構(gòu)多核SoC。

參考文獻(xiàn)

[1] 蔣留兵,車?yán)?新一代通用機(jī)載雷達(dá)信號(hào)處理機(jī)的實(shí)現(xiàn)[J].電子設(shè)計(jì)工程,2009(5):79-81.

[2] 郝慧軍.無(wú)人機(jī)載SAR實(shí)時(shí)信號(hào)處理設(shè)計(jì)及實(shí)現(xiàn)[J].科技視界,2015(26):7-8.

[3] 朱木.同步軌道SAR實(shí)時(shí)成像算法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2014.

[4] YUAN M,BAKER J W.Scalable and efficient associative processor solution to guarantee real time requirements for air traffic control systems[M].2012 IEEE 26th international parallel and distributed processing symposium  p1688-1695.

[5] http://www.tilera.com/pdf/productbrief.

[6] 飛思卡爾推出基于Layerscape架構(gòu)的全新QorIQ系列多核處理器[J].單片機(jī)與嵌入式系統(tǒng)應(yīng)用,2014(5):77-77.



作者信息:

宋立國(guó)1,胡承秀2,亓洪亮1

(1.北京微電子技術(shù)研究所,北京100076;2.北京宇航系統(tǒng)工程研究所,北京100076)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。