《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 設(shè)計(jì)應(yīng)用 > 用戶自定制Nios處理器的FFT算法指令
用戶自定制Nios處理器的FFT算法指令
摘要: 在Altera的Nios嵌入式處理器中。用戶可以在Nios指令系統(tǒng)中增加用戶自定制指令來滿足某種特定的應(yīng)用需求。自定制指令可以訪問存儲(chǔ)器或Nios系統(tǒng)外的邏輯資源。增強(qiáng)系統(tǒng)的實(shí)時(shí)處理能力,特別適用于DSP、數(shù)據(jù)包處理及對(duì)計(jì)算密集型軟件進(jìn)行優(yōu)化。
關(guān)鍵詞: SoPC NIOS處理器 FFT算法
Abstract:
Key words :

  1 引言

  在Altera的Nios嵌入式處理器中。用戶可以在Nios指令系統(tǒng)中增加用戶自定制指令來滿足某種特定的應(yīng)用需求。自定制指令可以訪問存儲(chǔ)器或Nios系統(tǒng)外的邏輯資源。增強(qiáng)系統(tǒng)的實(shí)時(shí)處理能力,特別適用于DSP、數(shù)據(jù)包處理及對(duì)計(jì)算密集型軟件進(jìn)行優(yōu)化。

  Altera高性能快速傅立葉變換(FFT)處理器IP核FFT V2.2.0為實(shí)現(xiàn)高速FFT算法提供了成功的解決方案,將FFT算法定制為Nios嵌入式處理器的用戶指令,用已實(shí)現(xiàn)的高性能FFT算法作為Nios嵌入式系統(tǒng)的一個(gè)加速模塊,使系統(tǒng)可以完成復(fù)雜的數(shù)據(jù)處理任務(wù)。

  2 Nios自定制指令的軟硬件接口

  使用用戶自定制指令,用戶能夠向Nios的ALU和指令系統(tǒng)增加用戶自定制功能,完整的用戶自定制指令包括用戶自定制邏輯和軟件宏兩部分。

  用戶自定制邏輯是完成用戶操作的硬件部分,Nios最多支持5個(gè)用戶自定制邏輯作為ALU的一部分。軟件宏提供軟件接口,Nios將創(chuàng)建相應(yīng)C/C++和匯編的宏代碼,使得用戶能夠訪問用戶自定制邏輯。Nios自定制指令支持多種設(shè)計(jì)文件,主要有Verilog HDL、VHDL、EDIF netlist file、Quartus II Block Design File等。由于用戶自定制指令邏輯需要直接連到ALU上.所以Nios提供一套預(yù)先定義好名稱和功能的接口,如圖1所示。Nios配置向?qū)?huì)掃描用戶自定義邏輯,搜索需要的端口。并把這些端口連到ALU上,這就要求用戶自定制邏輯必須指定所需的端口類型,使用預(yù)先定義的端口名稱。保證自定制邏輯端口能正確地連到ALU。

 

  自定制邏輯圖

 

  當(dāng)然,Nios也允許用戶自定制指令與Nios系統(tǒng)外部的功能模塊進(jìn)行信息交流。如果配置向?qū)]能識(shí)別用戶邏輯模塊的某個(gè)端口。它將該端口引出到系統(tǒng)模塊的頂層.使得外部邏輯可以訪問這些信號(hào),這些端口用export標(biāo)記。當(dāng)用戶自定制邏輯被集成到Nios處理器的ALU后.可以通過軟件訪問用戶自定制邏輯,Nios系統(tǒng)中包括5個(gè)用戶操作碼,如表1所示,用戶可以通過用C/C++或匯編寫的宏來調(diào)用這些操作碼,通過它們來訪問用戶自定制邏輯。

 

  表1 用戶操作碼、類型和操作

 

  寫C/C++代碼時(shí),Nios寄存器的使用是透明的,編譯器會(huì)自動(dòng)選擇寄存器,而在匯編中則必須指定寄存器。在增加了用戶自定制指令后,Nios配置向?qū)?huì)自動(dòng)創(chuàng)建相應(yīng)的宏,支持對(duì)宏進(jìn)行手工命名,以提高軟件代碼的可讀性。

  在C/C++中通過一個(gè)函數(shù)調(diào)用來訪問用戶自定義指令。SOPC Builder自動(dòng)生成的Nios系統(tǒng)頭文件(excalibur.h)里包含了C/C++的宏定義,有兩種不同的C/C++宏可供使用,其中前一個(gè)使用了prefix端口,后一個(gè)沒有使用prefix端口。

  nm__PFX(PREFIX,DATA,DATAB)< P>

  nm_(DATA,DATAB)< P>

  3 FFT算法實(shí)現(xiàn)

  FFT算法由Altera的FFT IP核FFT V2.2.0實(shí)現(xiàn),F(xiàn)FT V2.2.0是一個(gè)高性能、參數(shù)化快速傅立葉變換(FFT)處理器IP核,對(duì)Altera StratixII、Stratix GX、Stratix以及Cyclone系列器件進(jìn)行了設(shè)計(jì)優(yōu)化.可以完成變換長(zhǎng)度為2m(6≤m≤14)的基-2/4按頻率抽?。―IF)的復(fù)數(shù)FFT算法,IP核使用模塊浮點(diǎn)結(jié)構(gòu)可在

  數(shù)據(jù)處理過程中保持最大數(shù)據(jù)動(dòng)態(tài)范圍,以獲得最大信噪比SNR與最少邏輯需求之間的平衡。

  此處FFT V2.2.0相關(guān)參數(shù)設(shè)置為:變換長(zhǎng)度(Transform Length)選擇1024點(diǎn),數(shù)據(jù)精度選擇16位,旋轉(zhuǎn)因子精度選擇16位,I/O數(shù)據(jù)流選擇Streaming形式,復(fù)數(shù)乘法器結(jié)構(gòu)(Structure)由3個(gè)乘法器、5個(gè)加法器完成。

  圖2給出了FFT算法模塊的外部端口,I/O接口協(xié)議采用Atlantic接口,輸入接口為主設(shè)備匯端(Master Sink),輸出接口為主設(shè)備源端(Master Source),Atlantic接口相關(guān)內(nèi)容可查閱文獻(xiàn)3,圖3為FFT在Modelsim環(huán)境下的仿真結(jié)果。

 

  FFT外部端口

 

  

 

  4 定制Nios核的FFT指令

 

  應(yīng)用SOPC Builder系統(tǒng)開發(fā)工具建立一個(gè)嵌入Nios軟核的基本SOPC系統(tǒng),系統(tǒng)組件如圖4所示。顯然,用戶可以根據(jù)實(shí)際應(yīng)用的需要增加其它SOPC系統(tǒng)組件,這里僅分析定制FFT算法指令相關(guān)內(nèi)容。

 

  

 

  通過自定制指令“Custom Instruction”界面中Import按鈕導(dǎo)入設(shè)計(jì)好的FFT.vhd文件,定制用戶指令FFT,這里使用USR1操作碼,如圖5所示。

 

  

 

  在Nios系統(tǒng)中用戶自定制邏輯必須與指定的端口類型匹配,對(duì)于FFT來說,其輸入和輸出都是實(shí)部和虛部為16位的復(fù)數(shù),正好可以用一個(gè)32位的值來表示 這樣FFT.vhd程序的端口(port)可以按如下方法設(shè)置:

  PORT(

  clk:IN STD_ LOGIC;

  reset:IN STD_LOGIC;

  dataa:IN STD_LOGIC_VECTOR(31 DOWNTO 0);

  result:OUT STD_LOGIC_VECTOR(31 DOWNTO 0);

  start:IN OUT STD_LOGIC:=‘0’;

  clk_en:IN STD LOGIC:=‘0’

  ……

  );

  即將程序中原有16位長(zhǎng)的data_real_in,data_imag_in,fft_real_out,fft_imag_out端口換成兩個(gè)32的輸入輸出端口dataa和result,另外,還必須加上start和clk_en兩個(gè)輸入端口,雖然這兩個(gè)端口信號(hào)在程序中沒有作用。端口例化時(shí)再與原有端口對(duì)應(yīng),如下所示:

  data_real_in => dataa(31 downto 16),

  data_imag_in => dataa(15 downto 0),

  fft_real_out => result(31 downto 16),

  fit_imag_out => result(15 downto 0),

  FFT其余Atlantic接口信號(hào)用export標(biāo)記,這些端口引出到系統(tǒng)模塊的頂層,外部邏輯可以訪問這些信號(hào)。

  重新生成SOPC系統(tǒng)并更新后得到如圖6所示的加入自定制FFT算法指令的Nios處理器,將其全程編譯并下載到相應(yīng)FPGA后,結(jié)合Atlantic接口邏輯、FIFO存儲(chǔ)器電路,用戶即可在C或C++中調(diào)用nm_fft指令來完成1024點(diǎn)的高速FFT算法。

 

  加入FFT指令的Nios處理器

 

  5 結(jié)論

 

  自定制Nios處理器的用戶指令方法,使設(shè)計(jì)者可以為某種特定的應(yīng)用定制自己的指令,定制指令的方法在降低軟件復(fù)雜性的同時(shí),明顯地提高了Nios處理器的性能.幫助系統(tǒng)完成復(fù)雜的數(shù)據(jù)處理。

  本文作者創(chuàng)新點(diǎn):基于IP核FFT V2.2.0實(shí)現(xiàn)了變換長(zhǎng)度為1024點(diǎn)的高速復(fù)數(shù)FFT算法,提出了一種新穎的在Nios嵌入式系統(tǒng)中定制用戶FFT算法指令的方法,使系統(tǒng)可以完成復(fù)雜的數(shù)據(jù)處理任務(wù),增強(qiáng)了系統(tǒng)的實(shí)時(shí)處理能力。

 

  參考文獻(xiàn):

 ?。?]梁曦捷,肖璋.一種基于FPGA的順序迭代FFT設(shè)計(jì) 微計(jì)算機(jī)信息,2005,1-2

 ?。?]Altera DataSheet FFT Compiler Megacore Function User Guide 2.2.0 rev1 2005.10

  [3]Altera DataSheet Custom instructions for the Nios embedded Processor User Guide ve1.1.2 2002.9

 ?。?]Altera DataSheet Altera Interface Functional Specificmion Ver.3.0 2002.6

  [5]潘松 黃繼業(yè) 曾毓 SOPC技術(shù)實(shí)用教程[M]北京清華大學(xué)出版社2005年3月131-139

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。