《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于龍芯IP核SoC芯片的FPGA驗(yàn)證技術(shù)研究
基于龍芯IP核SoC芯片的FPGA驗(yàn)證技術(shù)研究
來(lái)源:電子技術(shù)應(yīng)用2010年第10期
謝 平
西昌學(xué)院, 四川 西昌 615000
摘要: 闡述了片上系統(tǒng)(SoC) 設(shè)計(jì)的發(fā)展情況和現(xiàn)場(chǎng)可編程門陣列(FPGA)的獨(dú)特優(yōu)勢(shì),為基于龍芯I號(hào)處理器IP核的SoC設(shè)計(jì)了FPGA驗(yàn)證平臺(tái),并介紹了怎樣利用該平臺(tái)進(jìn)行軟硬件協(xié)同設(shè)計(jì)、SoC系統(tǒng)移植、IP核驗(yàn)證和運(yùn)行實(shí)時(shí)操作系統(tǒng)。
中圖分類號(hào): TP206
文獻(xiàn)標(biāo)識(shí)碼: B
文章編號(hào): 0258-7998(2010)10-0128-04
Research of FPGA verification technology of SoC chip based on IP core of loongson processor
XIE Ping
Xichang University, Xichang 615000, China
Abstract: This paper introduced development of SoC design and unique advantages of FPGA, designed FPGA verification platform for SoC based on loongson-1 processor, presented how to progress hardware/software co-design, SoC transplant and verification of IP core, and how to run real time operating system.
Key words : IP core of loongson-1 processor; SoC; FPGA; verification technology

    片上系統(tǒng)SoC(Sytem on Chip),即是將整個(gè)系統(tǒng)集成在單個(gè)的芯片上[1]。與傳統(tǒng)的板級(jí)電路不同,SoC集成的完整系統(tǒng)一般包括系統(tǒng)級(jí)芯片控制邏輯模塊、微處理器/微控制器CPU內(nèi)核模塊、數(shù)字信號(hào)處理器(DSP)模塊、嵌入的存儲(chǔ)器模塊、與外部進(jìn)行通信的接口模塊、含有ADC/DAC的模擬前端模塊、電源和功耗管理模塊,是一個(gè)具備特定功能、服務(wù)于特定市場(chǎng)的軟件和硅集成電路的混合體(如WLAN基帶芯片、便攜式多媒體芯片、DVD播放機(jī)解碼芯片等)。
    在SoC的設(shè)計(jì)總時(shí)間中,系統(tǒng)驗(yàn)證的時(shí)間約占70%以上。為縮短SoC的設(shè)計(jì)時(shí)間、提高設(shè)計(jì)質(zhì)量,需要對(duì)驗(yàn)證技術(shù)進(jìn)行研究開發(fā)。軟硬件協(xié)同驗(yàn)證方法與傳統(tǒng)的數(shù)字系統(tǒng)仿真驗(yàn)證方法不同,軟硬件協(xié)同仿真驗(yàn)證是針對(duì)軟件和硬件系統(tǒng)模塊進(jìn)行的混合模擬仿真[2]。目前大多數(shù)公司提供的開發(fā)驗(yàn)證系統(tǒng)(開發(fā)板)存在兩個(gè)不足:一是開發(fā)板的性能、規(guī)模難以根據(jù)特定的設(shè)計(jì)需求靈活、自由地調(diào)節(jié);二是開發(fā)板的功能大多數(shù)只能進(jìn)行軟件代碼的調(diào)試,即使ARM公司提供的開發(fā)平臺(tái)也只能調(diào)試部分硬件。而現(xiàn)場(chǎng)可編程門陣列(FPGA)作為集成電路設(shè)計(jì)技術(shù)的第三次重大進(jìn)步的重要標(biāo)志,可以使RTL綜合的結(jié)果直接運(yùn)行在SoC芯片上,重用性及現(xiàn)場(chǎng)靈活性較好。因此,本文利用Altera公司的FPGA開發(fā)工具對(duì)基于國(guó)產(chǎn)龍芯I號(hào)處理器IP核的SoC芯片進(jìn)行ASIC流片前的系統(tǒng)驗(yàn)證,全實(shí)時(shí)方式運(yùn)行協(xié)同設(shè)計(jì)所產(chǎn)生的硬件代碼和軟件代碼,構(gòu)建一個(gè)可獨(dú)立運(yùn)行、可現(xiàn)場(chǎng)監(jiān)測(cè)的驗(yàn)證平臺(tái)。
1 基于龍芯I號(hào)處理器IP核SoC芯片
 龍芯I號(hào)CPU IP核是兼顧通用及嵌入CPU特點(diǎn)的32位處理器內(nèi)核,采用類MIPS Ⅲ指令集,具有7級(jí)流水線、32位整數(shù)單元和64位浮點(diǎn)單元;具有高度靈活的可配置性,方便集成的各種標(biāo)準(zhǔn)接口。圖1為龍芯I號(hào)CPU IP核可配置結(jié)構(gòu),用戶可根據(jù)自己的需求進(jìn)行選擇配置,從而定制出最適合用戶應(yīng)用的處理器結(jié)構(gòu)。


    主要的可配置模塊包括:浮點(diǎn)部件、多媒體部件、內(nèi)存管理、Cache、協(xié)處理器接口。浮點(diǎn)部件完全兼容MIPS的浮點(diǎn)指令集合,其相關(guān)的系統(tǒng)軟件完全符合ANSI/IEEE 754-1985二進(jìn)制浮點(diǎn)運(yùn)算標(biāo)準(zhǔn)。浮點(diǎn)部件主要包括浮點(diǎn)ALU部件和浮點(diǎn)乘法/除法部件,用戶可根據(jù)自己的實(shí)際應(yīng)用選擇是否添加。媒體部件復(fù)用了MIPS浮點(diǎn)指令的Format域,并復(fù)用了浮點(diǎn)寄存器堆,媒體指令集基本對(duì)應(yīng)了Intel SSE媒體指令集合的各種操作。圖2為基于龍芯I號(hào)CPU IP核的SoC系統(tǒng)架構(gòu)。

    該SoC芯片支持通用MIPS32指令集,主頻可達(dá)266 MHz;內(nèi)置MAC網(wǎng)絡(luò),提供MII接口;存儲(chǔ)器接口,芯片同時(shí)支持SDRAM接口、NOR Flash/ROM和NAND Flash接口,并特置HPI接口可直接與VOIP CODEC芯片相連;提供豐富的其他外設(shè)接口支持,包括I2C接口、UART串口、SPI接口、AC97等接口設(shè)備。提供豐富的GPIO接口,能夠?yàn)?amp;ldquo;網(wǎng)絡(luò)+語(yǔ)音”以及工業(yè)控制應(yīng)用提供高效的單芯片解決方案。
2 FPGA驗(yàn)證平臺(tái)的設(shè)計(jì)
2.1 FPGA的開發(fā)流程

    FPGA的典型開發(fā)流程如圖3所示。在圖3中,邏輯仿真器主要有Modelsim、Verilog-XL等,邏輯綜合器主要有LeonardoSpectrum、Synplify Pro、FPGA Express/FPGA CompilerII等,F(xiàn)PGA廠家工具有Altera公司的Max+PlusII、QuartusII,Xilinx公司的Foundation ISE、Alliance等。設(shè)計(jì)輸入主要有原理圖輸入和HDL輸入兩種方式,絕大部分設(shè)計(jì),FPGA和ASIC的工程師都使用HDL平臺(tái)。設(shè)計(jì)仿真主要包括功能仿真和網(wǎng)表仿真,設(shè)計(jì)仿真需要RTL代碼或綜合后的HDL網(wǎng)表和驗(yàn)證程序,有時(shí)候還需要測(cè)試數(shù)據(jù),測(cè)試數(shù)據(jù)可能是代碼編譯后的二進(jìn)制文件或使用專門的工具采集的數(shù)據(jù)。布局布線工具利用綜合生成的網(wǎng)表、調(diào)用模塊的網(wǎng)表,根據(jù)布局布線目標(biāo),把設(shè)計(jì)翻譯成原始的目標(biāo)工藝,最后得到生成編程比特流所需的數(shù)據(jù)文件。布局布線一般需要的輸入輸出與調(diào)用關(guān)系如圖4所示。布局布線目標(biāo)包括所使用的FPGA具體型號(hào)等,約束條件包括管腳位置、管腳電平邏輯(LVTTL、LCMOS等)需要達(dá)到的時(shí)鐘頻率,有時(shí)包括部分模塊的布局、塊RAM的位置等。在一般設(shè)計(jì)中,只需要注意管腳位置和需要達(dá)到的時(shí)鐘頻率,邏輯端口與FPGA管腳的對(duì)應(yīng)取決于PCB板的設(shè)計(jì)。

2.2 驗(yàn)證平臺(tái)的系統(tǒng)設(shè)計(jì)
    本驗(yàn)證平臺(tái)FPGA采用Altera公司的Cyclone II EP2C70,該器件采用了TSMC領(lǐng)先的90 nm低電介工藝技術(shù)生產(chǎn);支持4個(gè)可編程鎖相環(huán)(PLL),提供靈活的時(shí)鐘管理和頻率合成能力;包含了150個(gè)18×18 bit乘法器,可以完成基本的DSP處理;高速外接存儲(chǔ)器接口支持SRAM、DRAM、DDR、DDR2以及QDRII SRAM;支持差分和單端I/O標(biāo)準(zhǔn),包括接收速率805 Mb/s和發(fā)送速率640 Mb/s的LVDS、mini LVDS、LVPECL、差分HSTL和差分SSTL及處理器、ASSP和ASIC接口的64位66 MHz PCI和PCI-X;高達(dá)260 MHz工作頻率,真正的雙端口工作(1個(gè)讀和1個(gè)寫,2個(gè)讀或2個(gè)寫);與133 MHz PCI-X 1.0標(biāo)準(zhǔn)兼容;用戶最多可用引腳622個(gè);高達(dá)402.5 MHz性能的分層時(shí)鐘網(wǎng)絡(luò),多達(dá)16個(gè)全局時(shí)鐘線,快速串行配置時(shí)間小于100 ms;支持3.3 V、2.5 V或1.8 V多種電壓,可用于視頻、圖像處理(如MPEG4編碼和譯碼、視頻濾波)和無(wú)線基礎(chǔ)設(shè)備中?;邶埿綢號(hào)CPU IP核的SoC的驗(yàn)證平臺(tái)結(jié)構(gòu)如圖5所示。

 圖5 中,外圍電路的主要功能是驗(yàn)證SoC 中各個(gè)接口IP 模塊能否與龍芯I號(hào)IP核、外部接口單元、硬件驅(qū)動(dòng)軟件和實(shí)時(shí)操作系統(tǒng)協(xié)調(diào)高效地工作。由于接口(如USB接口、UART/IrDA 接口、SPI和LCD接口等)電路結(jié)構(gòu)比較簡(jiǎn)單,且很多資料都有介紹,在設(shè)計(jì)時(shí),除了注意通用的設(shè)計(jì)規(guī)則和印制電路板(PCB) 布局布線外,沒有特別的要求。同時(shí),為了便于分析各個(gè)被驗(yàn)證的IP模塊在任意時(shí)刻的狀態(tài), 將Cyclone II EP2C70的大多數(shù)I/O引腳都引出到PCB上,以方便SoC開發(fā)人員使用邏輯分析儀進(jìn)行信號(hào)實(shí)時(shí)采集和分析,也可讓信號(hào)發(fā)生器產(chǎn)生一些特定信號(hào)以供系統(tǒng)調(diào)試使用。該開發(fā)系統(tǒng)在設(shè)計(jì)PCB時(shí)還特別注意了電磁干擾的屏蔽問(wèn)題。
2.3 SoC到FPGA的系統(tǒng)移植
 使用Altera公司的FPGA開發(fā)工具QuartusII,將SoC向Cyclone II EP2C70(FPGA)移植的步驟如下:
 (1)對(duì)SoC進(jìn)行修改,以適合FPGA的開發(fā)環(huán)境。修改子模塊配置、RAM、FIFO等,添加PLL對(duì)所需要的時(shí)鐘進(jìn)行適當(dāng)?shù)姆郑额l,或提高時(shí)鐘信號(hào)的質(zhì)量。
 (2)使用QuartusII內(nèi)置綜合工具或?qū)S镁C合工具(如常見的Synplify_pro)單獨(dú)建Project,對(duì)RTL進(jìn)行綜合,生成網(wǎng)表。時(shí)鐘工作頻率較高的,要寫綜合約束條件。
 (3)指定每一個(gè)輸入輸出信號(hào)對(duì)應(yīng)的FPGA管腳和輸入輸出邏輯類型。
 (4)編譯生成的網(wǎng)表以生成sof文件,包括優(yōu)化、適配、sof文件生成等分步驟。
 (5)進(jìn)行靜態(tài)時(shí)序分析,檢查是否滿足預(yù)定的時(shí)鐘頻率要求,若不能滿足,則重新進(jìn)行第(2)步。如果多次進(jìn)行步驟(2)仍不能滿足時(shí)序要求,則需要根據(jù)關(guān)鍵路徑對(duì)RTL代碼進(jìn)行修改。
    關(guān)鍵路徑是指延遲最大的路徑,該路徑的延遲限制了時(shí)鐘的最大工作頻率。該SoC芯片的最大工作頻率在266 MHz以上,與選用的FPGA Cyclone II EP2C70的總線時(shí)鐘速度相當(dāng)。
3 VxWorks實(shí)時(shí)操作系統(tǒng)
    本文所設(shè)計(jì)的SoC硬件平臺(tái)上,最終將運(yùn)行VxWorks操作系統(tǒng),作為此次嵌入式SoC硬件平臺(tái)設(shè)計(jì)的軟件需求和最終的驗(yàn)證目標(biāo)。VxWorks是一個(gè)具有可伸縮、可裁減、高可靠性,同時(shí)適用于所有流行CPU平臺(tái)的實(shí)時(shí)操作系統(tǒng)[3]??缮炜s性指VxWorks提供了超過(guò)1 800個(gè)應(yīng)用編程接口(API)供用戶自行選擇使用;可裁減性指用戶可以根據(jù)自己的應(yīng)用需要對(duì)VxWorks進(jìn)行配置,產(chǎn)生具有不同功能集的操作系統(tǒng)映像;可靠性指VxWorks可以提供非常安全的操作系統(tǒng)平臺(tái)。VxWorks的基本構(gòu)成組件包括BSP(Board Support Package)、微內(nèi)核Wind、網(wǎng)絡(luò)系統(tǒng)、文件系統(tǒng)及I/O系統(tǒng)。本文測(cè)試更關(guān)注于BSP、Wind以及I/O組件。BSP中包括硬件環(huán)境中CPU的初始化及系統(tǒng)各項(xiàng)硬件資源的安裝和配置,如RAM、Clock、網(wǎng)絡(luò)接口、中斷控制器等。微內(nèi)核Wind是WindRiver公司自行開發(fā)的一種嵌入式操作系統(tǒng)內(nèi)核,該內(nèi)核具有標(biāo)準(zhǔn)的嵌入式實(shí)時(shí)操作系統(tǒng)的基本特征。
4 驗(yàn)證平臺(tái)的檢驗(yàn)
 將已經(jīng)成熟的AMBA總線IP核的Verilog代碼通過(guò)Synplify 綜合,利用Altera公司的QUARTUS Ⅱ軟件作布局布線,燒入Cyclone II EP2C70,再用同樣的方式將新開發(fā)的EMI IP 核的Verilog 代碼燒入該FPGA,將其中的SDRAM控制器作為驗(yàn)證示例,選取其中最簡(jiǎn)單的訪問(wèn)方式來(lái)驗(yàn)證該平臺(tái)能否使用。上電后,首先要對(duì)所有內(nèi)存區(qū)(bank) 預(yù)充電,經(jīng)8個(gè)自刷新周期后需要設(shè)置訪問(wèn)模式,即編程模式寄存器。以上三個(gè)過(guò)程要求如下:
 (1) 預(yù)充電命令的發(fā)出要求:在時(shí)鐘周期的上升沿處,CS、RAS、WE 為低,CAS 為高。
 (2) 自刷新命令的發(fā)出要求:在時(shí)鐘周期的上升沿處,CS、RAS、CAS 和CKE 保持低,WE為高。
 (3) 模式寄存器的激活:在時(shí)鐘的上升沿處,RAS、CAS、CS和WE為低。
   當(dāng)要驗(yàn)證各個(gè)IP模塊(包括INT 中斷控制器、DMA 控制器、LCD 控制器和AC97控制器等)之間的協(xié)同工作時(shí),燒入的代碼較多,占用的FPGA資源也較多,再加上需要實(shí)時(shí)運(yùn)行,例如播放PM3實(shí)時(shí)解碼過(guò)程中,時(shí)鐘至少要求60 MHz,需要工作的IP核有總線、DMA控制器、INT 中斷控制器、AC97 控制器等,因此在這種情況下,最好使用Multi PointSynthesis 的綜合流程和Timing driven的綜合與優(yōu)化策略,并使用Logic-lock約束技術(shù)和人工干預(yù)布局布線,以達(dá)到預(yù)期目的。使用該平臺(tái)對(duì)所開發(fā)的SoC的各個(gè)模塊進(jìn)行了驗(yàn)證,并在10 MHz~70 MHz條件下與代碼前(后)仿真結(jié)果和SoC實(shí)測(cè)結(jié)果進(jìn)行了比較,發(fā)現(xiàn)該FPGA 驗(yàn)證平臺(tái)在多模塊、高速情況下,性能有所下降,如圖6所示,需進(jìn)一步提高綜合和布局布線技術(shù)。

 本文設(shè)計(jì)了基于國(guó)產(chǎn)龍芯I號(hào)處理器IP核的SoC 的FPGA 驗(yàn)證平臺(tái),介紹了怎樣利用該平臺(tái)進(jìn)行軟硬件協(xié)同設(shè)計(jì)、SoC系統(tǒng)移植、IP核驗(yàn)證和運(yùn)行實(shí)時(shí)操作系統(tǒng)。在電壓設(shè)計(jì)、模塊選用甚至處理器核的選用方面都考慮了升級(jí)擴(kuò)展技術(shù),可為其他SoC的驗(yàn)證所借鑒。驗(yàn)證結(jié)果表明,基于龍芯I號(hào)CPU IP核的SoC可成功運(yùn)行Linux嵌入式程序及VxWorks。
參考文獻(xiàn)
[1] KUNKEL J. Embedded computing-toward IP-based system-level soc design[J]. Computer,2003,36(5):88-89.
[2] 嚴(yán)迎建,劉明業(yè),片上系統(tǒng)設(shè)計(jì)中軟硬件協(xié)同驗(yàn)證方法的研究[J].電子與信息學(xué)報(bào),2005,27(9):317-321.
[3] Wind River System. VxWorks_BSP_R eference.www.windriver.com.2004.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。