文獻標(biāo)識碼: B
文章編號: 0258-7998(2010)10-0128-04
片上系統(tǒng)SoC(Sytem on Chip),即是將整個系統(tǒng)集成在單個的芯片上[1]。與傳統(tǒng)的板級電路不同,SoC集成的完整系統(tǒng)一般包括系統(tǒng)級芯片控制邏輯模塊、微處理器/微控制器CPU內(nèi)核模塊、數(shù)字信號處理器(DSP)模塊、嵌入的存儲器模塊、與外部進行通信的接口模塊、含有ADC/DAC的模擬前端模塊、電源和功耗管理模塊,是一個具備特定功能、服務(wù)于特定市場的軟件和硅集成電路的混合體(如WLAN基帶芯片、便攜式多媒體芯片、DVD播放機解碼芯片等)。
在SoC的設(shè)計總時間中,系統(tǒng)驗證的時間約占70%以上。為縮短SoC的設(shè)計時間、提高設(shè)計質(zhì)量,需要對驗證技術(shù)進行研究開發(fā)。軟硬件協(xié)同驗證方法與傳統(tǒng)的數(shù)字系統(tǒng)仿真驗證方法不同,軟硬件協(xié)同仿真驗證是針對軟件和硬件系統(tǒng)模塊進行的混合模擬仿真[2]。目前大多數(shù)公司提供的開發(fā)驗證系統(tǒng)(開發(fā)板)存在兩個不足:一是開發(fā)板的性能、規(guī)模難以根據(jù)特定的設(shè)計需求靈活、自由地調(diào)節(jié);二是開發(fā)板的功能大多數(shù)只能進行軟件代碼的調(diào)試,即使ARM公司提供的開發(fā)平臺也只能調(diào)試部分硬件。而現(xiàn)場可編程門陣列(FPGA)作為集成電路設(shè)計技術(shù)的第三次重大進步的重要標(biāo)志,可以使RTL綜合的結(jié)果直接運行在SoC芯片上,重用性及現(xiàn)場靈活性較好。因此,本文利用Altera公司的FPGA開發(fā)工具對基于國產(chǎn)龍芯I號處理器IP核的SoC芯片進行ASIC流片前的系統(tǒng)驗證,全實時方式運行協(xié)同設(shè)計所產(chǎn)生的硬件代碼和軟件代碼,構(gòu)建一個可獨立運行、可現(xiàn)場監(jiān)測的驗證平臺。
1 基于龍芯I號處理器IP核SoC芯片
龍芯I號CPU IP核是兼顧通用及嵌入CPU特點的32位處理器內(nèi)核,采用類MIPS Ⅲ指令集,具有7級流水線、32位整數(shù)單元和64位浮點單元;具有高度靈活的可配置性,方便集成的各種標(biāo)準(zhǔn)接口。圖1為龍芯I號CPU IP核可配置結(jié)構(gòu),用戶可根據(jù)自己的需求進行選擇配置,從而定制出最適合用戶應(yīng)用的處理器結(jié)構(gòu)。
主要的可配置模塊包括:浮點部件、多媒體部件、內(nèi)存管理、Cache、協(xié)處理器接口。浮點部件完全兼容MIPS的浮點指令集合,其相關(guān)的系統(tǒng)軟件完全符合ANSI/IEEE 754-1985二進制浮點運算標(biāo)準(zhǔn)。浮點部件主要包括浮點ALU部件和浮點乘法/除法部件,用戶可根據(jù)自己的實際應(yīng)用選擇是否添加。媒體部件復(fù)用了MIPS浮點指令的Format域,并復(fù)用了浮點寄存器堆,媒體指令集基本對應(yīng)了Intel SSE媒體指令集合的各種操作。圖2為基于龍芯I號CPU IP核的SoC系統(tǒng)架構(gòu)。
該SoC芯片支持通用MIPS32指令集,主頻可達266 MHz;內(nèi)置MAC網(wǎng)絡(luò),提供MII接口;存儲器接口,芯片同時支持SDRAM接口、NOR Flash/ROM和NAND Flash接口,并特置HPI接口可直接與VOIP CODEC芯片相連;提供豐富的其他外設(shè)接口支持,包括I2C接口、UART串口、SPI接口、AC97等接口設(shè)備。提供豐富的GPIO接口,能夠為“網(wǎng)絡(luò)+語音”以及工業(yè)控制應(yīng)用提供高效的單芯片解決方案。
2 FPGA驗證平臺的設(shè)計
2.1 FPGA的開發(fā)流程
FPGA的典型開發(fā)流程如圖3所示。在圖3中,邏輯仿真器主要有Modelsim、Verilog-XL等,邏輯綜合器主要有LeonardoSpectrum、Synplify Pro、FPGA Express/FPGA CompilerII等,F(xiàn)PGA廠家工具有Altera公司的Max+PlusII、QuartusII,Xilinx公司的Foundation ISE、Alliance等。設(shè)計輸入主要有原理圖輸入和HDL輸入兩種方式,絕大部分設(shè)計,FPGA和ASIC的工程師都使用HDL平臺。設(shè)計仿真主要包括功能仿真和網(wǎng)表仿真,設(shè)計仿真需要RTL代碼或綜合后的HDL網(wǎng)表和驗證程序,有時候還需要測試數(shù)據(jù),測試數(shù)據(jù)可能是代碼編譯后的二進制文件或使用專門的工具采集的數(shù)據(jù)。布局布線工具利用綜合生成的網(wǎng)表、調(diào)用模塊的網(wǎng)表,根據(jù)布局布線目標(biāo),把設(shè)計翻譯成原始的目標(biāo)工藝,最后得到生成編程比特流所需的數(shù)據(jù)文件。布局布線一般需要的輸入輸出與調(diào)用關(guān)系如圖4所示。布局布線目標(biāo)包括所使用的FPGA具體型號等,約束條件包括管腳位置、管腳電平邏輯(LVTTL、LCMOS等)需要達到的時鐘頻率,有時包括部分模塊的布局、塊RAM的位置等。在一般設(shè)計中,只需要注意管腳位置和需要達到的時鐘頻率,邏輯端口與FPGA管腳的對應(yīng)取決于PCB板的設(shè)計。
2.2 驗證平臺的系統(tǒng)設(shè)計
本驗證平臺FPGA采用Altera公司的Cyclone II EP2C70,該器件采用了TSMC領(lǐng)先的90 nm低電介工藝技術(shù)生產(chǎn);支持4個可編程鎖相環(huán)(PLL),提供靈活的時鐘管理和頻率合成能力;包含了150個18×18 bit乘法器,可以完成基本的DSP處理;高速外接存儲器接口支持SRAM、DRAM、DDR、DDR2以及QDRII SRAM;支持差分和單端I/O標(biāo)準(zhǔn),包括接收速率805 Mb/s和發(fā)送速率640 Mb/s的LVDS、mini LVDS、LVPECL、差分HSTL和差分SSTL及處理器、ASSP和ASIC接口的64位66 MHz PCI和PCI-X;高達260 MHz工作頻率,真正的雙端口工作(1個讀和1個寫,2個讀或2個寫);與133 MHz PCI-X 1.0標(biāo)準(zhǔn)兼容;用戶最多可用引腳622個;高達402.5 MHz性能的分層時鐘網(wǎng)絡(luò),多達16個全局時鐘線,快速串行配置時間小于100 ms;支持3.3 V、2.5 V或1.8 V多種電壓,可用于視頻、圖像處理(如MPEG4編碼和譯碼、視頻濾波)和無線基礎(chǔ)設(shè)備中。基于龍芯I號CPU IP核的SoC的驗證平臺結(jié)構(gòu)如圖5所示。
圖5 中,外圍電路的主要功能是驗證SoC 中各個接口IP 模塊能否與龍芯I號IP核、外部接口單元、硬件驅(qū)動軟件和實時操作系統(tǒng)協(xié)調(diào)高效地工作。由于接口(如USB接口、UART/IrDA 接口、SPI和LCD接口等)電路結(jié)構(gòu)比較簡單,且很多資料都有介紹,在設(shè)計時,除了注意通用的設(shè)計規(guī)則和印制電路板(PCB) 布局布線外,沒有特別的要求。同時,為了便于分析各個被驗證的IP模塊在任意時刻的狀態(tài), 將Cyclone II EP2C70的大多數(shù)I/O引腳都引出到PCB上,以方便SoC開發(fā)人員使用邏輯分析儀進行信號實時采集和分析,也可讓信號發(fā)生器產(chǎn)生一些特定信號以供系統(tǒng)調(diào)試使用。該開發(fā)系統(tǒng)在設(shè)計PCB時還特別注意了電磁干擾的屏蔽問題。
2.3 SoC到FPGA的系統(tǒng)移植
使用Altera公司的FPGA開發(fā)工具QuartusII,將SoC向Cyclone II EP2C70(FPGA)移植的步驟如下:
(1)對SoC進行修改,以適合FPGA的開發(fā)環(huán)境。修改子模塊配置、RAM、FIFO等,添加PLL對所需要的時鐘進行適當(dāng)?shù)姆郑额l,或提高時鐘信號的質(zhì)量。
(2)使用QuartusII內(nèi)置綜合工具或?qū)S镁C合工具(如常見的Synplify_pro)單獨建Project,對RTL進行綜合,生成網(wǎng)表。時鐘工作頻率較高的,要寫綜合約束條件。
(3)指定每一個輸入輸出信號對應(yīng)的FPGA管腳和輸入輸出邏輯類型。
(4)編譯生成的網(wǎng)表以生成sof文件,包括優(yōu)化、適配、sof文件生成等分步驟。
(5)進行靜態(tài)時序分析,檢查是否滿足預(yù)定的時鐘頻率要求,若不能滿足,則重新進行第(2)步。如果多次進行步驟(2)仍不能滿足時序要求,則需要根據(jù)關(guān)鍵路徑對RTL代碼進行修改。
關(guān)鍵路徑是指延遲最大的路徑,該路徑的延遲限制了時鐘的最大工作頻率。該SoC芯片的最大工作頻率在266 MHz以上,與選用的FPGA Cyclone II EP2C70的總線時鐘速度相當(dāng)。
3 VxWorks實時操作系統(tǒng)
本文所設(shè)計的SoC硬件平臺上,最終將運行VxWorks操作系統(tǒng),作為此次嵌入式SoC硬件平臺設(shè)計的軟件需求和最終的驗證目標(biāo)。VxWorks是一個具有可伸縮、可裁減、高可靠性,同時適用于所有流行CPU平臺的實時操作系統(tǒng)[3]??缮炜s性指VxWorks提供了超過1 800個應(yīng)用編程接口(API)供用戶自行選擇使用;可裁減性指用戶可以根據(jù)自己的應(yīng)用需要對VxWorks進行配置,產(chǎn)生具有不同功能集的操作系統(tǒng)映像;可靠性指VxWorks可以提供非常安全的操作系統(tǒng)平臺。VxWorks的基本構(gòu)成組件包括BSP(Board Support Package)、微內(nèi)核Wind、網(wǎng)絡(luò)系統(tǒng)、文件系統(tǒng)及I/O系統(tǒng)。本文測試更關(guān)注于BSP、Wind以及I/O組件。BSP中包括硬件環(huán)境中CPU的初始化及系統(tǒng)各項硬件資源的安裝和配置,如RAM、Clock、網(wǎng)絡(luò)接口、中斷控制器等。微內(nèi)核Wind是WindRiver公司自行開發(fā)的一種嵌入式操作系統(tǒng)內(nèi)核,該內(nèi)核具有標(biāo)準(zhǔn)的嵌入式實時操作系統(tǒng)的基本特征。
4 驗證平臺的檢驗
將已經(jīng)成熟的AMBA總線IP核的Verilog代碼通過Synplify 綜合,利用Altera公司的QUARTUS Ⅱ軟件作布局布線,燒入Cyclone II EP2C70,再用同樣的方式將新開發(fā)的EMI IP 核的Verilog 代碼燒入該FPGA,將其中的SDRAM控制器作為驗證示例,選取其中最簡單的訪問方式來驗證該平臺能否使用。上電后,首先要對所有內(nèi)存區(qū)(bank) 預(yù)充電,經(jīng)8個自刷新周期后需要設(shè)置訪問模式,即編程模式寄存器。以上三個過程要求如下:
(1) 預(yù)充電命令的發(fā)出要求:在時鐘周期的上升沿處,CS、RAS、WE 為低,CAS 為高。
(2) 自刷新命令的發(fā)出要求:在時鐘周期的上升沿處,CS、RAS、CAS 和CKE 保持低,WE為高。
(3) 模式寄存器的激活:在時鐘的上升沿處,RAS、CAS、CS和WE為低。
當(dāng)要驗證各個IP模塊(包括INT 中斷控制器、DMA 控制器、LCD 控制器和AC97控制器等)之間的協(xié)同工作時,燒入的代碼較多,占用的FPGA資源也較多,再加上需要實時運行,例如播放PM3實時解碼過程中,時鐘至少要求60 MHz,需要工作的IP核有總線、DMA控制器、INT 中斷控制器、AC97 控制器等,因此在這種情況下,最好使用Multi PointSynthesis 的綜合流程和Timing driven的綜合與優(yōu)化策略,并使用Logic-lock約束技術(shù)和人工干預(yù)布局布線,以達到預(yù)期目的。使用該平臺對所開發(fā)的SoC的各個模塊進行了驗證,并在10 MHz~70 MHz條件下與代碼前(后)仿真結(jié)果和SoC實測結(jié)果進行了比較,發(fā)現(xiàn)該FPGA 驗證平臺在多模塊、高速情況下,性能有所下降,如圖6所示,需進一步提高綜合和布局布線技術(shù)。
本文設(shè)計了基于國產(chǎn)龍芯I號處理器IP核的SoC 的FPGA 驗證平臺,介紹了怎樣利用該平臺進行軟硬件協(xié)同設(shè)計、SoC系統(tǒng)移植、IP核驗證和運行實時操作系統(tǒng)。在電壓設(shè)計、模塊選用甚至處理器核的選用方面都考慮了升級擴展技術(shù),可為其他SoC的驗證所借鑒。驗證結(jié)果表明,基于龍芯I號CPU IP核的SoC可成功運行Linux嵌入式程序及VxWorks。
參考文獻
[1] KUNKEL J. Embedded computing-toward IP-based system-level soc design[J]. Computer,2003,36(5):88-89.
[2] 嚴(yán)迎建,劉明業(yè),片上系統(tǒng)設(shè)計中軟硬件協(xié)同驗證方法的研究[J].電子與信息學(xué)報,2005,27(9):317-321.
[3] Wind River System. VxWorks_BSP_R eference.www.windriver.com.2004.