文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.172445
中文引用格式: 王之光,高清運(yùn). 基于FPGA的PCIe總線接口的DMA控制器的設(shè)計(jì)[J].電子技術(shù)應(yīng)用,2018,44(1):9-12,
英文引用格式: Wang Zhiguang,Gao Qingyun. Design of DMA controller of PCIe bus interface based on FPGA[J]. Application of Electronic Technique,2018,44(1):9-12,
0 引言
隨著通信技術(shù)的不斷發(fā)展,對數(shù)據(jù)傳輸系統(tǒng)的速度與數(shù)據(jù)傳送質(zhì)量的要求也在不斷提高。由Intel在2001年提出的第三代I/O總線技術(shù)——PCI Express總線技術(shù),采用高速差分串行的方式進(jìn)行數(shù)據(jù)傳輸,具有高帶寬、高可靠性、高拓展性等優(yōu)點(diǎn),很好地彌補(bǔ)了PCI、PCI-X總線的不足[1-3]。
本文基于PCIe 2.0協(xié)議,利用Altera Transceiver PHY IP、Synopsys PCIe Core IP和AXI總線,提出了一種DMA控制器,并搭建了一個在FPGA端和PC之間的高速數(shù)據(jù)傳輸系統(tǒng)。實(shí)現(xiàn)了寄存器讀寫操作(單字讀寫)和DMA讀寫操作,并利用Synopsys VIP環(huán)境下進(jìn)行的系統(tǒng)仿真和上位機(jī)軟件進(jìn)行觀察并驗(yàn)證了數(shù)據(jù)讀寫的正確性。
1 設(shè)計(jì)方案
1.1 基礎(chǔ)模塊
1.1.1 Altera Stratix V GX系列FPGA與PCIe PHY IP
本設(shè)計(jì)使用Stratix V GX系列下的5SGXEA7K2F40C2N FPGA芯片[4],該芯片內(nèi)部集成了PCIe PHY IP硬核模塊。PCIe PHY IP硬核包括三個部分,如圖1,PHY IP Core for PCI Express(PIPE)集成了PCIe總線的物理層。Transceiver Reconfiguration Controller IP Core可以動態(tài)重新配置模擬參數(shù)。Transceiver PHY Reset Controller IP Core作為收發(fā)器的復(fù)位模塊,確保了PCIe鏈路的初始化[5-6]。
1.1.2 Synopsys IP與VIP
VIP顧名思義就是驗(yàn)證IP(Verification IP),它為一些標(biāo)準(zhǔn)的接口提供標(biāo)準(zhǔn)的總線行為模型[7]。Synopsys公司提供了PCIe總線的Controller IP,實(shí)現(xiàn)了PCIe總線數(shù)據(jù)鏈路層和事務(wù)層的功能,并內(nèi)置了DMA,同時(shí)也提供了針對PCIe總線的VIP,為PCIe總線提供了標(biāo)準(zhǔn)的總線行為模型,模擬了上位機(jī)的功能[8]。
1.1.3 AXI總線
AXI(Advanced eXtensible Interface)總線是一種高性能、高帶寬、低延遲的總線協(xié)議,有一個顯著的特點(diǎn),地址/控制和數(shù)據(jù)通道是分開的,共有5個單向通道,分別為read address channel,write address channel,read data channel,write data channel,write response channel[9],減少了延時(shí),提高了DMA的效率。
1.2 總體方案設(shè)計(jì)
本設(shè)計(jì)采用的整體架構(gòu)如圖2所示,為Altera PHY IP+Synopsys PCIe Core IP+AXI總線+Application。
為了利用Synopsys 的PCIe VIP環(huán)境,采用了Synopsys PCIe Core IP。在PCIe事務(wù)層和應(yīng)用側(cè)之間采用了AXI總線接口,可以在以后的設(shè)計(jì)中進(jìn)行方便的拓展和替換。應(yīng)用側(cè)設(shè)計(jì)實(shí)現(xiàn)了PCIe DMA控制器的功能,并集成了兩塊RAM,一塊大小為128 DW,用來存儲寄存器讀寫的數(shù)據(jù);另一塊大小為512 DW,用來存儲DMA讀寫的數(shù)據(jù)。
2 DMA控制器的設(shè)計(jì)與實(shí)現(xiàn)
2.1 應(yīng)用端DMA操作流程
應(yīng)用端發(fā)起的DMA操作流程如圖3所示,最終DMA讀操作實(shí)現(xiàn)的結(jié)果為將主機(jī)側(cè)的數(shù)據(jù)以DMA的方式寫入到應(yīng)用端的內(nèi)存中。DMA寫操作實(shí)現(xiàn)的結(jié)果為將應(yīng)用端的數(shù)據(jù)以DMA的方式寫入到主機(jī)側(cè)的內(nèi)存中。圖3為應(yīng)用端發(fā)起的DMA操作具體的流程。
(1)主機(jī)側(cè)通過寄存器寫的方式,將DMA讀寫標(biāo)志、DMA長度、DMA源和目的內(nèi)存地址寫入到應(yīng)用端的寄存器中;
(2)應(yīng)用端中的Slave模塊將這些命令發(fā)送給Master模塊;
(3)Master模塊按照Synopsys PCIe Core IP自定義的Dbi總線的方式,再將這些命令傳送給PCIe Core IP內(nèi)部的寄存器;
(4)PCIe Core IP接收DMA讀寫指令,并持續(xù)操作Master接口以實(shí)現(xiàn)后續(xù)操作;
(5)當(dāng)為DMA讀時(shí),PCIe Core IP的內(nèi)置DMA從主機(jī)側(cè)的“源內(nèi)存地址”中讀取到目標(biāo)數(shù)據(jù);當(dāng)為DMA寫時(shí),PCIe Core IP的Master接口通過AXI總線以讀的方式從“源內(nèi)存地址”讀取到目標(biāo)數(shù)據(jù);
(6)當(dāng)為DMA讀時(shí),PCIe Core IP的Master獲得DMA讀取到的目標(biāo)數(shù)據(jù),并通過AXI總線,以寫的方式寫入到應(yīng)用端的“目的內(nèi)存地址”中;當(dāng)為DMA寫時(shí),Master獲得目標(biāo)數(shù)據(jù)后,內(nèi)置DMA將數(shù)據(jù)發(fā)送到主機(jī)側(cè)的“目的內(nèi)存地址”中;
(7)當(dāng)DMA操作完成,PCIe Core IP會通知應(yīng)用端的中斷模塊;
(8)應(yīng)用端的中斷模塊會向主機(jī)側(cè)提交中斷。
2.2 應(yīng)用端DMA控制狀態(tài)機(jī)
應(yīng)用端只需將主機(jī)側(cè)寫入的DMA讀寫標(biāo)志、DMA長度、DMA源和目的內(nèi)存地址以及DMA啟動信號寫入到PCIe Core IP中的內(nèi)部寄存器,并等待DMA操作的完成,給出中斷信號。
下面為應(yīng)用端詳細(xì)的DMA控制狀態(tài)機(jī),如圖4所示,狀態(tài)機(jī)把DMA讀操作和DMA寫操作整合到了一起,減少了代碼量。
(1)IDLEPHASE:空閑狀態(tài)。當(dāng)啟動信號start_flag有效時(shí),跳轉(zhuǎn)ENGINE_ENABLE狀態(tài);
(2)ENGINE_ENABLE:判斷DMA讀寫類型信號wr_rdn_flg,當(dāng)wr_rdn_flg為0,即為DMA讀(PC到FPGA)時(shí),使能DMA讀引擎;當(dāng)wr_rdn_flg為1,即為DMA寫(FPGA到PC)時(shí),使能DMA寫引擎;
(3)DMA_TRANS_SIZE:設(shè)置DMA數(shù)據(jù)傳輸長度,最多一次傳輸512 DW,最少一次傳輸1 DW;
(4)DMA_SAR:設(shè)置DMA操作源地址(當(dāng)為DMA讀時(shí),源地址為主機(jī)端地址;當(dāng)為DMA寫時(shí),源地址為應(yīng)用端地址);
(5)DMA_DAR:設(shè)置DMA操作目的地址(當(dāng)為DMA讀時(shí),目的地址為應(yīng)用端地址;當(dāng)為DMA寫時(shí),目的地址為主機(jī)端地址);
(6)DMA_DOORBELL:使能DMA操作門鈴信號dma_strt,啟動DMA操作;
(7)DMA_WAIT_INT:等待DMA操作完成;
(8)DMA_INT_STATUS:讀取DMA操作中斷寄存器狀態(tài),當(dāng)DMA操作完成信號dma_done有效時(shí),產(chǎn)生完成中斷,并跳轉(zhuǎn)DMA_CLEAR_INT狀態(tài);
(9)DMA_CLEAR_INT:清除中斷,回到IDLEPHASE狀態(tài),準(zhǔn)備下一次DMA傳輸。
3 DMA控制器功能驗(yàn)證
3.1 仿真驗(yàn)證
在完成代碼編寫之后,在VIP環(huán)境下搭建仿真平臺,使用Synopsys公司的仿真驗(yàn)證工具VCS進(jìn)行功能測試,主要測試驗(yàn)證模塊能否正確對寄存器讀寫和DMA讀寫產(chǎn)生正確的反應(yīng)。
從圖5、圖6中可以看到,寫地址偏移為0x40,寫數(shù)據(jù)為32’h87654321;讀地址偏移為0x40,讀數(shù)據(jù)為32’h87654321,由此可判斷寄存器讀寫正確。
如圖7所示,由dma_strt和dma_done信號可以看出為2次DMA傳輸,由dma_wr_rdn可看出第一次為DMA讀操作(RC端到APP側(cè)),第二次為DMA寫操作(APP側(cè)到RC端)由dma_bc_len可看出當(dāng)前DMA操作長度為2 000 Byte,即500 DW,slv_rdata和slv_wdata信號較為密集的部分分別為2次DMA操作的數(shù)據(jù),對比這兩次數(shù)據(jù),得知DMA操作正確。
為了更加方便地比較結(jié)果,采取自動對比文件的方法,即把寄存器或DMA寫的數(shù)據(jù)存放到一個文件中,再把寄存器或DMA讀回的數(shù)據(jù)存放到另一個文件中,通過對比兩個文件,判斷寄存器和DMA傳輸是正確的。
3.2 FPGA測試驗(yàn)證
在仿真驗(yàn)證完成之后,進(jìn)行FPGA測試驗(yàn)證,將硬件部分燒錄到板卡的FPGA芯片后,通過板卡的PCIe金手指插入到PC機(jī)的主板上,PC機(jī)重啟后檢測到PCIe硬件的插入,即可安裝對應(yīng)的PCIe驅(qū)動軟件,利用上位機(jī)進(jìn)行測試。
上位機(jī)軟件界面如圖8所示,包括寄存器讀寫(Target操作)和DMA讀寫(Master操作)測試模塊。
選擇“Target”操作的“dual”模式,寄存器長度設(shè)置為118,因?yàn)榍?0個寄存器與DMA操作相關(guān),可能會觸發(fā)DMA操作,所以在軟件中選擇跳過。點(diǎn)擊“啟動測試”,數(shù)據(jù)將會被先從主機(jī)側(cè)寫到FPGA,再從FPGA讀回到主機(jī)側(cè),比較兩次寄存器操作的數(shù)據(jù),即可判斷寄存器操作的正確性。
如圖9所示,選擇“Master”操作的“dual”模式,點(diǎn)擊“memory”,即在PC側(cè)開辟一塊內(nèi)存存放數(shù)據(jù),然后點(diǎn)擊“啟動測試”,數(shù)據(jù)先從PC寫到FPGA的RAM中,接著再從FPGA回到PC,比較存放到PC內(nèi)存的數(shù)據(jù)和從FPGA寫回到PC的數(shù)據(jù),即可判斷DMA讀寫操作的正確性。
根據(jù)DMA傳輸固定大小的數(shù)據(jù)的時(shí)間,可以計(jì)算出DMA讀寫速率,經(jīng)過多次測試,DMA讀寫速率分別為1 547 MB/s和1 607 MB/s。本設(shè)計(jì)采用的是PCIe Gen2、×4通道,理論最大傳輸速率為2 000 MB/s。分析代碼得出可能由于應(yīng)用端向PCIe Core IP寫入和讀取數(shù)據(jù)過程占用了一定的時(shí)間,另外驅(qū)動程序向DMA寄存器寫入或讀取參數(shù)也占用了一些時(shí)間,都會影響速率。
4 結(jié)語
本文實(shí)現(xiàn)的基于FPGA的PCIe總線接口的DMA控制器是在Altera PHY IP和Synopsys Core IP的基礎(chǔ)上實(shí)現(xiàn)的,利用Synopsys VIP驗(yàn)證環(huán)境進(jìn)行了功能仿真驗(yàn)證,并通過FPGA進(jìn)行了系統(tǒng)實(shí)測,達(dá)到了較高的傳輸速率,在Gen2、×4模式下,DMA讀寫操作的帶寬分別為 1 547 MB/s和1 607 MB/s,達(dá)到了預(yù)期的設(shè)計(jì)目標(biāo)。
參考文獻(xiàn)
[1] 陳剛,張京,唐建.一種基于FPGA的PCIe總線及其DMA的設(shè)計(jì)方法[J].兵工自動化,2014,33(5):75-77.
[2] 張彪,宋紅軍,劉霖,等.基于PCIE接口的高速數(shù)據(jù)傳輸系統(tǒng)設(shè)計(jì)[J].電子測量技術(shù),2015,38(10):113-117.
[3] NAMBIAR S O S,ABHYANKAR Y,CHANDRABADU S.Migrating FPGA based PCI Express Gen1 design to Gen2[C].2010 International Conference on Computer and Communication Technology(ICCCT).2010.
[4] Altera Corporation.Stratix V GX FPGA development board reference manual[EB/OL].www.altera.com,2014.
[5] Altera Corporation.Altera Transceiver PHY IP Core User Guide[EB/OL].www.altera.com,2016.
[6] Altera Corporation. IP Compiler for PCI Express User Guide[EB/OL].www.altera.com,2014.
[7] 陳靜.基于ARM的USB2.0-AHB總線橋IP的驗(yàn)證方法研究以及設(shè)計(jì)實(shí)現(xiàn)[D].成都:電子科技大學(xué),2007.
[8] Synopsys.DesignWare PCI Express VIP User Manual[EB/OL].www.synopsys.com/products/designware/docs,2010.
[9] AMBA AXI and ACE Protocal Specification[EB].www.arm.com,2011.