123,123

基于FPGA的PCI Express总线接口设计

摘要： 使用FPGA来设计PCIE总线扩展卡，可以省去专用的PCIE接口芯片，降低了硬件设计成本，提高了硬件的集成度。利用FPGA的可编程特性，大大提高了设计灵活性、适应性和可扩展性。

關(guān)鍵詞： 接口IC PCIE总线 DMA传输 PCIE协议

Abstract：

Key words :

　 PCIE(PCI express)是用來互聯(lián)諸如計算機(jī)和通信平臺應(yīng)用中外圍設(shè)備的第三代高性能I/0總線。PCIE體系結(jié)構(gòu)繼承了第二代總線體系結(jié)構(gòu)最有用的特點，采用與PCI相同的使用模型和讀/寫通信模型，支持各種常見的事務(wù)。其存儲器、I/0和配置地址空間與PCI的地址空間相同。由于地址空間模型沒有變化，所以現(xiàn)有的OS和驅(qū)動軟件無需進(jìn)行修改就可以在PCIE系統(tǒng)上運(yùn)行。

　　PCIE是串行協(xié)議，與原有的PCI并行總線相比，它沒有大量的數(shù)據(jù)和控制線，對于硬件電路設(shè)計者來說，省去了很多硬件設(shè)計工作。PCIE的傳輸速度遠(yuǎn)遠(yuǎn)大于PCI總線，PCIE1.1版本單個鏈路的單向吞吐量能達(dá)到250 MB/s。對于需要與主機(jī)進(jìn)行大容量傳輸?shù)南到y(tǒng)來說，該總線標(biāo)準(zhǔn)的優(yōu)勢是非常明顯的。

　　由于PCIE總線硬件設(shè)計簡單，吞吐量大，軟件向下兼容，只要找到合適的總線接口芯片，很容易將現(xiàn)有的PCI總線設(shè)備升級為PCIExpress設(shè)備。Altera公司最新推出的EP2SGX90系列的芯片，給用戶提供了PCIE接口IP核。本文將結(jié)合實際的應(yīng)用，詳細(xì)介紹該IP核的使用情況，包括寄存器設(shè)置，DMA操作等。

　　1 功能描述及參數(shù)設(shè)置

　　按照PCIE協(xié)議的要求，該FPGA的IP核也采用三層體系結(jié)構(gòu)，即傳輸層、數(shù)據(jù)鏈路層和物理層。這三層功能模塊完成了PCIE的協(xié)議轉(zhuǎn)換，在傳輸層上給開發(fā)人員提供了非常豐富的接口。開發(fā)人員的所有開發(fā)，包括DMA傳輸等都是在傳輸層以上進(jìn)行的。

　　傳輸層(transaction layer)：完成TLP(數(shù)據(jù)傳輸包)的收發(fā)，含有虛擬信道(VC)緩沖區(qū)，具有端口仲裁、VC仲裁、流控制、數(shù)據(jù)重新排序和數(shù)據(jù)校驗等功能。

　　數(shù)據(jù)鏈路層(data link layer)：數(shù)據(jù)鏈路層的主要功能是保證在各鏈路上發(fā)送和接收數(shù)據(jù)包時數(shù)據(jù)的完整性。在接收端，對數(shù)據(jù)進(jìn)行嚴(yán)格的CRC校驗，如果有錯誤，會給發(fā)送方返回1個NAK信號。發(fā)送端具有重傳緩沖區(qū)，如果收到NAK信號，則把數(shù)據(jù)重新發(fā)送1次。

　　物理層(physical layer)：對于發(fā)送端，接收數(shù)據(jù)鏈路層的數(shù)據(jù)包，把這些數(shù)據(jù)進(jìn)行8 b/10 b編碼，送到串行發(fā)送器上;對于接收端則剛好相反，收到串行碼后，先解碼，然后送給數(shù)據(jù)鏈路層。

　　在生成PCIE的IP核時，至少選擇2個存儲區(qū)，一個是BAR[1：O]，用作用戶開發(fā)板的擴(kuò)展存儲區(qū)用;還有一個是BAR2，下面所有的寄存器操作都是基于該地址的。新生成的IP核不帶有DMA功能，但是在工程文件夾下面有一個xxxx_examples(xxx代表工程名稱)的文件夾，文件夾里有簡單DMA和鏈?zhǔn)紻MA的例子代碼，開發(fā)者只需要對這些代碼進(jìn)行修改，就能開發(fā)出適合自己的DMA功能模塊。

　　2 簡單DMA

　　該DMA傳輸模式相對比較簡單，只需要對相應(yīng)的寄存器進(jìn)行設(shè)置即可完成，DMA傳輸步驟如下所示，每進(jìn)行1次DMA傳輸，都需要按照下面的步驟進(jìn)行1次設(shè)置。下面所述的偏移量都是相對于BAR2地址。

　　(1)設(shè)置偏移量為0x00和0x04的寄存器，寫入DMA傳輸?shù)闹鳈C(jī)端地址;

　　(2)設(shè)置偏移量為0x14的寄存器，寫入DMA傳輸?shù)腜CIE端點地址;

　　(3)在偏移量為0x08的寄存器中寫入本次DMA傳輸?shù)拈L度，以字節(jié)為單位;

　　(4)設(shè)置偏移量為0x0C的寄存器，設(shè)置DMA傳輸?shù)膶傩?，對該寄存器的寫操作將啟動本次DMA傳輸;

　　(5)讀取0x0C的寄存器DMA傳輸狀態(tài)位，察看本次DMA是否完成。

《電子設(shè)計技術(shù)》網(wǎng)站版權(quán)所有，謝絕轉(zhuǎn)載

　　3 鏈?zhǔn)紻MA

　　鏈?zhǔn)紻MA是一種效率遠(yuǎn)遠(yuǎn)高于簡單DMA的傳輸方式，它只需要1次啟動操作，就可以完成多次DMA傳輸。這里將結(jié)合實際使用情況，詳細(xì)介紹鏈?zhǔn)紻MA的傳輸過程。

　　3.1 描述符表

　　實現(xiàn)鏈?zhǔn)紻MA傳輸時，需要開發(fā)人員在主機(jī)內(nèi)存中開辟一塊空間，用來存儲描述符表，它由一個表頭和多個描述符組成，其中每一個描述符對應(yīng)一次DMA操作。用戶根據(jù)自己的需求填寫該描述符表，關(guān)于該描述符表的詳細(xì)說明如表1和表2所示。

鏈?zhǔn)紻MA傳輸時用來存儲描述符表說明圖

　控制區(qū)域中含有一些控制信息，其中第16位用來控制傳輸方向，為O是DMA寫，為1是DMA讀，這里的讀/寫是以主機(jī)端為參考的，如果以PCIE核為參考，方向剛好相反。第18位用來使能DMA傳輸計數(shù)，如果該位使能為1，那么在DMA傳輸過程中，PCIE核每完成1次DMA操作，都會進(jìn)行1次計數(shù)操作，然后把這個計數(shù)結(jié)果傳送給主機(jī)，主機(jī)把這個結(jié)果填寫到描述符表的RCLAST字段中。

　　表大小是指本次鏈?zhǔn)紻MA操作對應(yīng)的描述符個數(shù)，每個描述符對應(yīng)一次DMA操作。

　　RCLAST是一個計數(shù)單元，它有兩個作用，在鏈?zhǔn)紻MA傳輸前，表示還有多少個DMA操作等待傳輸，由于它是從0開始計數(shù)的，所以這個值等于表大小減1。還有一個重要作用是在鏈?zhǔn)紻MA傳輸過程中，用來表示鏈?zhǔn)紻MA傳輸?shù)臓顟B(tài)。如上所述，如果控制區(qū)域的第18位設(shè)置為1，那么每完成1次DMA操作，主機(jī)都會更新這個計數(shù)器。當(dāng)計數(shù)器的數(shù)值(也是從O開始計數(shù)的)等于前面設(shè)置的期望傳輸?shù)腄MA次數(shù)，就表示鏈?zhǔn)紻MA傳輸操作結(jié)束。開發(fā)人員可以用這個狀態(tài)單元來察看本次傳輸是否結(jié)束，從而開始一個新的傳輸周期。

　　DMA長度用來設(shè)置本描述符對應(yīng)的DMA傳輸?shù)拈L度，是以32位為單位的。主機(jī)端地址用來指示數(shù)據(jù)存放存放的位置。

　　3. 2 實現(xiàn)范例

　　根據(jù)上面介紹的描述符表，下面給出一個鏈?zhǔn)紻MA讀的驅(qū)動程序例子。首先生成一個描述符表，然后把描述符表表頭的4個字段的內(nèi)容分別寫入BAR2地址偏移量為0x0，0x4，0x8和0xC寄存器中。寫完后即開始此次鏈?zhǔn)紻MA讀傳輸，while循環(huán)用于等待鏈?zhǔn)紻MA結(jié)束。從下面的代碼可以看出，2個描述符對應(yīng)2次DMA操作。

鏈?zhǔn)紻MA讀的驅(qū)動程序

　圖1是用SignalTap工具獲取的鏈?zhǔn)紻MA讀時序圖。PCIE核接收tx_req0請求信號，然后給出一個tx_ack0，同時將tx_dr0置為有效，該信號套住的TXData就是需要讀取的有效數(shù)據(jù)。在每次DMA結(jié)束之后，PCIE核都會用同樣的控制邏輯給主機(jī)傳送1個已完成DMA次數(shù)的狀態(tài)字，如圖1中的44040000h。

鏈?zhǔn)紻MA傳輸時序圖

鏈?zhǔn)紻MA傳輸時序圖

　4 性能測試

　　在做總線性能測試時，采用鏈?zhǔn)紻MA傳輸方式，共4個描述符表。根據(jù)實際使用的PCIE總線通道數(shù)和DMA長度的不同，實際測試得到的總線速度也不同，表3給出了參考數(shù)據(jù)。

總線性能測試圖

　　5 結(jié)語

　　使用FPGA來設(shè)計PCIE總線擴(kuò)展卡，可以省去專用的PCIE接口芯片，降低了硬件設(shè)計成本，提高了硬件的集成度。利用FPGA的可編程特性，大大提高了設(shè)計靈活性、適應(yīng)性和可擴(kuò)展性。PCIE總線提供了高速、獨享的數(shù)據(jù)交換通道，確保在大數(shù)據(jù)量的數(shù)據(jù)交換時不會出現(xiàn)瓶頸，而且作為新一代總線，它使系統(tǒng)在獲得更高性能的同時，具有了良好的升級性。

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容