摘? 要: 介紹一種使用PCI宏核邏輯進行的更加簡單高效的PCI接口設計方法。該方法將PCI接口和PCI用戶邏輯集成在一片F(xiàn)PGA里,可以對整個邏輯進行仿真調試,大大縮短了開發(fā)周期、提高了系統(tǒng)集成度和性能。重點敘述了ALTERA公司提供的32位TARGET接口宏核pci_t32的原理和結構,分析了時序設計要點,給出了典型應用的邏輯設計" title="邏輯設計">邏輯設計框圖和注意事項。
關鍵詞: PCI總線? 接口? 現(xiàn)場可編程邏輯陣列? 仿真
?
1 PCI總線及其接口概述
PCI總線是高速同步總線,具有32bit總線寬度,工作頻率是33MHz,最大傳輸率為132Mbyte/s,遠遠大于ISA總線5Mbyte/s的速率。PICMG(PCI工業(yè)計算機制造商聯(lián)盟)制定的更加堅固耐用的Compact PCI總線規(guī)范,支持64位總線寬度,66MHz工作頻率,最大傳輸率為528Mbyte/s?;赑C機的高速數(shù)據(jù)采集系統(tǒng)和各種虛擬儀器,幾乎都選擇了PCI總線。在現(xiàn)代高速通訊、測試等領域的嵌入式應用中,Compact PCI總線大有超過VME和VXI總線的趨勢。PCI的高性能、高效率以及與現(xiàn)有標準的兼容性和充裕的發(fā)展?jié)摿Γ瞧渌偩€所不能及的,被計算機界公認為最具高瞻遠矚的局部總線標準。
PCI總線接口相對其它總線接口來說是比較復雜的,它不但有著嚴格的同步時序要求,而且為了實現(xiàn)即插即用和自動配置,PCI接口還必須有許多配置寄存器" title="配置寄存器">配置寄存器。根據(jù)用戶設備的性質不同,PCI設備分為MASTER(主設備)和TARGET(從設備),因此PCI接口類型也就分為MASTER和TARGET兩種接口。概括地說,PCI接口主要包括PCI標準配置寄存器(64字節(jié))、PCI 總線邏輯接口、用戶設備邏輯接口、數(shù)據(jù)緩沖區(qū)等。
作為一般應用設計工程師,為縮短開發(fā)周期,沒有必要自己去設計全部的復雜的接口邏輯,甚至可以不必完全理解PCI規(guī)范的細節(jié),就能進行PCI用戶設備的設計。目前,市場上有一些專用PCI接口芯片,如AMCC公司的S5920(TARGET接口)、S5933(MASTER接口)等。使用這些專用PCI接口芯片,設計者只需要使用地址線、數(shù)據(jù)線以及少數(shù)幾個讀寫控制信號,就能實現(xiàn)PCI總線與PCI用戶設備之間的連接,類似ISA總線接口那么簡單方便。
隨著FPGA(現(xiàn)場可編程邏輯陣列)技術的快速發(fā)展,萬門以上乃至幾十萬門邏輯陣列的使用越來越普遍,F(xiàn)PGA的單片價格也大幅度下降。與專用PCI接口芯片相似,很多FPGA制造商都提供了PCI接口宏核邏輯(PCI MegaCore)。設計者可以將PCI用戶邏輯與PCI MegaCore集成在一片F(xiàn)PGA里,并且可以在頂層通過仿真來驗證PCI接口以及用戶邏輯設計的正確與否,這樣可以大幅度提高調試速度,縮短開發(fā)周期,提高電路板的集成度和系統(tǒng)的性能。
ALTERA公司提供了多種不同功能的PCI MegaCore,例如:pci_a(帶有DMA的32位MASTER/TARGET接口),pci_mt64(支持64位的MASTER/TARGET接口),pci_mt32(32位的MASTER/TARGET接口),pci_t64(支持64位的TARGET接口),pci_t32(32位的TARGET接口)等。不同的PCI MegaCore占用的資源是不同的,設計者可以根據(jù)PCI用戶設備的需求來選擇。
本文將介紹ALTERA公司提供的最簡單的32位PCI TARGET接口宏核邏輯pci_t32。重點介紹利用pci_t32進行PCI接口設計的方法及應用注意事項,并給出具體設計實例。其它PCI MegaCore的設計方法與此相類似。本文不介紹有關PCI規(guī)范的細節(jié)內容。
2 Pci_t32 MegaCore的內部結構及外圍信號
Pci_t32 是ALTERA公司提供的最簡單的32位PCI TARGET接口宏核邏輯,支持33MHz和66MHz的PCI時鐘。
Pci_t32內部結構包含如下幾個模塊:
PCI總線配置寄存器,是符合PCI規(guī)范2.2版規(guī)定的所有配置寄存器。配置寄存器用于識別設備、控制PCI總線功能、提供PCI總線狀態(tài)等。
奇偶校驗模塊,用于對數(shù)據(jù)、地址、命令等進行奇偶校驗。
PCI側TARGET控制模塊(PCI target control block),用于控制pci_t32(作為TARGET)與PCI總線的各種操作。
用戶設備側TARGET控制模塊(local target control block),用于控制pci_t32(作為TARGET)與用戶邏輯的各種操作。
用戶設備側地址/數(shù)據(jù)/命令/字節(jié)使能模塊,接收和輸出用戶側的所有地址/數(shù)據(jù)/命令/字節(jié)使能等信號。
Pci_t32內部功能模塊及周邊信號如圖1所示。左側PCI信號是符合PCI規(guī)范的標準信號,在這里不多加解釋。下面重點介紹右側用戶邏輯接口local信號:
?
?
l_adi[31:0],local側地址、數(shù)據(jù)輸入信號" title="輸入信號">輸入信號。
l_cbeni[3:0],local側命令、字節(jié)使能輸入信號,位定義及時序符合PCI規(guī)范。
l_dato[31:0],local側數(shù)據(jù)輸出信號。
l_adro[31:0],local側地址輸出信號。
l_beno[3:0],local側字節(jié)使能輸出信號,位定義及時序符合PCI規(guī)范。
l_cmdo[3:0],local側命令輸出信號,位定義及時序符合PCI規(guī)范。
lt_rdyn,local側目標設備準備好信號(target ready),對pci_t32是輸入信號。
lt_discn,local側目標設備通過置低該信號請求pci_t32向PCI 側主設備發(fā)出斷開連接信號(disconnect request),對pci_t32是輸入信號。
lt_abortn,local側目標設備通過置低該信號來請求pci_t32向PCI 側主設備發(fā)出放棄操作信號,對pci_t32是輸入信號。
lt_irqn,local側目標設備中斷請求信號,對pci_t32是輸入信號。
lt_framen,PCI主設備通過pci_t32讀寫local側目標設備時,pci_t32置低該信號(輸出信號)。
lt_ackn,當為目標寫操作時,PCI_t32置低該信號(輸出信號),表示數(shù)據(jù)有效;當為目標讀操作時,PCI_t32置低該信號(輸出信號),表示已準備好讀數(shù)。
lt_dxfrn,輸出信號,表示local 目標設備數(shù)據(jù)傳輸成功。
lt_tsr[11:0],輸出信號,控制local目標設備狀態(tài)寄存器。
cmd_reg[5:0],配置命令寄存器輸出信號。bit0,I/O" title="I/O">I/O操作使能;bit1,Memory操作使能;bit2,保留;bit3,memory寫無效使能;bit4,奇偶校驗出錯響應使能;bit5,系統(tǒng)出錯響應使能。
stat_reg[5:0],配置狀態(tài)寄存器輸出信號。
3?讀寫操作時序分析與設計要點
pci規(guī)范中定義了兩種讀寫操作,即Memory和I/O的讀寫。pci_t32的讀寫操作包括:32位的Memory單周期" title="單周期">單周期讀寫、Memory猝發(fā)讀寫、I/O單周期讀寫以及配置讀寫。Pci_t32 的Memory讀寫分為單周期和猝發(fā)兩種模式,而I/O的讀寫只有單周期模式。所謂猝發(fā)模式,即在給出首地址后,主設備連續(xù)讀寫多個數(shù)據(jù),用戶設備應能對首地址自動加1。配置讀寫是指pci主設備對pci_t32的配置空間寄存器進行讀寫操作,pci主設備與pci_t32之間的接口是無縫連接。本文只分析32位Memory單周期讀寫時序,其它模式的讀寫時序大同小異,此略。
3.1? Memory 讀操作
pci_t32的單周期memory read操作時序如圖2所示。
?
?
時序分析及用戶邏輯設計要點:pci主設備在第2個clk給出要讀的目標地址ad[31:0]和Memory讀命令cben[3:0]=6,pci_t32在第3個clk向用戶設備給出讀目標地址l_adro[31:0]和Memory讀命令l_cmdo[3:0]=6。用戶設備要對l_cmdo[3:0]譯碼來判斷是何種操作,對l_adro[31:0]譯碼來選擇目標地址。在lt_framen輸出為低的下個時鐘周期,若用戶設備邏輯準備好要輸出的數(shù)據(jù),可以置低lt_rdyn。若用戶邏輯沒有準備好,可以延遲置低lt_rdyn來產生延時等待周期。當lt_dxfrn輸出為低電平時(第6個clk),pci用戶設備必須將目標地址的數(shù)據(jù)D0放到l_adi[31:0],用戶邏輯可以用lt_dxfrn來作為存儲單元的輸出使能信號(/Output Enable)。這樣,在第7個clk的上升沿pci_t32可以采樣到數(shù)據(jù)D0。在第8個clk的上升沿pci主設備可以得到數(shù)據(jù)D0。
3.2 Memory寫操作
pci_t32的單周期memory 寫操作時序如圖3所示。
?
?
時序分析及用戶邏輯設計要點:pci主設備在第2個clk給出要寫的目標地址ad[31:0]和Memory寫命令cben[3:0]=7,pci_t32在第3個clk向用戶設備給出寫目標地址l_adro[31:0]和Memory寫命令l_cmdo[3:0]=7。用戶設備要對l_cmdo[3:0]譯碼來判斷是何種操作,對l_adro[31:0]譯碼來選擇目標地址。在lt_framen輸出為低的下個時鐘周期,若用戶設備邏輯準備好接收pci_32t寫的數(shù)據(jù),可以置低lt_rdyn。若用戶邏輯沒有準備好,可以延遲置低lt_rdyn來產生延時等待周期。當lt_dxfrn輸出為低電平時(第7個clk),pci_t32已經將輸出的有效數(shù)據(jù)放在l_dato[31:0]上,pci用戶設備必須在第8個clk的上升沿將l_dato[31:0]輸出的數(shù)據(jù)D0鎖存至目標地址l_adro[31:0],用戶設備邏輯可以用第8個clk的上升沿來作為鎖存器的鎖存時鐘,用lt_dxfrn作為鎖存器的鎖存使能信號(/Latch Enable)或存儲單元的寫使能信號(/Write Enable)。
4 應用設計實例及注意事項
筆者已經成功地將pci_t32用于一個compact PCI的TARGET控制模塊中。在這個模塊中,主設備Master通過pci_t32來讀寫64個32bit控制寄存器,再由這些寄存器組去控制外部設備。在本系統(tǒng)的FPGA里,還有仲裁器等其它邏輯,PCI時鐘是33MHz,芯片選用的是EPF10K100EQC240-2。系統(tǒng)邏輯設計的框架如圖4所示。在寄存器組里還有一些簡單的選通、三態(tài)控制等邏輯,此略。l_adro[6:0]譯碼選擇寄存器組里的目標寄存器。當/WE有效時,l_dato[31:0]上是pci_t32輸出的有效數(shù)據(jù);當/OE有效時,寄存器組必須將要輸出的數(shù)據(jù)放到l_adi[31:0]總線上。
?
?
在使用pci_t32時,還有一些值得注意的地方,如下所述:
(1)用戶邏輯的時鐘(本系統(tǒng)的寄存器組的時鐘clk)與進入pci_t32的時鐘必須是同一個時鐘,并且在定義管腳時應選用全局時鐘線(global clock)。這樣,可以保證時鐘的同步,提高系統(tǒng)的性能。
(2)從庫中調出pci_t32.gdf的symbol,在其右上角,可以看到一些默認設置,雙擊這些參數(shù),可以改變設置。包括:DEVICE_ID、REVISION_ID、CLASS_CODE、VENDOR_ID、基地址等PCI標準配置寄存器。
(3)選擇芯片主要考慮兩個因素:容量和速度。芯片容量包括片內的邏輯單元和可用I/O管腳數(shù)。芯片速度主要由PCI系統(tǒng)工作的時鐘頻率以及用戶邏輯的大小和優(yōu)化程度兩方面決定。
pci_t32的資源占用較小,在用EPF10K100EFC484-1芯片編譯時,占用621個LC(Logic Cell)。而PCI 宏核pci_a,在用EPF10K100EFC484-1芯片編譯時,占用923個LC。EPF10K100共有約5000個LC。
Altera的FPGA有多種容量和速度級,一般來說,-1速度級的芯片可以滿足66MHz時鐘的PCI時序要求,-2速度級的芯片只能滿足33MHz時鐘的PCI時序要求。
速度和容量是否能滿足用戶的要求,必須要進行仿真才能最終確定。
現(xiàn)在FPGA的價格日漸下降,大容量的FPGA使用越來越普遍。各家芯片供應商都提供了各種 PCI宏核邏輯。設計者可以將PCI用戶邏輯與PCI接口宏核邏輯集成在一片F(xiàn)PGA里,在頂層通過仿真來驗證PCI接口以及用戶邏輯設計的正確與否。這樣,可以大幅度提高調試速度,縮短開發(fā)周期,提高電路板的集成度和系統(tǒng)性能??梢钥隙ǖ仡A言,使用PCI接口宏核邏輯來進行PCI接口設計是今后設計PCI接口的主要方法。PCI接口宏核邏輯將會受到越來越多的設計工程師的青睞。
?
參考文獻
1 ALTERA? Device Data Book 1999.ALTERA,1999
2 PCI MegaCore Function User Guider,Version 1.0. ALTERA,1999年12月
3 金 革.可編程邏輯陣列FPGA和EPLD.合肥:中國科技大學出版社,1996