0 引言
二十世紀六七十年代,集成電路技術取得了大幅進步,大量元件可以集成到一個小小的芯片上,因此,當時的計算機系統(tǒng)便開始普遍采用并行通訊處理機制。但是,隨著技術進步和速度需求的提升,人們發(fā)現(xiàn),并行通訊也存在很多弊端,比如碼間串擾,時鐘混亂,傳輸距離受限,傳輸線造價高等。
最近幾年,在接口互聯(lián)技術范圍內(nèi),高速串行接口正在迅速取代并行拓撲結構而成為流行的接口標準。當今很多公用互連標準(如USB,PCIExpress,Serial ATA)都是基于串行傳輸來實現(xiàn)速度的躍升。串行接口技術的開發(fā)也迅速在全世界走紅。
為了迎合串行高速接口技術開發(fā)的廣闊前景,Xilinx公司在推出的Virtex-5 FPGA以及配套的Virtex-5 RocketIOTM GTP收發(fā)中開始支持多種協(xié)議,如SATA2.0傳輸協(xié)議。SATA (Serial ATA),即串行高級技術附加裝置,該協(xié)議于2001年發(fā)布,是目前主流的主機硬盤互聯(lián)標準,該標準采用差分信號串行傳輸數(shù)據(jù),進而解決了IDE硬盤由于串擾而導致的傳輸速率受限問題。2002年,Serial ATA委員會確立的Serial ATA 2.0規(guī)范可對外提供3.0Gb/s的傳輸速率,并支持熱插拔NCO,磁盤陣列等功能。2005年,SATA2.0產(chǎn)品正式上市。此外,Virtex-5 Rock-etI0TM GTP收發(fā)器還可以完成內(nèi)部8B/10B轉換,但是,Virtex-5 RocketIOTMGTP進行8B/10B轉換時,處理的目標數(shù)據(jù)以字節(jié)為單位,即并行數(shù)據(jù)接收端的最大位寬為16bit,而SATA2.0協(xié)議中定義的數(shù)據(jù)處理單位是雙字(DW:Double Words),同時,F(xiàn)PGA中設計的數(shù)據(jù)處理邏輯也是根據(jù)協(xié)議的要求而定義為75MHz的時鐘域來進行處理,因此,在將數(shù)據(jù)交給FPGA中的數(shù)據(jù)處理主體邏輯之前,還必須進行等速率的時鐘域和位寬的轉換。
為此,本文在對Virtex-5 RocketIOTM GTP進行了解的基礎上,針對串行高速接口開發(fā)中位寬不匹配的問題,提出了一種位寬轉換方法,以解決Virtex-5 RocketI0TM GTP無法直接應用于某些串行高速接口開發(fā)的問題,并就SATA2.0接口開發(fā)中該問題的解決方案進行詳細闡述。
1 SATA2.0協(xié)議數(shù)據(jù)的相關操作結構
根據(jù)SATA2.0協(xié)議規(guī)定,系統(tǒng)進行數(shù)據(jù)操作和傳輸時的基本單位是Dword (Double、word),共計32 bit,由低有效字wordO和高有效字wordl組成,也可以看做是由byte0~byte3四個有效字節(jié)組成。其相互關系如圖1所示。
原語(primitive)是主機與設備間鏈路層交互的載體,一般由一個帶有控制字符byteO和附加字符bvtel—byte3的Dword組成,SATA2.0協(xié)議將原語的byte0稱為K字符,將附加字符bytel一byte3稱為D字符,由不同的K字符和D字符可以構成原語組。字符內(nèi)容由8B/10B轉換中的6—4分組確定。其原語組的編碼如表1所列。
無論是在傳輸還是在操作過程中,都要保證每個Dword的正確性和完整性,否則將導致數(shù)據(jù)出錯或原語流失。
另外,目前高速數(shù)據(jù)傳輸接口或總線常用8B/10B編碼來編碼,其根本目的是實現(xiàn)直流平衡(DC Balance)。當高速串行流的邏輯1或邏輯0有多個位沒有變化時,信號的轉換就會因為電壓位階的關系而造成信號錯誤。直流平衡的最大好處便是可以克服以上問題。8B/10B編碼是目前許多高速串行總線采用的一種編碼機制,如1394b、Serial ATA、PCI Express、Infini-band、Fiber Channel、RapidIO等總線或網(wǎng)絡,都是8B/10B編碼的擁護者。該編碼技術的基本精神很簡單,就是將8個位經(jīng)過映射的機制轉化為10個位的字碼,但它平衡了位流中0與l的數(shù)量。
8B/10B編碼是將一組連續(xù)的8位數(shù)據(jù)分解成兩組數(shù)據(jù),一組3位,一組5位,經(jīng)過編碼后分別構成一組4位代碼和一組6位代碼,從而組成一組10位的數(shù)據(jù)發(fā)送出去。相反,解碼是將l組10位的輸入數(shù)據(jù)經(jīng)過變換得到8位數(shù)據(jù)位。其8B/10B編解碼過程如圖2所示。
Xilinx公司推出的Virtex-5 FPGA以及配套的Virtex-5 RocketI0TM GTP收發(fā)器只支持16bit接口位寬的數(shù)據(jù)傳輸,即該GTP收發(fā)器是以word為數(shù)據(jù)處理單位。由于這與SATA2.0協(xié)議的相關規(guī)定出現(xiàn)了偏差,因而要求在數(shù)據(jù)進入設計主體邏輯前后要進行合并以及分解。同時,F(xiàn)PGA中設計的數(shù)據(jù)處理邏輯是根據(jù)協(xié)議的要求而定義為75 MHz的時鐘域來進行處理的,因此,在將數(shù)據(jù)交給FPGA中的數(shù)據(jù)處理主體邏輯之前,也必須進行位寬的轉換。
由于GTP附帶的2 bit控制字節(jié)指示信號rxcharisk可用以表征接收到了K字符,故實際的數(shù)據(jù)需要從150 MHz (16+2) bit轉換為75 MHz(32+4)bit。但由于16 bit和32 bit的并行數(shù)據(jù)是主體。因此,筆者仍稱之為16 bit到32 bit位寬轉換和32bit到16 bit位寬轉換,它們實際上都包含了指示信號,用來標示該字符是否是控制字符。
2 位寬轉換
根據(jù)SATA2.0協(xié)議的規(guī)定和Virrex-5 RocketIOTM GTP的特性,以及SATA2.0接口邏輯中需要提取原語(primitive)進行邏輯控制的要求,16bit和32 bit位寬的相互轉換不能簡單的進行word合并拆解,而是需要實現(xiàn)圖1中wordO和wordl的正確組合,否則將導致原語或數(shù)據(jù)受損,使控制邏輯無法獲得有效的交互原語,數(shù)據(jù)處理邏輯組幀傳輸錯誤,文件損壞的狀況發(fā)生。這就要求系統(tǒng)能夠在提取原語和數(shù)據(jù)組幀之前,及時進行Dword邊界校正,以保證后續(xù)處理的正確。
2.1 16bit至32bit位寬轉換模塊
該模塊將GTP接收后的150 MHz 16 bit并行數(shù)據(jù)轉換成數(shù)據(jù)處理邏輯可以工作的75 MHz 32 bit的并行數(shù)據(jù)。圖3所示為其位寬轉換要求示意圖。
由于在轉換開始時,必須正確地將2個相關的16 bit Word組合成一個32bit DW,但不能將一個DW的低字跟相鄰的一個DW的高字組合成一個DW,否則邏輯處理時就會出錯。圖4所示是16Bit轉32 bit的實現(xiàn)邏輯示意圖。
對于這個問題,Xilinx提供了非對稱的異步FIFO,但這樣又會造成較大的延時,同時無法避免圖4所示的DW組合轉換不當?shù)膯栴}。這樣就使得FIF0的控制邏輯比較復雜,而數(shù)據(jù)的延時又較大,又會致使性能下降,有些得不償失,也不符合SATA2.0的高速低延遲要求。
為了降低延時,同時簡化邏輯,筆者設計了一個滑動窗口位寬轉換器,其中滑動窗口的作用就在于尋找到正確的DW邊界,避免不當?shù)腄W組合轉換。150 MHz時鐘和75 MHz時鐘的相位一致是這種轉換穩(wěn)定進行的保障,而xilinx Virtex-5xc5vlx50t FPGA恰恰通過DCM提供了這樣兩個穩(wěn)定時鐘,因此,這兩個時鐘必須接到DCM響應頻率的輸出。
利用3個18bit寄存器可以組成一個右移的寄存器組,輸入按[rxcharisk,rxdata]的形式組合成18 bit輸入數(shù)據(jù)。在位寬轉換開始后,通過判別中間寄存器的最高2 bit rxcharisk是否為2’bOl可判別DW的邊界,并選擇輸出數(shù)據(jù)來自哪個窗口。如果75 MHz時鐘有效沿檢測到中間寄存器最高2 bit rxcharisk是2’b01,則輸出reg2和regl重組后的36 bit數(shù)據(jù)。否則,就會輸出regl和reg0重組后的36 bit數(shù)據(jù)。但由于150 MHz時鐘和75 MHz時鐘存在著有效沿不一致的情況(即150 MHz時鐘的上升沿可能對應著75 MHz時鐘的下降沿),75MHz時鐘有效沿可能會檢測到rxcharisk=2’b01,也可能永遠檢測不到,這取決于復位之后初始輸入數(shù)據(jù)的特性。數(shù)據(jù)重組的作用是將2個相鄰的寄存器中的16bit數(shù)據(jù)(rxdata)及其2 bit類型指示(rxcharisk)信號重組為32 bit數(shù)據(jù)及其4 bit類型指示信號。DW邊界判別的依據(jù)是:在PHY連接建立之后,主機和設備之間會相互發(fā)送SYNC原語,表明兩端處于空閑狀態(tài),而SYNC就是一個控制(K)字節(jié),其低字接收后的xcharisk是2’bol,通過這個即可識別DW的邊界。
2.2 32 bit至16 bit位寬轉換模塊
根據(jù)上面16 bit至32 bit位寬轉換分析,需要將數(shù)據(jù)處理邏輯輸出的32 bit數(shù)據(jù)拆分成兩個16bit數(shù)據(jù)交給GTP進行發(fā)送。同時在轉換的開始時刻,要求先發(fā)送一個DW的低字,然后發(fā)送其高字,而不能先發(fā)送一個DW的高字,否則接收端將無法正確恢復出DW。另外,150 MHz時鐘和75MHz時鐘的相位一致,同樣是這種轉換穩(wěn)定進行的保障,因此,這兩個時鐘也必須接到DCM響應頻率的輸出。其32 bit轉16 bit的實現(xiàn)邏輯示意圖如圖5所示。
用2個18 bit的寄存器組寄存經(jīng)數(shù)據(jù)重組后的36 bit輸入數(shù)據(jù)時,可根據(jù)輸入數(shù)據(jù)的控制字節(jié)(rxcharisk)指示位來判別數(shù)據(jù)的寫入和讀出。由于150 MHz時鐘和75 MHz時鐘存在著有效沿不一致的情況,即150 MHz時鐘的上升沿可能對應著75 MHz時鐘的下降沿,因此,要準確地進行讀寫控制,就必須對wr_en和rd_en信號進行同步。同步方法是利用75 MHz時鐘的有效沿(上升沿)與150 MHz時鐘有效沿一致的特性來同步產(chǎn)生wr-en和rd_en信號。而產(chǎn)生wr_en和rd_en信號的依據(jù)是在系統(tǒng)復位后,由數(shù)據(jù)處理邏輯向外發(fā)送SYNC信號來表明系統(tǒng)處于空閑(Idle)狀態(tài)。事實上,SYNC就是一個控制(K)字節(jié),其響應的rxcharisk是4’b0001,通過這個可以正確地將DW寫入和讀出。DW的發(fā)送要求先發(fā)送低字,然后發(fā)送高字。數(shù)據(jù)讀出控制塊會利用rd-en信號使能2 bit的計數(shù)器,然后利用計數(shù)值將DW的低高字依次選擇讀出。
3 仿真及驗證
通過對位寬轉換模塊的Verilog HDL描述,可在ModelSim se以及Xilinx ISE集成開發(fā)環(huán)境下進行功能仿真和綜合布局布線后的時序仿真,也可在Xilinx Virtex-5 xc5vlx50t FPGA上進行驗證。圖6所示為16 bit轉32 bit邏輯仿真圖。而其32 bit轉16 bit邏輯仿真圖如圖7所示。
4 結束語
本設計可實現(xiàn)Virrex-5 RocketI0TM GTP進行SATA2.0相關開發(fā)過程中的位寬匹配轉換功能,而且具有處理延遲小、差錯率低等優(yōu)點,并通過了Xilinx ISE綜合布線以及Virtex-5 FPGA上的驗證,結果證明:本設計能夠完全滿足SATA2.0相關開發(fā)時序及功能上的要求。實際上,邏輯設計人員利用Virrex-5 RocketIOTM GTP進行其他高速串行傳輸接口的開發(fā)時,也可以借鑒此設計思想。