摘 要: 利用FPGA" title="FPGA">FPGA設計實現(xiàn)了一種基于PCI總線" title="PCI總線">PCI總線接口的純硬件加密卡,為PC機提供加密、簽名等服務。對采用VHDL描述的PCI接口IP軟核及其應用方法進行了分析;采用VHDL設計了3DES、MD5等算法模塊,并設計了其與PCI接口IP核之間的通信控制模塊;利用Quartus II進行仿真、綜合后,下載到加密卡上的FPGA配置芯片,將上述各個模塊集成在一片F(xiàn)PGA上予以實現(xiàn);最后,采用VC++為加密卡設計了驅(qū)動程序和測試程序,并對整個加密卡工作進行了功能測試。
關鍵詞: PCI總線 3DES算法" title="3DES算法">3DES算法 FPGA
PCI加密卡是基于加解密芯片和PCI總線卡技術實現(xiàn)的安全保密設備,為計算機提供數(shù)據(jù)加密、數(shù)據(jù)完整性、數(shù)字簽名、訪問控制等安全功能,可用于計算機文件保護、電子郵件系統(tǒng)安全保密、辦公自動化安全保密、數(shù)據(jù)庫保護、網(wǎng)絡加密等。主要用于帶PCI插槽的臺式PC機和工作站, 在防火墻、VPN加密機等方面具有極為廣泛的應用前景[1][2]。
PCI加密卡的數(shù)據(jù)加密分為軟件實現(xiàn)和硬件實現(xiàn)兩種方式,軟件實現(xiàn)是指在PCI配置嵌入式微處理器或DSP芯片實現(xiàn)加密算法;硬件實現(xiàn)是指采用密碼算法芯片實現(xiàn)加/解密、簽名算法,具有處理速度快,安全性好的特點。在上述硬件實現(xiàn)中,PCI總線接口可以采用專門的接口芯片,例如PCI9054實現(xiàn);也可以采用PCI接口IP核在密碼專用芯片中實現(xiàn)。本文采用一片Altera的Cyclone 系列FPGA實現(xiàn)了加解密算法和PCI接口,并為加密卡開發(fā)了WDM驅(qū)動程序,設計了一個能為PC機提供數(shù)據(jù)加密、數(shù)據(jù)完整性、訪問控制等安全功能的PCI加密卡。
1 系統(tǒng)硬件架構設計
整個PCI加密卡硬件以一片F(xiàn)PGA為中心,配以FPGA配置芯片、時鐘等模塊構成。PCI接口、3DES、MD5算法等全部在FPGA內(nèi)部實現(xiàn)。整個加密卡的硬件結(jié)構如圖1所示,系統(tǒng)主要設計任務在FPGA內(nèi)部的邏輯功能完成,包括:PCI接口模塊、控制模塊、輸入輸出緩存模塊和數(shù)據(jù)加密模塊。PCI接口模塊由IP軟核實現(xiàn),主要功能是控制和實現(xiàn)數(shù)據(jù)的雙向傳輸;控制模塊主要控制PCI接口與數(shù)據(jù)加密模塊之間的數(shù)據(jù)傳輸;輸入輸出緩存模塊主要用于寄存由PCI接口模塊輸入后等待處理的數(shù)據(jù),以及系統(tǒng)內(nèi)部運算后等待輸出的數(shù)據(jù)結(jié)果;數(shù)據(jù)加密模塊主要包含硬件實現(xiàn)后的加密算法,用于對輸入的數(shù)據(jù)進行加解密運算。
在各個主要模塊中,密碼運算模塊的速度將直接影響到整個加密系統(tǒng)的工作效率。此外,由于控制模塊的主要功能是控制輸入輸出緩存中的數(shù)據(jù)依次進入加密模塊,同時,根據(jù)加密模塊反饋的狀態(tài)信息發(fā)出相應的控制信息,所以,控制模塊的設計在整個加密設備的設計實現(xiàn)中十分重要。
2 PCI接口IP核及其應用方法
PCI總線接口有兩種設計方案,一是采用專門的PCI接口芯片(例如PCI9054或PCI9052)實現(xiàn),二是采用PCI接口IP核在密碼專用芯片中實現(xiàn)[3]。本加密卡采用第二種方案,由VHDL描述的軟核下載到FPGA中實現(xiàn)。該PCI接口IP核符合標準的PCI2.2協(xié)議,支持I/O操作、配置讀、寫操作、總線BUS_MASTER讀、BUS_MASTER寫以及DMA中斷方式和DMA數(shù)據(jù)傳輸方式。該IP核設計主要采用有限狀態(tài)機實現(xiàn),包括中斷應答、突發(fā)讀操作、突發(fā)寫操作、配置讀操作、配置寫操作、I/O讀寫傳輸、存儲器讀寫傳輸7個狀態(tài)機組成。其工作流程如圖2所示。收到幀開始信號(#FRAM信號為低)后,根據(jù)PCI總線C/BE[3..0]上的命令,分別進入7個狀態(tài)機中的一個。操作結(jié)束后,主機發(fā)出幀結(jié)束信號(#FRAM為信號低),進入等待狀態(tài),進入下個操作。
利用該PCI接口IP核完成加密卡設計,必須先確定數(shù)據(jù)傳輸?shù)膶崿F(xiàn)方式。該PCI接口IP核支持兩個256K字節(jié)的I/O空間;支持一個4M字節(jié)的PCI內(nèi)存空間。在PCI的數(shù)據(jù)傳輸中,主要依靠I/O讀、I/O寫、存儲器讀、存儲器寫等操作完成數(shù)據(jù)傳輸。I/O讀、寫命令用來從一個映射到I/O地址空間的設備中讀、寫數(shù)據(jù)。存儲器讀、寫命令用來從一個映射到存儲器地址空間的設備讀、寫數(shù)據(jù)。在加密卡初期設計中,數(shù)據(jù)都被映射到I/O地址空間進行操作。系統(tǒng)工作的基本過程如下:數(shù)據(jù)從PC機進入PCI接口模塊,先存入PCI接口模塊中指定的I/O存儲單元中;在控制模塊的控制下,依次進入密碼算法模塊,數(shù)據(jù)經(jīng)過處理后輸出到輸出緩存之中,由驅(qū)動程序?qū)⑦\算結(jié)果傳輸給應用程序。
確定了數(shù)據(jù)傳輸方式后,下一步的工作是完成加密算法模塊設計,并設計適當?shù)慕涌诳刂颇K,按照事先確定的數(shù)據(jù)傳輸方式將其連接到PCI接口模塊。
3 密碼算法模塊設計
密碼算法模塊是整個加密卡設計的核心,其設計的優(yōu)劣直接關系到加密卡的性能和安全性。下面以3DES算法為例,介紹密碼算法模塊的設計方法。
3.1 3DES算法模塊設計
本設計采用兩個密鑰的3DES,該加密方案使用兩個不同的密鑰Key1和Key2對明文進行三次DES或DES-1變換,加密函數(shù)采用加密-脫密-加密序列:
兩個密鑰的三重DES的有效密鑰長度是112位。在本設計中采用了密碼分組鏈接方式(CBC)。在這種方案中,加密算法的輸入是當前的明文分組和前邊的密文分組的異或,對每個分組使用相同的密鑰。從效果上看,將明文分組序列的處理連接起來了。每個明文分組的加密函數(shù)的輸入與明文分組之間不再有固定的關系,因此,64bit的重復模式不再會暴露。
3DES密碼硬件模塊為控制模塊和數(shù)據(jù)路徑設計兩部分。控制模塊產(chǎn)生數(shù)據(jù)通路需要的控制信號序列,保證數(shù)據(jù)處理單元正確有序地工作。數(shù)據(jù)路徑用來實現(xiàn)信息傳送和密碼變換的數(shù)據(jù)處理單元。3DES算法設計采用迭代結(jié)構,由初始置換電路IP、多路選擇電路L_MUX和R_MUX、32-bit L鎖存器、32-bit R鎖存器、擴展置換E處理電路、S盒數(shù)據(jù)代替電路、P盒置換電路及末置換IP-1電路構成。其運算電路如圖3所示。
3.2 3DES輸入輸出模塊設計
輸入輸出模塊主要為密碼運算模塊提供密鑰、數(shù)據(jù)以及命令信息的模塊??刂菩盘栔饕ǎ翰僮鲿r鐘CLK、系統(tǒng)初始化INIT、寫使能WEN、讀使能REN、運算完畢READY、DIN[31:0]、數(shù)據(jù)輸入、數(shù)據(jù)輸出DOUT[31:0]、端口選擇A[2:0]。當INIT=1時,將3DES模塊內(nèi)部所有寄存器復位并清零;當A[2:0]=010, WEN=1時,在CLK時鐘上升沿,將命令字由32位數(shù)據(jù)總線寫入芯片內(nèi)部命令寄存器;當A[2:0]=001,WEN=1時,在CLK時鐘上升沿,將128位的密鑰分四次由32-bit數(shù)據(jù)總線寫入芯片內(nèi)部密鑰寄存器;當A[2:0]=000,WEN=1時,在CLK時鐘上升沿將64位的數(shù)據(jù)分兩次由32位數(shù)據(jù)總線寫入芯片內(nèi)部輸入數(shù)據(jù)寄存器;每寫夠2個長字,3DES模塊開始運算,運算完畢后,READY變?yōu)楦唠娖?,輸出?shù)據(jù)分為兩組分別送入temporary_l和temporary_2兩個寄存器。3DES Quartus仿真波形如圖4所示。
4 密碼服務的PCI傳輸控制
完成了密碼算法模塊后,還要設計一個接口控制模塊,將其連接到PCI接口模塊,以實現(xiàn)密碼模塊與PCI主機的通信連接。下面以3DES密碼模塊為例,介紹面向PCI傳輸?shù)拿艽a算法接口控制模塊的設計。圖5為該模塊的設計框圖,在PC機與加密卡的通信過程中,驅(qū)動程序先將數(shù)據(jù)按32bit分組送入PCI中指定的IO存儲器地址中。一次加密服務流程如下:數(shù)據(jù)首先進入輸入緩存模塊,分別將3DES密鑰Key1、Key2送入I/O地址70h,74h,78h,7ch;數(shù)據(jù)送入80h,84h;命令送入88h。待數(shù)據(jù)傳輸完畢,由驅(qū)動程序向密碼算法模塊發(fā)送啟動信號,在計數(shù)器模塊的控制下,命令、IV向量、密鑰、數(shù)據(jù)由緩存模塊依次進入密碼運算模塊;密碼運算完畢后向PCI模塊發(fā)送ready信號,并把數(shù)據(jù)處理結(jié)果放入輸出緩存地址9ch和a0h中,驅(qū)動程序在檢測的ready信號為高時從輸出緩存地址取走數(shù)據(jù)。
5 加密卡驅(qū)動程序設計及系統(tǒng)測試
PCI加密卡為主機提供加/解密服務,并為應用軟件提供相應的軟件接口,主要包括用Visual C++開發(fā)的WDM驅(qū)動程序和應用程序編程接口函數(shù)庫兩個部分[4]。在Windows2000系統(tǒng)中可以使用多種驅(qū)動程序,如虛擬設備驅(qū)動程序(VDD)和內(nèi)核模式驅(qū)動程序。其中,WDM驅(qū)動程序是一種PnP驅(qū)動程序,它遵循Windows2000即插即用協(xié)議的內(nèi)核模式驅(qū)動程序,同時還遵循電源管理協(xié)議,并能在Windows98、Windows2000和Windows XP間實現(xiàn)源代碼級兼容。
應用程序與WDM通信時,應用程序先調(diào)用CreateFile函數(shù)打開設備,然后調(diào)用DeviceIoControl與WDM進行數(shù)據(jù)通信,最后用CloseHandle關閉設備。主機應用程序用Visual C++開發(fā)生成,主要包括系統(tǒng)的用戶界面設計、用于輸入用戶數(shù)據(jù)、顯示運算后的結(jié)果數(shù)據(jù)、調(diào)用驅(qū)動程序?qū)崿F(xiàn)某種功能。驅(qū)動程序與應用程序之間的通信分為同步方式和異步方式。若采用同步方式,則應用程序調(diào)用DeviceIoControl函數(shù)時將被阻塞,等待PCI設備進行數(shù)據(jù)處理,完成相應操作,直到驅(qū)動程序給應用程序返回值后,應用程序才會接著運行。若采用異步方式,則應用程序調(diào)用DeviceIoControl函數(shù)將立刻返回,不等待驅(qū)動程序?qū)?shù)據(jù)的操作。這樣,如果在應用程序退出之前,驅(qū)動程序還沒完成I/O操作,就需要編寫超時取消I/O操作的代碼,確保在應用程序退出之后正常關閉設備。異步方式相對比較復雜,考慮到設計中算法對時序要求高,所以本設計選擇同步方式實現(xiàn)計算機與PCI設備之間的通信。
3DES加密算法和驅(qū)動程序全部完成后,為了對整個加密卡的功能進行驗證,開發(fā)了一個文件加密服務程序?qū)用芸ㄟM行測試。測試過程如下:
第一步,系統(tǒng)安裝及初始化。首先將加密卡插入到PCI插槽中,將硬件設計下載到FPGA配置芯片后,重新上電,裝載驅(qū)動程序,最后,啟動應用程序開始整個加密卡的測試工作。
第二步,加密功能測試。輸入3DES的兩個加密初始密鑰Key1、Key2,選擇一個事先編輯的文本文件Plain.txt為待加密的明文數(shù)據(jù)。模式選擇為加密的情況下,所得密文數(shù)據(jù)輸出到Cipher.txt文件中。
第三步,解密功能測試。為了便于比較,仍然選用Key1、Key2為3DES的兩個解密初始密鑰。導入Cipher.txt作為待解密的密文數(shù)據(jù),在模式選擇為解密的情況下,所得明文數(shù)據(jù)導出在Plain1.txt文件中。經(jīng)過比較,Plain.txt和Plain1.txt完全一致。
上述測試結(jié)果表明,加密卡驅(qū)動程序、PCI接口IP核能夠正確將應用程序提供的數(shù)據(jù)傳輸給密碼算法模塊,密碼算法模塊正確完成加解密操作后,數(shù)據(jù)能正確通過PCI接口IP核、驅(qū)動程序傳輸?shù)綉贸绦?,即加密卡設計實現(xiàn)了預定的功能。下一步還要對系統(tǒng)的性能進行測試,優(yōu)化系統(tǒng)結(jié)構提高系統(tǒng)的性能。
本文討論一個基于FPGA實現(xiàn)的PCI加密卡的設計與實現(xiàn)過程,以3DES算法為例重點討論了密碼算法及其與PCI接口模塊之間的數(shù)據(jù)傳輸實現(xiàn)方法,對包括驅(qū)動程序在內(nèi)的加密卡進行了功能測試。作為一個功能完善的加密卡,要為PC機提供數(shù)據(jù)加密、數(shù)據(jù)完整性、訪問控制等服務,除了提供3DES加密算法以外,還需要支持AES等加密強度更高的對稱密碼算法、非對稱算法、散列算法、簽名驗證算法等,這也是下一步要做的主(接上頁)
要工作。
參考文獻
[1] 成都天融信網(wǎng)絡安全技術有限公司.PCI加密卡[EB/OL].http://www.westsec.com.cn,2006.
[2] 劉建中,李清寶.基子PCI總線加密卡硬件設計.電子技術應用[J],2004,30(1):7-9.
[3] 劉紅,李勃,常青,等.基于IP核的PCI總線接口設計與實現(xiàn)[J].電子技術應用,2006,32(6):6-9.
[4] 杜欣,馬秦生.PCI傳輸卡的WDM驅(qū)動程序設計[J].電子技術應用,2003,29(12):22-24.