123,123,123

一种基于FPGA的可重构密码芯片的设计与实现

日期： 2008-05-20

作者：杨晓辉，戴紫彬

關(guān)鍵詞： 可重构移位寄存器三种密码算法控制信号

　　摘　要： 介紹了SHA-1、SHA224及SHA256三種" title="三種">三種安全雜湊算法的基本流程，采用可重構(gòu)" title="可重構(gòu)">可重構(gòu)體系結(jié)構(gòu)的設(shè)計(jì)思想和方法設(shè)計(jì)出一款可實(shí)現(xiàn)這三種算法的可重構(gòu)密碼芯片，并對(duì)關(guān)鍵路徑進(jìn)行了優(yōu)化設(shè)計(jì)。最后給出了基于Altera公司的Cyclone系列FPGA的可重構(gòu)密碼芯片的實(shí)現(xiàn)結(jié)果。
　　關(guān)鍵詞： SHA-1/SHA-224/SHA-256 可重構(gòu)密碼芯片 FPGA

　　目前，國(guó)內(nèi)外廣泛使用的密碼處理芯片大都是實(shí)現(xiàn)某種特定密碼算法" title="密碼算法">密碼算法的專用芯片，如MD5芯片、SHA-1芯片等。由于專用密碼芯片實(shí)現(xiàn)的密碼算法是確定的且不可更改的，因此難以滿足不同密碼用戶多層次的安全性需要。為克服這一缺陷，本文設(shè)計(jì)一種新型的密碼處理芯片——可重構(gòu)密碼芯片。
　　可重構(gòu)密碼芯片是采用可重構(gòu)體系結(jié)構(gòu)設(shè)計(jì)而成的用于對(duì)數(shù)據(jù)進(jìn)行加/解密處理的集成電路芯片。其內(nèi)部邏輯電路能夠根據(jù)不同密碼算法的需求重新組織，構(gòu)成不同的電路結(jié)構(gòu)，實(shí)現(xiàn)不同的功能，從而能夠靈活、快速地實(shí)現(xiàn)多種不同的密碼算法^{^[1]}。此外，由于可重構(gòu)體系結(jié)構(gòu)設(shè)計(jì)是建立在某些硬件資源能夠被不同應(yīng)用需求重復(fù)使用的基礎(chǔ)之上的，所以其消耗的硬件資源要比只實(shí)現(xiàn)某種算法的專用芯片所占用的硬件資源的總和要少得多?？芍貥?gòu)密碼芯片不僅可以靈活實(shí)現(xiàn)多種密碼算法，還可以更加有效地利用硬件資源以達(dá)到節(jié)約邏輯資源的目的。本文在分析SHA-1/SHA-224/256 ^{^[2]}算法的基礎(chǔ)上，選用 Altera公司的Cyclone系列器件，采用VHDL語(yǔ)言進(jìn)行描述，并給出一種能實(shí)現(xiàn)該可重構(gòu)密碼芯片的電路設(shè)計(jì)方案。
1 算法簡(jiǎn)介
1.1 SHA-1算法介紹^{^[3]}
　　SHA-1算法輸入報(bào)文的最大長(zhǎng)度不超過(guò)2⁶⁴bit，輸入按512bit分組進(jìn)行處理，產(chǎn)生的輸出是一個(gè)160bit的報(bào)文摘要。該算法處理包括以下幾個(gè)步驟：
　　(1)附加填充比特。對(duì)報(bào)文進(jìn)行填充使報(bào)文長(zhǎng)度與448模512同余(長(zhǎng)度=448 mod 512)，填充的比特?cái)?shù)范圍從1到512，填充比特串的最高位為1，其余位為0。
　　(2)附加長(zhǎng)度值。將用64bit表示的初始報(bào)文(填充前)的位長(zhǎng)度附加在步驟(1)的結(jié)果后(低位字節(jié)優(yōu)先)。
　　(3)初始化緩存。使用一個(gè)160bit的緩存存放該散列函數(shù)的中間值及最終結(jié)果。該緩存的值分別表示為A=67452301，B＝EFCDAB89，C=0x98BADCEF，D=0x10325476，E=C3D2E1F0。
　　(4)處理512bit(16個(gè)字)報(bào)文分組序列。算法的核心是一個(gè)包含四個(gè)循環(huán)的模塊，每個(gè)循環(huán)由20個(gè)處理步驟組成。四個(gè)循環(huán)有相似的結(jié)構(gòu)，但每個(gè)循環(huán)使用不同的邏輯函數(shù)，分別表示為f₁、f₂、f₃、f₄。每個(gè)循環(huán)都以當(dāng)前正在處理的512bit和160-bit緩存值A(chǔ)、B、C、D、E為輸入，然后更新緩存內(nèi)容。每個(gè)循環(huán)還使用一個(gè)額外的常數(shù)值K_t，對(duì)應(yīng)的四輪K_t取值及邏輯函數(shù)f_t如表1所示。第四循環(huán)最后一步的輸出與第一循環(huán)的輸入進(jìn)行模2³²相加后得到下一個(gè)512bit分組計(jì)算所需的A、B、C、D、E值。
　　(5)所有的512bit分組處理完畢后，最后一個(gè)分組產(chǎn)生的輸出便是160bit的報(bào)文摘要。圖1說(shuō)明了SHA-1算法中每一處理步驟所包含的操作。

1.2 SHA-224/SHA-256算法介紹
　　SHA-224/SHA-256算法輸入報(bào)文的最大長(zhǎng)度不超過(guò)2⁶⁴bit，輸入按512bit分組進(jìn)行處理，產(chǎn)生的輸出是一個(gè)224bit或256bit的報(bào)文摘要。該算法處理包括以下幾個(gè)步驟：
　　(1)和(2)與SHA-1算法的前兩步相同。
　　(3)初始化緩存。使用一個(gè)256bit的緩存存放該散列函數(shù)的中間值及最終結(jié)果。當(dāng)執(zhí)行SHA-224算法時(shí),該緩存的值分別表示為A= 0xC1059ED8, B＝0x367CD507， C=0x3070DD17,D=0xF70E5939，E=0xFFC00B31,F=0x68581511,G=0x64F98FA7,H=0xBEFA4FA4；當(dāng)執(zhí)行SHA-256算法時(shí)，該緩存的值分別表示為A=0x6A09E667,B=0xBB67AE85,C=0x3C6EF372,D=0xA54FF53A,E=0x510E527F,F=0x9B05688C,G=0x1F83D9AB, H=0x5BE0CD19。

　　(4)處理512bit(16個(gè)字)報(bào)文分組序列。該算法使用六種基本邏輯函數(shù)，由64步迭代運(yùn)算組成。每步都以256bit緩存值A(chǔ)、B、C、D、E、F、G、H為輸入，然后更新緩存內(nèi)容。每步使用一個(gè)32bit常數(shù)值K_t和一個(gè)32bit W_t。六種基本函數(shù)如下：
　　
　　W_t是由當(dāng)前的輸入分組(512bit長(zhǎng))導(dǎo)出的32bit長(zhǎng)的數(shù)。在所有64次運(yùn)算完成之后，將其輸出A、B、C、D、E、F、G、H與第一步的輸入A、B、C、D、E、F、G、H的值對(duì)應(yīng)進(jìn)行模2³²相加。然后將其結(jié)果作為下一分組數(shù)據(jù)A、B、C、D、E、F、G、H的值繼續(xù)運(yùn)行算法。
　　(5)所有的512bit分組處理完畢后，對(duì)于SHA256算法,最后一個(gè)分組產(chǎn)生的輸出便是256bit的報(bào)文摘要；若是SHA-224算法,則最后一個(gè)分組產(chǎn)生的輸出取前224bit作為報(bào)文摘要。圖2說(shuō)明了SHA-224/SHA-256算法每一處理步驟所包含的操作。

2 電路結(jié)構(gòu)
2.1總體結(jié)構(gòu)設(shè)計(jì)
　　本設(shè)計(jì)采用可重構(gòu)密碼芯片的設(shè)計(jì)思想,通過(guò)對(duì)SHA-1、SHA-224、SHA-256 三種算法分析可以看出,這三種算法的W_t生成電路和移位存儲(chǔ)模塊是可重用的部件。數(shù)據(jù)通路中的CSA加法器、存放雜湊值的移位寄存器" title="移位寄存器">移位寄存器以及常數(shù)值存儲(chǔ)模塊K_t也都是可重用的部件。按照上述分析，把該芯片分為三大模塊：存儲(chǔ)模塊、控制模塊、可重用處理模塊。其中，存儲(chǔ)模塊用于存儲(chǔ)各種算法所需的常數(shù)值?？刂颇K用于接收外部的控制信號(hào)" title="控制信號(hào)">控制信號(hào)和選擇算法信號(hào)，控制各種算法的存儲(chǔ)和運(yùn)算。可重用處理模塊用于對(duì)各種算法進(jìn)行可重構(gòu)計(jì)算。根據(jù)整體算法要求，又將其再往下劃分為七個(gè)功能子模塊。本設(shè)計(jì)充分利用FPGA可重構(gòu)計(jì)算的特點(diǎn)，對(duì)可重用的模塊進(jìn)行可重構(gòu)計(jì)算以實(shí)現(xiàn)對(duì)FPGA資源的靈活有效利用。 SHA-1/SHA-224/SHA-256可重構(gòu)運(yùn)算電路IP CORE由以下七個(gè)子模塊構(gòu)成：控制電路、W_t生成電路、K_t常數(shù)寄存器、填充電路、運(yùn)算電路、HASH值暫存寄存器、移位寄存器。本設(shè)計(jì)總體結(jié)構(gòu)框圖如圖3所示。

　　其中，K_t常數(shù)寄存器子模塊和HASH值暫存寄存器子模塊屬于存儲(chǔ)模塊；W_t生成電路子模塊、填充電路子模塊、運(yùn)算電路子模塊、移位寄存器子模塊屬于可重用處理模塊。控制電路子模塊屬于控制模塊。每個(gè)子模塊具體功能為：W_t生成電路負(fù)責(zé)對(duì)每組512bit的輸入數(shù)據(jù)生成64個(gè)或80個(gè)32bit 的字并送入運(yùn)算通路。K_t常數(shù)寄存器用于存儲(chǔ)64個(gè)或80個(gè)32bit的常量?？刂齐娐坟?fù)責(zé)接收外部的控制信號(hào)，并產(chǎn)生所有的內(nèi)部控制信號(hào)，采用計(jì)數(shù)器電路生成。填充電路接收輸入數(shù)據(jù)，產(chǎn)生每個(gè)512bit分組并送入W_t生成電路。運(yùn)算電路負(fù)責(zé)計(jì)算多個(gè)模2³²加法。然后將其結(jié)果送入移位寄存器。HASH值暫存寄存器用于存儲(chǔ)5個(gè)或8個(gè)32bit寄存器的初始值以及每個(gè)512bit分組運(yùn)算完畢后的5個(gè)或8個(gè)32bit寄存器的臨時(shí)值。移位寄存器負(fù)責(zé)對(duì)每步運(yùn)算的數(shù)據(jù)進(jìn)行移位存儲(chǔ)。當(dāng)HASH運(yùn)算結(jié)束時(shí)，移位寄存器將其本身值與HASH值暫存寄存器中的值相加。當(dāng)外部讀信號(hào)有效時(shí)，電路實(shí)現(xiàn)串行移位功能，在控制信號(hào)作用下，將寄存器內(nèi)的數(shù)據(jù)順序讀出。
　　CLK是系統(tǒng)時(shí)鐘信號(hào)；RESET是復(fù)位信號(hào)，RESET有效時(shí)，所有寄存器復(fù)位；INIT是初始化信號(hào)，INIT有效時(shí)，初始化摘要計(jì)算，在每一批數(shù)據(jù)進(jìn)行摘要運(yùn)算之前，首先執(zhí)行初始化操作，然后按512bit分組寫(xiě)入數(shù)據(jù)；WEN是寫(xiě)使能信號(hào)，WEN有效時(shí)，在CLK時(shí)鐘上升沿將512bit的數(shù)據(jù)分16次由32bit數(shù)據(jù)總線寫(xiě)入芯片內(nèi)部數(shù)據(jù)寄存器；REN是讀使能信號(hào)，REN有效時(shí)，將內(nèi)部運(yùn)算結(jié)果讀出數(shù)據(jù)端口；DATAIN是數(shù)據(jù)輸入，即輸入的512bit分組數(shù)據(jù)。SEL是選擇算法指令信號(hào)，用來(lái)選擇所需的算法。READY是運(yùn)算狀態(tài)信號(hào)，每512bit分組運(yùn)算完畢后， READY變?yōu)橛行В却x出或外部數(shù)據(jù)繼續(xù)輸入。DIGEST是摘要值輸出，即REN信號(hào)有效時(shí)輸出的相應(yīng)摘要值。
2.2 控制電路設(shè)計(jì)
　　控制電路的核心是一個(gè)7位計(jì)數(shù)器，每來(lái)一個(gè)時(shí)鐘信號(hào)，便進(jìn)行加1操作，根據(jù)不同的計(jì)數(shù)值可給出不同的控制信號(hào)。依照算法要求，每處理一組512 bit分組數(shù)據(jù)時(shí)，若執(zhí)行SHA-1算法則需要80步運(yùn)算；若執(zhí)行SHA-224/SHA-256算法則需要64步。為實(shí)現(xiàn)邏輯資源的可重構(gòu)，達(dá)到計(jì)數(shù)器資源重用的目的，就需要計(jì)數(shù)器在不同的算法下產(chǎn)生不同的控制信號(hào)。本控制電路采用增加選擇算法信號(hào)(SEL)來(lái)實(shí)現(xiàn)，其結(jié)構(gòu)如圖4所示。其中READY信號(hào)表示每一分組運(yùn)算完成信號(hào)。ADD信號(hào)表示分組運(yùn)算的最后一步各寄存器的值與第一步計(jì)算時(shí)的各寄存器的輸入值相加信號(hào)。START信號(hào)表示移位寄存器移位信號(hào)。

2.3 數(shù)據(jù)路徑優(yōu)化設(shè)計(jì)
　　SHA-1運(yùn)算模塊使用五個(gè)寄存器(見(jiàn)圖1)存放散列函數(shù)每一步運(yùn)算的中間結(jié)果；SHA-224/SHA-256運(yùn)算模塊則采用八個(gè)寄存器(見(jiàn)圖2)存放散列函數(shù)每一步運(yùn)算的中間結(jié)果。為實(shí)現(xiàn)可重構(gòu)計(jì)算以使不同算法邏輯單元重用，本設(shè)計(jì)采用八級(jí)移位寄存器A、B、C、D、E、F、G、H實(shí)現(xiàn)，每個(gè)寄存器32bit位寬。當(dāng)執(zhí)行SHA-1算法時(shí)，使用前五個(gè)32bit 移位寄存器；當(dāng)執(zhí)行SHA-224/SHA-256算法時(shí)，使用全部八個(gè)移位寄存器。當(dāng)RESET信號(hào)有效時(shí)，寄存器初始化，電路將根據(jù)不同算法給寄存器賦初值。數(shù)據(jù)路徑設(shè)計(jì)的關(guān)鍵是計(jì)算每步A寄存器的值。當(dāng)執(zhí)行SHA-1算法時(shí), A_t+1=(E_t+f_t(B_t,C_t,D_t)+A_t(〈〈〈5)+W_t+K_t) mod 2³² ；當(dāng)執(zhí)行SHA-224/SHA-256算法時(shí),A_t+1=(H_t+Σ1(E_t)+Ch(E_t,F_t,G_t)+K_t+W_t+Σ0(A_t)+Maj(A_t,B_t,C_t) mod 2³²。
　　式中：A_t、B_t、C_t、D_t、E_t、F_t、G_t、H_t、W_t、K_t是第t時(shí)刻的各寄存器的值、消息分組和常數(shù)值。A_t+1是第t+1時(shí)刻的A寄存器的值。
　　SHA-1/SHA-224/SHA-256運(yùn)算模塊的關(guān)鍵路徑的設(shè)計(jì)是計(jì)算A_t+1，在這一路徑中，需要完成多個(gè)多變量邏輯函數(shù)和多個(gè)連續(xù)32位加法的運(yùn)算?？梢钥闯?，A_t+1計(jì)算主要包括非線性函數(shù)運(yùn)算、加法運(yùn)算和移位。其中非線性函數(shù)運(yùn)算只是完成信號(hào)在不同輸入輸出之間的切換，只需用組合邏輯電路設(shè)計(jì)，不會(huì)產(chǎn)生太大的延遲；移位只占用布線資源，同樣不會(huì)對(duì)電路的速度有影響；而加法運(yùn)算由于進(jìn)位會(huì)在電路上產(chǎn)生延遲，因此應(yīng)盡量對(duì)其進(jìn)行優(yōu)化，否則會(huì)影響電路運(yùn)算速度。因此在電路的設(shè)計(jì)上采用保存進(jìn)位加法器(CSA)，以減少延遲。由于SHA-1 算法執(zhí)行的是五個(gè)連續(xù)32位加法，而SHA-224/SHA-256執(zhí)行的是七個(gè)連續(xù)32位加法，而且SHA-1與SHA-224/SHA-256所使用的邏輯函數(shù)和輸入寄存器的值不同，這就需要將各個(gè)不同的函數(shù)變換的值提前計(jì)算出來(lái)，再根據(jù)選擇的算法對(duì)不同的值進(jìn)行選擇，然后送入CSA加法器的輸入端。
　　本設(shè)計(jì)電路由五級(jí)保存進(jìn)位加法器(CSA)和兩個(gè)串行進(jìn)位加法器(CPA)構(gòu)成，實(shí)現(xiàn)了保存進(jìn)位加法器對(duì)不同算法的重用，其結(jié)構(gòu)如圖5所示。
3 性能評(píng)估
　　以上設(shè)計(jì)采用VHDL語(yǔ)言描述，在QuartusII 4.2環(huán)境下編譯綜合，選用 Altera Cyclone^{^[4]}系列器件為目標(biāo)器件進(jìn)行整體綜合、仿真和底層布局，采用FIPS 180-2給出的測(cè)試數(shù)據(jù)進(jìn)行仿真，采用單個(gè)分組和多個(gè)分組分別進(jìn)行測(cè)試，均得到正確結(jié)果。
　　在本設(shè)計(jì)中，當(dāng)電路執(zhí)行SHA-1算法時(shí)運(yùn)算一個(gè)512bit分組需要82個(gè)時(shí)鐘周期，其中第一個(gè)為數(shù)據(jù)準(zhǔn)備周期，第2~81個(gè)為運(yùn)算周期，第82個(gè)為移位寄存器的值與HASH值暫存寄存器的值相加并將其結(jié)果送入移位寄存器的周期；當(dāng)執(zhí)行SHA-224/SHA-256算法時(shí)運(yùn)算一個(gè)512bit分組需要66個(gè)時(shí)鐘周期，其中第一個(gè)為數(shù)據(jù)準(zhǔn)備周期，第2~65個(gè)周期為運(yùn)算周期，第66為移位寄存器的值與HASH值暫存寄存器的值相加并將其結(jié)果送入移位寄存器的周期。該模塊的運(yùn)算速度可以通過(guò)下面公式得出：
　　運(yùn)算速度=(分組長(zhǎng)度/運(yùn)算耗用的時(shí)鐘周期數(shù))×系統(tǒng)時(shí)鐘頻率，單位為Mbps
　　將實(shí)現(xiàn)的可重構(gòu)算法分別下載到 Altera Cyclone系列器件后測(cè)得的主要性能指標(biāo)在表2中給出。

　　本設(shè)計(jì)的創(chuàng)新點(diǎn)是利用可重構(gòu)設(shè)計(jì)思想對(duì)SHA-1、SHA-224、SHA-256三種不同算法的可重用模塊進(jìn)行可重構(gòu)計(jì)算，通過(guò)FPGA實(shí)現(xiàn)時(shí)既能靈活實(shí)現(xiàn)不同算法，又能實(shí)現(xiàn)資源的充分利用，節(jié)約大量邏輯資源。為進(jìn)一步說(shuō)明本設(shè)計(jì)對(duì)FPGA資源利用情況，下面將這三種算法的專用芯片與可重構(gòu)SHA-1/SHA-224/SHA-256算法芯片的一些參數(shù)進(jìn)行比較，如表3 所示。這里要說(shuō)明的是這三種算法的參數(shù)均是采用類似SHA-1/SHA-224/SHA-256的總體電路架構(gòu)設(shè)計(jì)得到的。選擇的器件均是EP1C20F324C6。
　　本文在分析SHA-1/224/256三種不同的雜湊算法的基礎(chǔ)上，通過(guò)Altera公司的Cyclone系列FPGA設(shè)計(jì)了一款可重構(gòu)密碼芯片。可重構(gòu)密碼芯片是一種創(chuàng)新性的密碼芯片，它很好地克服了傳統(tǒng)的密碼芯片只能實(shí)現(xiàn)特定密碼算法的弊端，使得密碼使用者能夠在它上面很方便地選擇所需要的密碼算法，從而大大提高了密碼系統(tǒng)的靈活性?？芍貥?gòu)密碼芯片可作為構(gòu)建密碼系統(tǒng)的核心部件而被廣泛應(yīng)用于保密通信、網(wǎng)絡(luò)終端加密設(shè)備等領(lǐng)域，因此該研究方向具有重要的政治、軍事和經(jīng)濟(jì)意義^{^[5]}。
參考文獻(xiàn)
1 曲英杰. 可重構(gòu)密碼協(xié)處理器的組成與結(jié)構(gòu). 計(jì)算機(jī)工程與應(yīng)用, 2003;23:32～34
2 National Institute of Standards and Technology.Announcing the Secure Hash Standard. FIPS 180-2，2002 August 1:9～20,71～72
3 杜艷華，戴紫彬. 安全散列算法SHA-1的IP CORE的設(shè)計(jì)與實(shí)現(xiàn).電子技術(shù)學(xué)院學(xué)報(bào)， 2004；16(1):17～19
4 Altera Corporation. Cyclone Device Handbook .Volume 1.available at http://www.Altera.com.
5 曲英杰，劉衛(wèi)東，戰(zhàn)嘉瑾. 可重構(gòu)密碼協(xié)處理器簡(jiǎn)介及其特性. 計(jì)算機(jī)工程， 2004;30(13)

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

一种基于FPGA的可重构密码芯片的设计与实现

日期： 2008-05-20

作者：杨晓辉， 戴紫彬

相關(guān)內(nèi)容

作者：杨晓辉，戴紫彬