《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 可編程邏輯 > 業(yè)界動(dòng)態(tài) > 基于FPGA的JPEG解碼器設(shè)計(jì)與實(shí)現(xiàn)

基于FPGA的JPEG解碼器設(shè)計(jì)與實(shí)現(xiàn)

2008-07-28
作者:劉小衛(wèi),周劍揚(yáng),黃云鷹,劉旻燾

??? 摘 要: 為滿足SoC中JPEG靜止圖像實(shí)時(shí)解壓縮要求,在完成JPEG解碼器C語(yǔ)言建模的基礎(chǔ)上,采用自頂向下的設(shè)計(jì)方法,完成了JPEG Baseline解碼器設(shè)計(jì),并在FPGA開(kāi)發(fā)板上驗(yàn)證了設(shè)計(jì)結(jié)果。該設(shè)計(jì)與ACTEL、4I2I等公司的IP核相比具有相近的解壓縮速度,能滿足實(shí)時(shí)解碼要求。
??? 關(guān)鍵詞: JPEG;FPGA;解碼器;IDCT

?

??? 隨著多媒體技術(shù)的蓬勃發(fā)展,視頻編解碼技術(shù)得到了長(zhǎng)足的進(jìn)步,人們先后制定了多個(gè)數(shù)字圖像視頻編解碼標(biāo)準(zhǔn)。其中JPEG仍然是目前最流行的靜止圖像壓縮格式,在手持設(shè)備和網(wǎng)絡(luò)中有廣泛的應(yīng)用。
??? 本論文工作是無(wú)線投影機(jī)控制器設(shè)計(jì)中的一部分,見(jiàn)圖1。該控制器以開(kāi)放源代碼處理器LEON3為核心,具有以太網(wǎng)、VGA、PCI等接口,PCI接口用來(lái)連接無(wú)線網(wǎng)卡,VGA接口用來(lái)連接投影機(jī),這樣構(gòu)成一個(gè)無(wú)線投影系統(tǒng)。PC機(jī)通過(guò)有線網(wǎng)絡(luò)或無(wú)線網(wǎng)絡(luò)向控制器傳輸JPEG壓縮圖像數(shù)據(jù)" title="圖像數(shù)據(jù)">圖像數(shù)據(jù),經(jīng)過(guò)解碼器解碼后顯示在投影儀上,從而實(shí)現(xiàn)多臺(tái)電腦共享一臺(tái)投影機(jī),并且避免了連線的麻煩,具有一定的市場(chǎng)前景??紤]到系統(tǒng)的靈活性,本控制器選用Altera FPGA作為實(shí)現(xiàn)平臺(tái),設(shè)計(jì)可以無(wú)縫地轉(zhuǎn)移到Altera Hardcopy技術(shù),從而實(shí)現(xiàn)低成本。

??????????????????????????


??? 本設(shè)計(jì)利用硬件描述語(yǔ)言(VHDL)設(shè)計(jì)了JPEG Baseline的解碼系統(tǒng)。
1 JPEG解碼器原理
??? JPEG解碼器主要由四部分組成:圖像頭信息的讀取、熵解碼、反量化" title="反量化">反量化、IDCT(反離散余弦變換" title="離散余弦變換">離散余弦變換),其數(shù)據(jù)流圖見(jiàn)圖2。


??? 從圖中可以看出,解碼器首先從JPEG圖像數(shù)據(jù)中讀取Header信息,得到與解碼相關(guān)的如哈夫曼表、量化表以及圖像大小等信息,并且將這些信息存儲(chǔ)在RAM或者寄存器中,供后面的步驟調(diào)用。
??? 在圖像頭信息讀取完成后,解碼器進(jìn)一步讀取壓縮編碼的數(shù)據(jù)并對(duì)其進(jìn)行熵解碼。壓縮編碼的數(shù)據(jù)采用哈夫曼(Huffman)編碼。哈夫曼編碼是一種常用的壓縮編碼方法,是Huffman于1952年為壓縮文本文件建立的。它的基本原理是:將頻繁使用的數(shù)據(jù)用較短的代碼代替,而較少使用的數(shù)據(jù)用較長(zhǎng)的代碼代替,每個(gè)數(shù)據(jù)的代碼各不相同。這些代碼都是二進(jìn)制碼,且碼的長(zhǎng)度可變,因此哈夫曼編碼是可變長(zhǎng)編碼的一種。在JPEG中采用游程編碼與范式huffman編碼進(jìn)行數(shù)據(jù)的壓縮存儲(chǔ),并且直流系數(shù)(DC)與交流系數(shù)(AC)分開(kāi)編碼,提高了壓縮效率。因而在熵解碼過(guò)程中需要分別對(duì)直流系數(shù)和交流系數(shù)分別解碼。當(dāng)前直流系數(shù)為上一個(gè)直流系數(shù)加上當(dāng)前熵解碼數(shù)據(jù)(即殘差)。
??? 當(dāng)解碼完一個(gè)MCU(Minimal Coded Unit)后,接下來(lái)就是進(jìn)行反量化的操作,即將解碼出來(lái)的數(shù)據(jù)乘以一個(gè)量化系數(shù)。
??? 最后是IDCT(反離散余弦變換)操作,即DCT(離散余弦變換)的反變換。離散余弦變換(DCT)是N.Ahmed等人在1974年提出的正交變換方法,它常被認(rèn)為是對(duì)語(yǔ)音和圖像信號(hào)進(jìn)行變換的最佳方法。通過(guò)DCT變換,將數(shù)據(jù)從一個(gè)域變換到另外一個(gè)域,其大多數(shù)高頻分量的系數(shù)變?yōu)?。人眼對(duì)低頻分量比較敏感,對(duì)高頻分量則不太敏感;因而量化的結(jié)果是去掉了不太重要的高頻分量,降低了碼率。在JPEG解碼過(guò)程中需要通過(guò)IDCT還原圖像原始數(shù)據(jù)。IDCT部分是計(jì)算量最大" title="最大">最大的單元,對(duì)此單元設(shè)計(jì)的好壞將直接影響到解碼速度。
2 JPEG解碼器設(shè)計(jì)與實(shí)現(xiàn)
??? 針對(duì)JPEG解碼流程特點(diǎn),本JPEG解碼器硬件總體設(shè)計(jì)如圖3所示。JPEG CONTROLLER負(fù)責(zé)調(diào)度各個(gè)模塊的執(zhí)行;Src_ram存儲(chǔ)著JPEG原始圖像數(shù)據(jù);Addr_gen模塊產(chǎn)生下一個(gè)需要讀取字節(jié)的地址;Read_markers模塊讀取JPEG圖像的圖像頭信息,并且將頭信息保存在Register files中,相應(yīng)的量化表信息及huffman表將存儲(chǔ)在Dqt rams和Dht rams中;Huff_derived_tbl是由huffman表生成的用于熵解碼的表格;Decode MCU 模塊從Src_ram讀取JPEG圖像數(shù)據(jù)并解碼,解碼出來(lái)的數(shù)據(jù)將逆zig-zag順序存儲(chǔ)在Block ram中;IDCT模塊讀取Block ram中的哈夫曼解碼數(shù)據(jù)進(jìn)行反量化和IDCT變換,之后將數(shù)據(jù)輸出到Ram。下面將對(duì)各個(gè)模塊的設(shè)計(jì)作詳細(xì)的介紹。
2.1 Addr_gen模塊設(shè)計(jì)
??? 此模塊用于產(chǎn)生讀取Src_ram的地址并生成下一個(gè)要讀取字節(jié)的地址。其硬件實(shí)現(xiàn)如圖4虛線右邊部分所示。在非跳轉(zhuǎn)情況下,當(dāng)RD信號(hào)有效時(shí),Addr_gen計(jì)數(shù)器每次遞增1個(gè)單位。
??? 跳轉(zhuǎn)情況下,即skip有效時(shí),其計(jì)數(shù)器工作如圖4虛線左邊部分所示,當(dāng)讀入地址為Addr_n的數(shù)據(jù)后需要跳轉(zhuǎn)k個(gè)單位的字節(jié)(Skip_num=k),因?yàn)樵谧x取地址為Addr_n的數(shù)據(jù)Data_n后地址計(jì)數(shù)已經(jīng)增加了一個(gè)單位,因而在第三個(gè)時(shí)鐘周期能跳轉(zhuǎn)到地址為Addr_n+1+k的數(shù)據(jù),而這第三個(gè)時(shí)鐘周期讀出來(lái)的數(shù)據(jù)Data_n+1將會(huì)被忽略。從第四個(gè)時(shí)鐘起此模塊將恢復(fù)正常的讀取數(shù)據(jù)功能。


2.2 Read_markers模塊設(shè)計(jì)" title="模塊設(shè)計(jì)">模塊設(shè)計(jì)
??? Read_markers讀取JPEG文件頭信息并且解釋?zhuān)梢韵伦幽K組成,見(jiàn)圖5虛線左邊部分。
??? (1)First_marker:判斷文件是否為JPEG文件,即判斷開(kāi)始的2B是否為FF D8;
??? (2)Next_marker:查找下一個(gè)標(biāo)志;
??? (3)Get_sos:讀取sos(start of scan);
??? (4)Skip_var:跳過(guò)一些信息時(shí)被調(diào)用,給Addr_gen模塊傳送跳過(guò)信息標(biāo)志;
??? (5)Get_sof:讀取sof(start of frame);
??? (6)Get_dht:讀取huffman表信息,存儲(chǔ)在Dht rams(見(jiàn)圖1);
??? (7)Get_dqt:讀取量化表信息,并存儲(chǔ)在Dqt rams(見(jiàn)圖1);
??? (8)Get_dri:讀取重起間隔,以MCU(Minimum Coded Unit)為單位。
??? 硬件實(shí)現(xiàn)利用FSM(有限狀態(tài)機(jī))來(lái)進(jìn)行控制。其模塊調(diào)度示意圖見(jiàn)圖5虛線右邊部分。

?


2.3 Decode_MCU模塊設(shè)計(jì)
??? Decode_MCU是jpeg解碼器設(shè)計(jì)中一個(gè)非常重要的單元,也是正式解碼的開(kāi)始。本設(shè)計(jì)中此模塊的設(shè)計(jì)見(jiàn)圖6虛線框中設(shè)計(jì),主要由四個(gè)子模塊組成:Fill_buffer、Decode_block&IZZ、Process_restart和Controller。
??? (1)Fill_buffer:當(dāng)32BITS_REG中的比特?cái)?shù)不夠時(shí)控制器將啟動(dòng)此模塊讀取Src_ram中的數(shù)據(jù)并且加載到32bits_reg中,并且去掉碼流中的填充數(shù)據(jù)。
??? (2)Decode_block&IZZ:huffman解碼,并且將解碼數(shù)據(jù)逆zig_zag順序輸出。
??? (3)Process_restart:當(dāng)JPEG圖像中有restart interval(Get_dri)標(biāo)志,在解碼完由Get_dri規(guī)定的n個(gè)MCU后,控制器首先調(diào)用此模塊來(lái)進(jìn)行同步(在網(wǎng)絡(luò)傳輸中非常重要)。
?? ?(4)Controller:控制協(xié)調(diào)各模塊的執(zhí)行。
??? 核心模塊Decode_block硬件實(shí)現(xiàn)如圖6,虛線右邊是EXTEND[1]部分,采用查找表實(shí)現(xiàn)。Get_buffer即圖6中的32BITS_REG, Bits_left記錄32BITS_REG中剩余的比特?cái)?shù)。Huff_D模塊每啟動(dòng)一次解碼一個(gè)熵編碼數(shù)據(jù)。由于DC編碼采用DPCM編碼,解碼直流(DC)時(shí)需要增加一個(gè)時(shí)鐘周期來(lái)加上上一個(gè)DC的值,從而得出如圖6所示的output,解碼交流系數(shù)(AC)時(shí)則在EXTEND后直接輸出。Sel_s_input為”00”時(shí),選通huffman解碼數(shù)據(jù);為”01”時(shí),選通EXTEND后的數(shù)據(jù);為”10”時(shí),選通加上了last_dc_val的數(shù)據(jù)。

?


2.4 IDCT模塊設(shè)計(jì)
??? IDCT(Inverse Discrete Consine Transform)是JPEG解碼器中最耗資源和計(jì)算量最大的單元。本設(shè)計(jì)為減少內(nèi)存讀取,提高解碼速度,將反量化也放在IDCT模塊中實(shí)現(xiàn)。
??? 離散余弦變換的公式和離散余弦逆變換的公式如下:
??

?

??? 經(jīng)分析公式(1)可以做如下等效變換:
???


??? 即通過(guò)兩次一維的IDCT變換即可實(shí)現(xiàn)二維的IDCT。考慮到數(shù)據(jù)的讀取,本設(shè)計(jì)IDCT模塊的設(shè)計(jì)如圖7虛線框中所示。
??? 實(shí)現(xiàn)過(guò)程:首先讀取Block ram的一列,相應(yīng)的反量化數(shù)據(jù)從Dqt ram中讀取,經(jīng)過(guò)IQ(反量化單元,即乘法器)后的8個(gè)數(shù)據(jù)存儲(chǔ)在regs中,之后控制器啟動(dòng)一維IDCT變換,并將反變換后的數(shù)據(jù)存儲(chǔ)在REG FILES的一列中。當(dāng)一個(gè)Block ram中的8列數(shù)據(jù)全部反量化和IDCT變換后,控制器將切換成對(duì)REG FILES中一行的數(shù)據(jù)進(jìn)行一維IDCT變換,變換后的數(shù)據(jù)存儲(chǔ)在REG FILES中的一行中,之后再進(jìn)行下一行變換,直到8行數(shù)據(jù)全部IDCT 變換完?;趨⒖嘉墨I(xiàn)[2]的一維IDCT實(shí)現(xiàn)具有資源比較小和實(shí)現(xiàn)簡(jiǎn)單的特點(diǎn),通過(guò)對(duì)IDCT反變換矩陣系數(shù)分析,一維IDCT奇偶數(shù)據(jù)變換具有不同的結(jié)構(gòu)化特點(diǎn),在此可以進(jìn)行單獨(dú)的設(shè)計(jì),最后將兩部分的結(jié)果數(shù)據(jù)進(jìn)行碟形加減操作,得到一維IDCT的運(yùn)算結(jié)果(見(jiàn)圖7)。這樣變換完的數(shù)據(jù)即可進(jìn)行輸出,送到顯示單元進(jìn)行色彩變換和其它后續(xù)處理后顯示。

2.5 測(cè)試與結(jié)果
????? 本設(shè)計(jì)采用的硬件開(kāi)發(fā)平臺(tái)為ALTERA DE2,F(xiàn)PGA為EP2C35F672C6,在quartusii 5.0中進(jìn)行綜合,所耗資源和最大時(shí)鐘頻率見(jiàn)表1。2005年ACTEL[3]公司推出的JPEG-D IP的速度針對(duì)不同的平臺(tái)其速度變化從31M~69M,同年4I2I[4]公司推出的JPEG-D的最大速率為40M,從速度可以看出本設(shè)計(jì)達(dá)到了實(shí)時(shí)解碼的要求。

?


??? 將VHDL與C語(yǔ)言實(shí)現(xiàn)的JPEG解碼器對(duì)圖像解碼產(chǎn)生的結(jié)果進(jìn)行對(duì)比,從而可以判斷解碼正確與錯(cuò)誤。通過(guò)結(jié)果對(duì)比,本設(shè)計(jì)結(jié)果完全正確。
??? 本設(shè)計(jì)嚴(yán)格按照VLSI自頂向下設(shè)計(jì)的一般流程,首先進(jìn)行C語(yǔ)言級(jí)建模[5],從而得到測(cè)試矢量和JPEG硬件解碼器的總體架構(gòu);之后完成了各個(gè)頂層模塊和子模塊的接口定義;最后進(jìn)行各個(gè)模塊的VHDL實(shí)現(xiàn)。從結(jié)果可知達(dá)到了實(shí)時(shí)解碼要求,并且節(jié)約了資源。


參考文獻(xiàn)
[1] CCITT Rec.T.81(1992 E)104-105.
[2] Chris.tophLoeffler,Adriaan.Ligtenberg.Practical? fast 1-D?DCT algorithms with 11 multiplication.[J]IEEE 1989.988-990.
[3] http://www.cast-inc.com.
[4] http://www.4i42.com.
[5] http://www.smalleranimals.com/.

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。