欧美日韩精品视频二区,不满18勿看的1000视频

基于組點跳躍的JPEG2000位平面掃描方案

曾昭貴, 仁福林

摘要： 針對超遙感圖像實時壓縮的需求，提出了基于組的像素點跳躍(GBPS)EBCOT掃描方案。該方案可以大幅度提高掃描效率。本設計用VHDL編寫，目標器件為Altera Stratix系列的EP1S25F672C6，模塊穩(wěn)定運行在120MHz，平均每個時鐘周期可以產生0.95個上下文信息。

關鍵詞： STRATIX EP1S25F672C6 JPEG2000 EBCOT 編碼塊

Abstract：

Key words :

　　摘　要： 針對超遙感圖像實時壓縮的需求，提出了基于組的像素點跳躍(GBPS)EBCOT" title="EBCOT">EBCOT掃描方案。該方案可以大幅度提高掃描效率。本設計用VHDL編寫，目標器件為Altera Stratix" title="Stratix">Stratix系列的EP1S25F672C6" title="EP1S25F672C6">EP1S25F672C6，模塊穩(wěn)定運行在120MHz，平均每個時鐘周期可以產生0.95個上下文信息。
　　關鍵詞： JPEG2000" title="JPEG2000">JPEG2000 EBCOT 編碼塊" title="編碼塊">編碼塊上下文

　　EBCOT位平面掃描是JPEG2000硬件實現(xiàn)的瓶頸之一。自從聯(lián)合攝影專家組織發(fā)布JPEG2000標準以來，人們一直在尋找一種高效掃描的硬件實現(xiàn)方案，如Kuan-fu Chen^[4]等人提出的GOCS(Group Of Columns Skipping)查詢掃描方案，將位平面上相鄰八列編成一個Group，在對重要傳播通道進行完全掃描的同時,建立后兩個掃描過程的編碼必要性信息表，在進行幅值細化通道和清除通道時可以直接跳過不需要編碼的Group；而Zhu Yue-xin^[1]等人提出了基于多級查詢表的GOCS改進方案，這種優(yōu)化方法進一步提高了掃描效率，但是需要額外的存儲單元。基于列(Column-Based)的點跳過(Pixel Skipping)技術^[3]大大減少了掃描冗余，因而被廣泛應用 ^[1～6]。為減少RAM的訪問頻率,提出了多列并行存儲方案^[5]，但其本質是基于列的掃描結構。這種基于列的操作，列與列之間的轉移需要消耗時鐘周期。平面內三個過程并行處理的方案^[7]，進一步減少了掃描的冗余時間，但這種方法對Tier-2截斷的精度和碼流組織影響比較大。
　　筆者提出了基于組的像素點跳躍GBPS(Group-Based Pixel Skipping)的EBCOT位平面掃描方案。以四列為一組，在組內使用點跳躍(Pixel Skipping)技術。本方案配合流水設計，組之間可實現(xiàn)無縫轉移，極大減少了掃描單元之間轉移的冗余時鐘周期，從而提高了掃描效率。同時亦減少了對緩存RAM的訪問頻率，降低了系統(tǒng)功耗。
1 JPEG2000標準簡介
　　JPEG2000標準提供比JPEG更高的壓縮率和更好的抗誤碼特性,支持單分量或多分量的有損和無損編碼。支持SNR和分辨率的漸進傳輸、感興趣(ROI)編碼、碼流隨機訪問,提供靈活的文件格式,支持用戶信息加載(如水印等)和動態(tài)圖像(Motion JPEG2000)，已被廣泛應用于各個領域的圖像處理。如圖1所示，JPEG2000 首先對原始圖像進行離散小波變換，無失真壓縮采用5/3提升小波變換，有失真壓縮采用9/7提升小波變換。如果是有失真壓縮，還要對小波變換后的系數進行量化。量化后的各個子帶被劃分成大小相等的編碼塊(Code Block)。最后采用率失真優(yōu)化截取的內嵌碼塊編碼算法(EBCOT)對這些編碼塊進行獨立編碼。EBCOT分為Tier-1和Tier-2兩部分，Tier-1又分為位平面掃描、算術自適應編碼器MQ和失真計算；Tier-2對MQ編碼輸出的數據采用PCRD算法進行碼流的截取，得到最終的壓縮數據。解碼是編碼的逆過程，首先對碼流進行EBCOT解碼，然后對反量化后的數據作小波反變換，最后生成重建圖像。

2 JPEG 2000標準定義的EBCOT位平面掃描方法
　　如圖2所示，編碼塊中每個有效位平面列方向上每4個相鄰的點稱為一個編碼列(Coding Column)，處在同一水平方向上的編碼列構成一個帶(stripe)，EBCOT位平面掃描時，列內對點從上到下, 帶內對列從左到右, 編碼塊內對帶從上到下進行Z字型遍歷掃描。除了最高有效位平面只需進行一次清理通道掃描外，其余的有效位平面均要進行三次的掃描通道：有效性傳播通道(PASS1 Significance Propagation)、幅度細化通道(PASS2 Magnitude Propagation)和清除通道(PASS3 Clearup Pass)。編碼塊的所有點都對應一個記錄其重要性的標志，這個標志在編碼塊開始編碼時被初始化為‘0’,表示其不重要，該點變?yōu)橹匾院蟊恢脼?lsquo;1’。如果當前掃描點本身不重要，但其八鄰域內有重要的，則進行有效性傳播通道編碼。如果其本身為重要，則進行幅度細化通道編碼；否則進行清除過程編碼。有效性傳播通道使用零編碼(ZC)原語，幅度細化通道使用幅度細化編碼(MR)原語，清除通道則使用零編碼(ZC)原語或游程編碼(RLC)原語。這些原語產生上下文(CONTEXT)和判決位送給自適應編碼器MQ進行編碼。

3 基于組的EBCOT位平面掃描方案
3.1基于組的點跳躍掃描上下文產生器
　　據統(tǒng)計，如果按照JPEG 2000協(xié)議給出的通道掃描方法，掃描的冗余時間占總時間的70%以上^[2]?；诹械狞c跳躍(Pixel Skipping)方案^[3]與基于啟發(fā)式掃描的組跳躍(GOCS)^[3]結合使用的方案將所需時鐘下降到原來的40％左右^[2]。但是這種方案需要額外的存儲器，并且必須對三個掃描通道中的一個進行完全掃描，所以這種方案有其不理想的地方。同一位平面內三個通道并行的方案^[6]，進一步減少了掃描的冗余時間，但對Tier-2的動態(tài)截斷的精度和碼流組織影響比較大。筆者提出了如圖3所示的基于組的點跳躍掃描GBPS(Group-Based Pixel Skipping)方案。將四列16個點(0~F)看成一個單元，稱之為一組(Group)。其左右白色兩列分別為該組的左鄰域列和右鄰域列，其上下兩行淺色分別為該組的上鄰域行和下鄰域行。組和它的上下鄰域的位平面小波系數均存在位平面小波系數緩存RAM的同一個單元中。在編碼塊非邊界區(qū)域，它的左鄰域列為前一個組的最右邊一列，右鄰域列為下一組的最左邊一列。左右鄰域分別用一個6位寄存器緩存。當掃描編碼塊左邊界時，左鄰域為零，而掃描子塊右邊界時，右鄰域為零。位平面掃描時在16個點中進行跳躍掃描，只對當前過程NBC^[2]為1的點進行掃描。
3.2 組間流水操作
　　基于組的點跳躍主要是為了減少兩相鄰處理單元之間轉移所消耗的時鐘周期，故在硬件實現(xiàn)時組之間采用流水操作。為了實現(xiàn)流水操作，EBCOT掃描被分解成三個處理任務：當前組的上下文掃描編碼、下一組的預處理、再下一組的數據預讀取。這三個處理任務是并行執(zhí)行的，所以對于一個組而言，它的預讀取過程、預處理過程和上下文的掃描編碼過程是流水操作的。如果相鄰的兩個組均有當前掃描通道需要編碼的點，組之間的轉移不需要冗余的時鐘周期，上下文產生器可以每個時鐘周期向算術編碼器MQ提供一個數據輸出。
　　采用GBPS方法的目的，一是跳過當前組當前過程不需要編碼的點，二是減少單元之間轉移所花費的時間。同時亦減少了對內部存儲器的訪問頻率，從而減少系統(tǒng)的功耗。下面將對三個處理任務進行逐一的介紹。
3.2.1 數據預讀取
　　在掃描過程中需要對兩種數據進行預讀?。何黄矫嫘〔ㄏ禂岛椭匾孕畔?FC表)，這兩部分數據都分別存儲在片內RAM中。FC 系數用于表征當前位平面的點是否已變?yōu)橹匾臄祿?，其存儲方式與位平面小波系數的存儲方式相同，如圖3所示。每個編碼塊開始編碼時FC系數的初始值為零，并在編碼過程中進行更新。
　　預讀過程的另一個任務是在讀取過程中對組的左右鄰域寄存器更新數據，使得預處理模塊面對一個帶鄰域的組。

3.2.2 組預處理
　　組預處理模塊首先根據組內16個點各自的鄰域信息計算出其在當前掃描過程中的NBC信息，用一個16位的寄存器進行標記；然后根據該寄存器計算出各點的下一個需要編碼點的位置，實現(xiàn)這一功能需要用到14個四位的位置寄存器np_0～np_D。EBCOT位平面掃描時根據這14個寄存器的信息進行跳躍查詢，例如當前處理點為0，若np_0的值為0xE，那么處理完0后，跳到E點進行處理。極大地提高了掃描的有效性。
3.2.3 上下文編碼掃描模塊
　　有效性傳播通道、幅度細化通道和清除通道三個上下文掃描通道產生上下文的復雜度是不一樣的，后兩個只要進行簡單判斷就可以得出上下文，這兩個過程采用非流水設計，以節(jié)省資源。而有效性傳播過程則比較復雜，有必要采用流水操作，分解成鄰域信息提取、重要性上下文產生、符號位上下文產生和發(fā)送四個過程。如果某點進行重要性編碼只要一個周期，若要進行符號位編碼則需兩個周期。
　　在掃描過程中點0和點F是必掃的兩個點，因為預讀取隔組數據和預處理下一組數據需要兩個時鐘周期，這是本設計唯一會產生冗余時鐘周期的地方。1到E點則根據位置寄存器np_0～np_D的值進行跳躍掃描。對于一個有效位平面中的一點，必然被三個掃描通道中的一個掃描(清除通道的RLC有可能是一個掃描列一起掃描)，故一個有效位平面每個組的冗余時鐘周期小于4。
4 硬件設計
　　這是一個專門針對超大幅圖像實時壓縮的設計，采用了四路編碼塊并行處理的方案。為了驗證系統(tǒng)的性能筆者采用標準的測試圖像進行測試。通過C++對MODELSIM仿真輸出數據統(tǒng)計，各圖像掃描花費的時鐘周期數如表1所示。這里除了“本文系統(tǒng)”以外的數據均來自參考文獻^[2]。
　　上下文掃描模塊資源如表2所示，其中LE和本工程其它模塊一起約束綜合時會有稍許增加。所用的芯片為ALTERA公司Stratix系列的EP1S25F672C6。它有25660個LE、224個M512 RAM、 138個M4K RAM和80個乘法器，以及豐富的時鐘資源。

　　本文以超大幅圖像的實時壓縮為應用背景，并根據FPGA目標芯片資源架構的狀況，提出了一種新的EBCOT位平面掃描方案——基于組的點跳躍(GBPS)。這個方案所花的時鐘周期不到表1中最快方案的三分之一。大量流水操作的應用也使本系統(tǒng)邏輯層次降低，因此獲得良好的時序性能，本模塊具備每秒處理6幅4096×4096的8位灰度遙感圖像的能力。

參考文獻
1 朱悅心.基于多級查詢表的JPEG2000位平面掃描優(yōu)化方法.電子學報, 2004;(5)
2 Gangadhar, M.，Bhatia, D.FPGA based EBCOT architecture for JPEG 2000. Field-Programmable Technology (FPT),2003. Proceedings. 2003 IEEE International Conference, 2003;(12):15～17
3 Kuan-Fu Chen. Analysis and architecture design of EBCOT for JPEG-2000.Circuits and Systems, 2001. ISCAS 2001.The 2001 IEEE International Symposium on, 2001；(5)
4 Yun Long. A high-performance parallel mode EBCOT en-coder architecture design for JPEG2000.SOC Conference, 2004. Proceedings. IEEE International,2004；(9)：12～15
5 Tien-Wei Hsieh, Youn-Long Lin. A hardware accelerator IP for EBCOT Tier-1 coding in JPEG2000 Standard.Embedded Systems for Real-Time Multimedia, 2004. ESTImedia 2004. 2nd Workshop on,2004;(9):6～7
6 Yijun Li, Aly, R.E,Bayoumi, M.A., Mashali, S.A.Parallel high-speed architecture for EBCOT in JPEG2000.Acoustics, Speech, and Signal Processing, 2003. Proceedings. (ICASSP ’03). 2003 IEEE International Conference on, 2003;(4)

原創(chuàng)聲明：此內容為AET網站原創(chuàng)，未經授權禁止轉載。

相關內容