《電子技術應用》
您所在的位置:首頁 > 其他 > 業(yè)界動態(tài) > 一種反映人眼視覺特性的JPEG壓縮編碼

一種反映人眼視覺特性的JPEG壓縮編碼

2009-08-31
作者:唐躍林 肖沙里 姚富光 丘

??? 摘? 要: 在分析標準JPEG編碼與解碼過程的基礎上,利用人眼的視覺特性調(diào)整量化矩陣,提高了編碼器的壓縮性能。

??? 關鍵詞: JPEG? 圖像壓縮? 人眼視覺特性? 量化

?

  JPEG標準不僅適用于靜止圖像的壓縮,也是電視圖像序列中幀內(nèi)圖像編碼所采用的方法。由于JPEG具有高的壓縮比和較小的圖像質(zhì)量失真,使得其廣泛應用于多媒體和網(wǎng)絡程序中。在JPEG編碼過程中,DCT系數(shù)的量化對圖像質(zhì)量和壓縮率有著重要影響。本文將討論根據(jù)人眼的視覺特性來相應地調(diào)整量化矩陣,以提高編碼器的壓縮性能。

1?JPEG編碼與解碼分析

  JPEG標準有4種編碼方式,其中基于DCT的編碼與解碼過程分別如圖1和圖2所示。

?

  在JPEG編碼過程中,正向離散余弦變換(FDCT)、DC差分脈沖編碼、AC系數(shù)排序及熵編碼均可認為對圖像質(zhì)量沒有影響。而對圖像質(zhì)量和壓縮率起關鍵作用的是量化過程。對DCT系數(shù)進行量化的目的是:在滿足圖像質(zhì)量的要求下進一步提高壓縮率。量化的出發(fā)點是對于人眼敏感的低頻系數(shù)及亮度信息進行細量化,以提高圖像的質(zhì)量。而對于人眼不敏感的高頻系數(shù)及色度信息采用較大的量化間隔,以取得更大的壓縮比。量化的方法是對每一個DCT系數(shù)F(u,v)除以相應的量化間隔Q(u,v)并取整,即:FQ(u,v)=Integer Round(F(u,v)/Q(u,v))。

  評價JPEG壓縮算法性能的一個重要指標是看它能否在給定的失真下產(chǎn)生最小的壓縮文件,或者能否在給定壓縮文件大小的情況下產(chǎn)生最小失真。而量化是影響圖像質(zhì)量和壓縮文件大小的主要因素。細量化帶來小的重建圖像失真,但文件大小卻得不到控制。粗量化可以得到更大的壓縮比,而圖像質(zhì)量卻得不到保證。如何在保證圖像質(zhì)量的情況下取得更高的壓縮比一直是人們關注的焦點。本文在JPEG基本順序編碼系統(tǒng)下,考慮人眼視覺特性,利用圖像的局部空間頻率特性來相應地調(diào)整量化步長。改進后的編碼系統(tǒng)如圖3所示。源圖像經(jīng)FDCT變換后,通過計算確定宏塊(Macro Block)的類別及計算宏塊的活動性,以相應調(diào)整量化步長,得到最終的量化表。

?

2?基于人眼視覺特性的量化表的產(chǎn)生

  JPEG標準推薦了亮度和色度二個基本量化表(默認量化表),其中考慮了人眼對空間頻率的敏感性,即對人眼敏感的低頻系數(shù)采用較小的量化步長,對人眼不敏感的高頻系數(shù)采用較大的量化步長。然而,這并未充分考慮人眼的視覺特性。人眼不僅對宏塊的空間頻率敏感性不同,而且,還依賴于其周圍的環(huán)境。人眼視覺系統(tǒng)對于邊緣區(qū)或均勻圖案區(qū)比復雜圖案區(qū)更敏感。而標準的JPEG使用的是線性均勻量化器,不能反映圖像的局部變化特征,從而增加了重建圖像的主觀失真,影響圖像的質(zhì)量。因此,針對不同區(qū)域的宏塊,相應地調(diào)整量化步長,以減少圖像壓縮的主觀失真及提高壓縮率,是本文要解決的問題。

2.1 宏塊類別的界定

  由上面的論述可知,不同圖案區(qū)的宏塊相對于人眼具有不同的視覺敏感性。因此可利用宏塊的象素梯度(Pixel Gradients)信息及亮度信息來界定宏塊類別,同時,也相應地反映出圖像的主觀復雜度。

  宏塊的象素梯度信息計算:

  

  式中,sp(i,j)為原始宏塊的相應象素值;det_H、det_V分別為宏塊的水平和垂直象素梯度信息;f_det用來度量宏塊的復雜性;TH1為人眼視覺系統(tǒng)所能感覺到的圖像變化的門限值,它隨宏塊的平均亮度而改變,即:

  

  根據(jù)上述公式,對宏塊可作如下分類及其相應的量化調(diào)整因子為:

    

  式中,M是量化調(diào)整因子,NO1、NO2、NO3為宏塊的象素梯度閾值。

2.2 宏塊活動性的計算

  宏塊的活動性反映了宏塊的復雜程度。活動性越高,人眼視覺感知能力越小,可以采用相對較大的量化步長。在MPEG-2 TM5中,宏塊的活動性是以4個亮度子塊的象素方差最小值作為度量標準的。本文為減少計算量,采用直接計算4個亮度子塊DCT中AC系數(shù)的絕對值之和的最小值作為該宏塊活動性水平的統(tǒng)計標準。即:

  

  宏塊的平均活動性則以所有8×8亮度子塊的AC系數(shù)的絕對值之和的平均值來表示。即:

  avg_act=mean(abs_sum)

2.3 量化表的產(chǎn)生

  根據(jù)上面所計算的宏塊的活動性,參考MPEG-2 TM5中計算宏塊復雜性的方法,可得歸一化活動性函數(shù)為:

  

  宏塊的活動性函數(shù)反映了人眼的視覺特性。當塊的內(nèi)容復雜、包含高頻成分較多、宏塊活動性較高時,人眼對此不敏感,可以采用較大的量化步長。相反,對于平坦區(qū)等活動性較低,人眼視覺相對敏感的宏塊則進行細量化。同時,考慮到不同的宏塊類別,則最后的量化矩陣為:

  

式中,Qj為第j個宏塊的量化矩陣;Qdef為JPEG推薦的量化表;Qsub為根據(jù)不同類型的宏塊而產(chǎn)生的量化調(diào)整矩陣。

3?實驗結(jié)果

  實驗中,針對二幅圖像(Lenna、Clumbia),利用本文的方法和使用默認量化矩陣的標準JPEG壓縮方法進行了模擬對比實驗,采用峰值信噪比PSNR(Peak Signal-to-Noise Ratio)和壓縮比CR(Compression Ratio)二項指標作為實驗結(jié)果的評價。實驗結(jié)果如表1所示。

?

  從表1可以看出,本文的方法優(yōu)于采用默認量化矩陣的標準JPEG壓縮編碼,提高了圖像的壓縮比和重構(gòu)圖像的質(zhì)量。

4? 結(jié)束語

  本文在分析標準JPEG編碼與解碼過程的基礎上,著重討論了與圖像質(zhì)量和壓縮率密切相關的量化過程。在此基礎之上,利用人眼的視覺特性,通過確定宏塊的類別和分析宏塊的活動特性,相應地調(diào)整量化矩陣,以達到提高圖像的壓縮比和重構(gòu)圖像質(zhì)量的目的。實驗結(jié)果表明,該方法的壓縮性能優(yōu)于采用默認量化表的標準JPEG的壓縮性能。

?

參考文獻

1? 張益貞,劉滔.Visual C++實現(xiàn)MPEG/JPEG編解碼技術.北京:人民郵電出版社,2002

2? 林福宗,陸達.多媒體與CD-ROM.北京:清華大學出版社,1994

3? Chung T Y,Jung K H,Young N O et al.Quantization Control for Improvement of Image Quality Compatible

with MPEG2.IEEE Transactions on Consumer Electronics,1994;40(4)

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。