摘 要: 介紹了一種新的基于三維離散余弦變換的彩色圖像壓縮方法。該方法把彩色圖像看作是一種三維信號,通過三維離散余弦變換,不僅去除了圖像R、G、B分量內(nèi)的相關(guān)性,同時能夠去除R、G、B分量之間的相關(guān)性,因此,在保留圖像質(zhì)量的同時,能夠達到更高的壓縮率。另外,該方法還具有簡單、速度快等優(yōu)點。實驗表明,這是一種好的壓縮方法。
關(guān)鍵詞: 離散余弦變換;圖像壓縮;彩色圖像;圖像處理
隨著科技的發(fā)展以及人們對物質(zhì)精神文化的追求,信息已經(jīng)成為時代的重要特征,而圖像是人們傳遞信息的主要途徑之一。由于一幅沒有壓縮的圖像的數(shù)據(jù)原始量太大,給圖像的傳輸和存儲帶來很大的不便。因此,圖像壓縮算法成為圖像處理領(lǐng)域重要的課題,各種新穎、高效率的圖像壓縮算法層出不窮。
和R、G、B所決定的,因此,可以把每一個灰度值表示為f(x,y,u),其中x、y表示像素點的位置坐標(biāo),u表示的是R分量、G分量還有B分量??梢约s定,u=1時,表示的是R分量;u=2時,表示的是G分量;u=2時,表示的是B分量。這樣,就可以把一幅彩色圖像表示成為一個三維信號。
圖像壓縮是指在保證一定的圖像質(zhì)量的情況下,用盡可能少的數(shù)據(jù)來表示該圖像。能夠?qū)D像進行壓縮的原因是圖像的原始數(shù)據(jù)當(dāng)中存在著信息冗余,去除或者減少這些冗余信息,就能夠用更少的數(shù)據(jù)來表示圖像,起到壓縮圖像的目的。
1 DCT變換和基于DCT變換的信號壓縮原理
1.1 一維DCT變換和二維DCT變換
離散余弦變換(DCT)誕生于1974年,由AHMED和RAO首先給出了它的定義式。
一維和二維DCT變換及其逆變換的定義式可參看參考文獻[1]和參考文獻[2]。一維DCT和二維DCT變換都有正變換及其對應(yīng)的逆變換。正變換把信號變換到頻域,然后由逆變換重構(gòu)信號。把信號變換到頻域,就可以利用頻域的一些特點對信號進行處理,從而取得良好的效果。
1.2 DCT系數(shù)的聚集性和基于DCT變換信號壓縮原理 DCT變換具有K-L變換近似的良好性質(zhì),信號經(jīng)過DCT變換后,能量具有集中性,表現(xiàn)在DCT變換后,數(shù)值大的系數(shù)會集中在特定的區(qū)域,這個性質(zhì)可以用來進行信號壓縮。在進行信號存儲或者信號傳輸時,僅僅存儲或者傳輸數(shù)值大的數(shù)據(jù),省略數(shù)值小的數(shù)據(jù),從而起到壓縮的作用。由于數(shù)值大的系數(shù)都會集中在特定的區(qū)域,因此處理起來就非常方便。
重構(gòu)信號時,把省略了的數(shù)值用0代換,然后進行逆變換,就能夠得到原信號。在壓縮和解壓縮過程中,因為忽略了DCT系數(shù)中的一些很小的數(shù)值,所以重構(gòu)出來的信號與原來的信號相比會有誤差,這是一種有損壓縮。DCT系數(shù)矩陣系數(shù)保留得越多,重構(gòu)的信號與原來的就越接近;系數(shù)保留得越少,重構(gòu)信號質(zhì)量就會下降得越多。
式(8)是三維DCT變換用于彩色圖像壓縮的矩陣表達形式。彩色圖像的R、G、B分量經(jīng)過變換之后,變成了頻域的DCT系數(shù),極大地去除了原始圖像數(shù)據(jù)的相關(guān)性。根據(jù)DCT系數(shù)矩陣數(shù)值的特點,僅保留少數(shù)在左上角較大的系數(shù),而忽略右下角近似為零的系數(shù),從而把圖像進行了壓縮。然后用處理后的DCT系數(shù)逆變換,重構(gòu)原始圖像:
通過以上4個步驟,就可以對彩色圖像進行大壓縮比的壓縮。當(dāng)原始的彩色圖像需要進行存儲和傳輸時,僅僅存儲和傳輸經(jīng)過取舍得到的上述3個矩陣的數(shù)值就可以了,數(shù)據(jù)量比原始圖像大大地減少了。那么如何用這些數(shù)據(jù)重構(gòu)原始圖像呢?重構(gòu)圖像與圖像壓縮是逆過程,步驟如下。
(1)把經(jīng)過系數(shù)取舍的系數(shù)矩陣Xc(k,l,0)、Xc(k,l,1)和Xc(k,l,2),對省略了的系數(shù)以0代替,每個矩陣恢復(fù)到大小為8×8的矩陣,然后分別進行二維DCT逆變換;
(2)利用式(9)計算出每一小塊R、G、B分量的值;
(3)將每一小塊按原來的位置合并成一幅完整的圖像。
由于系數(shù)矩陣Xc(k,l,0)、Xc(k,l,1)和Xc(k,l,2)的系數(shù)經(jīng)過取舍舍去了一些值很小的系數(shù),因此重構(gòu)的圖像與原來的圖像是有所區(qū)別的。但適當(dāng)控制壓縮比,得到的圖像質(zhì)量還是相當(dāng)好,與原來圖像差別不大。
3 實驗結(jié)果
對圖像壓縮算法的好壞評價標(biāo)準(zhǔn)主要有兩方面:一是壓縮比,在滿足一定的圖像質(zhì)量前提下,壓縮比越大越好;二是圖像質(zhì)量,壓縮后的圖像應(yīng)該是人眼可以接受的,壓縮后的圖像的質(zhì)量不能退化得太厲害,如壓縮后的圖像與原來圖像相比已經(jīng)面目全非,那么這個圖像壓縮就沒有意義了。
壓縮比是一個很客觀的指標(biāo),就是原來圖像的數(shù)據(jù)量與壓縮后圖像數(shù)據(jù)量的比值,即壓縮比=原圖像數(shù)值大小/壓縮后的圖像數(shù)值大小。對于圖像質(zhì)量好壞的評價,目前并沒有通行的標(biāo)準(zhǔn),可以說是一項很主觀的工作。當(dāng)然,圖像質(zhì)量也有一些客觀的指標(biāo),例如均方誤差(MSE)、峰值信噪比(PSNR),但這些客觀的指標(biāo)并不完美,有一定的局限性,并不能完全反映人的感受,與人對圖像的主觀感受并不完全一致。因此,觀察者仍然是圖像質(zhì)量優(yōu)劣的最終判斷者。
本文采用512×512的彩色圖像作為測試圖像,以驗證本算法的有效性,結(jié)果如圖1所示。壓縮后圖像質(zhì)量主要是采用主觀評價方法,以人眼看不出與原始圖像有差別的前提下,能夠達到的最大壓縮比。
其中,圖1(a)是原始圖像,圖1(b)保留了DCT系數(shù)矩陣Xc(k,l,0)中左上角5×5個系數(shù),Xc(k,l,1)中左上角4×4個系數(shù),Xc(k,l,2)中左上角3×3個系數(shù),壓縮比為4:1;圖1(c)保留了DCT系數(shù)矩陣Xc(k,l,0)中左上角3×3個系數(shù),Xc(k,l,1)中左上角2×2個系數(shù),Xc(k,l,2)中左上角1×1個系數(shù),壓縮比14:1;圖1(d)保留了DCT系數(shù)矩陣Xc(k,l,0)中左上角2×2個系數(shù),Xc(k,l,1)中左上角1×1個系數(shù),Xc(k,l,2)中左上角1×1個系數(shù),壓縮比為32:1。
從實驗結(jié)果可以看出,當(dāng)壓縮比為4:1時,壓縮后的圖像很好地保留了原來圖像的色彩和細節(jié),從肉眼看,與原來圖像差別不大;當(dāng)壓縮比為14:1時,圖像質(zhì)量沒有明顯改變,色彩與細節(jié)方面沒有明顯變差,肉眼看依然可以接受;當(dāng)壓縮比為32:1時,從圖像邊緣上可以看到一些鋸齒狀的痕跡,有些模糊,細節(jié)有所缺失,但顏色依然與原圖像保持一致。因此,本文算法在壓縮比達到14:1時,能夠保持很好的圖像質(zhì)量,做到壓縮比與圖像質(zhì)量的平衡。
本文在傳統(tǒng)的二維DCT變換的基礎(chǔ)上提出了三維DCT變換,并將其用于彩色圖像壓縮。而在壓縮算法中,將其轉(zhuǎn)化為二維DCT變換,減少了算法的復(fù)雜度和運算量。通過一系列實驗,表明該算法具有壓縮比大、算法簡單和速度快的特點。
參考文獻
[1] 章毓晉. 圖像處理和分析[M].北京:清華大學(xué)出版社,1999.
[2] 胡廣書. 數(shù)字信號處理理論、算法與實現(xiàn)[M]. 北京:清華大學(xué)出版社,2012.
[3] 蘇志武,林定祥,章文輝.數(shù)字電視系統(tǒng)測量與監(jiān)測[M]. 北京:電子工業(yè)出版社, 2009.
[4] OPPENHEIM A V.信號與系統(tǒng)[M].劉樹堂,譯.北京:電子工業(yè)出版社, 2013.
[5] SKLAR B.數(shù)字通信(第2版)[M].徐平平,等,譯.北京:電子工業(yè)出版社, 2010.