《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 顯示光電 > 設(shè)計(jì)應(yīng)用 > Wyner-Ziv視頻編碼中的碼率控制算法研究
Wyner-Ziv視頻編碼中的碼率控制算法研究
2015年微型機(jī)與應(yīng)用第10期
檀會(huì)娟1,唐加山2
(1.南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003; 2.南京郵電大學(xué) 理學(xué)院,江蘇 南京 210023)
摘要: 分布式視頻編碼系統(tǒng)中,現(xiàn)有碼率控制方法大致分兩類,一種是基于反饋信道,另一種是基于無(wú)反饋信道?;诜答佇诺来a率控制算法雖然可以獲得較高的解碼質(zhì)量,但是時(shí)延大;相反,無(wú)反饋信道碼率控制算法時(shí)延小、實(shí)時(shí)性高,但是有損解碼質(zhì)量。為解決這一矛盾,闡述一種混合碼率控制算法,即在編碼端先估計(jì)出較小的碼率,當(dāng)解碼失敗時(shí),解碼端才利用反饋信道向編碼端請(qǐng)求更多的校驗(yàn)比特直到解碼成功。實(shí)驗(yàn)結(jié)果表明,在相同目標(biāo)碼率下,與有反饋碼率控制算法相比,該算法所需反饋次數(shù)有所減少;與現(xiàn)有無(wú)反饋碼率控制算法相比,對(duì)于不同視頻序列解碼幀的峰值信噪比均有不同程度的提高。
Abstract:
Key words :

  摘  要分布式視頻編碼系統(tǒng)中,現(xiàn)有碼率控制方法大致分兩類,一種是基于反饋信道,另一種是基于無(wú)反饋信道?;诜答佇诺来a率控制算法雖然可以獲得較高的解碼質(zhì)量,但是時(shí)延大;相反,無(wú)反饋信道碼率控制算法時(shí)延小、實(shí)時(shí)性高,但是有損解碼質(zhì)量。為解決這一矛盾,闡述一種混合碼率控制算法,即在編碼端先估計(jì)出較小的碼率,當(dāng)解碼失敗時(shí),解碼端才利用反饋信道向編碼端請(qǐng)求更多的校驗(yàn)比特直到解碼成功。實(shí)驗(yàn)結(jié)果表明,在相同目標(biāo)碼率下,與有反饋碼率控制算法相比,該算法所需反饋次數(shù)有所減少;與現(xiàn)有無(wú)反饋碼率控制算法相比,對(duì)于不同視頻序列解碼幀的峰值信噪比均有不同程度的提高。

  關(guān)鍵詞: 分布式視頻編碼;碼率控制;Wyner-Ziv編碼;反饋信道

0 引言

  隨著無(wú)線多媒體技術(shù)的日益發(fā)展,目前出現(xiàn)的一些新興應(yīng)用場(chǎng)合由于其計(jì)算能力和存儲(chǔ)能力有限,都要求低復(fù)雜度的編碼。這些應(yīng)用場(chǎng)合包括無(wú)線攝像機(jī)、低功率監(jiān)視器、移動(dòng)視頻會(huì)議等。分布式視頻編碼(Distributed Video Coding,DVC)系統(tǒng)是為解決上述問(wèn)題而提出的一種新型的編碼方案。分布式視頻編碼的理論基礎(chǔ)是20世紀(jì)70年代提出的兩個(gè)信息理論:Slepian-Wolf定理[1]和Wyner-Ziv定理[2],其采用幀內(nèi)編碼幀間解碼的思想,將復(fù)雜的運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償?shù)燃夹g(shù)放到解碼端實(shí)現(xiàn),從而降低了編碼端復(fù)雜度。

  DVC方案因其可靈活分配視頻編解碼器的復(fù)雜度,壓縮效率高,抗差錯(cuò)性能強(qiáng)的優(yōu)勢(shì),已經(jīng)成為國(guó)內(nèi)外學(xué)術(shù)界的研究熱點(diǎn),其中碼率控制也是研究熱點(diǎn)之一。碼率控制的目的是通過(guò)調(diào)節(jié)編碼參數(shù)控制單位時(shí)間內(nèi)傳輸?shù)浇獯a端的視頻流,從而使傳輸?shù)谋忍芈誓軌蜻m應(yīng)應(yīng)用需求。如果編碼端傳輸?shù)谋忍芈蔬^(guò)大,解碼端可能來(lái)不及做處理,此時(shí)就會(huì)出現(xiàn)丟包等現(xiàn)象;比特率太小會(huì)造成時(shí)間的浪費(fèi),資源的利用率降低。因此,合理的碼率是視頻壓縮方案需要考慮的問(wèn)題。目前分布式視頻碼率控制方案主要分兩大類,一種基于反饋信道,另一種基于無(wú)反饋信道?;诜答佇诺赖拇a率控制算法是利用反饋信道,解碼端可以告知編碼端解碼情況,如果不成功,編碼端會(huì)向解碼端傳遞更多的校驗(yàn)比特,直到解碼成功為止。雖然利用反饋信道可以較好地控制碼率,解碼端可以獲得比較穩(wěn)定的視頻流,但是解碼端需要多次向編碼端請(qǐng)求校驗(yàn)比特,時(shí)間開(kāi)銷大,從而限制了分布視頻編碼方案在一些實(shí)時(shí)性要求比較高的場(chǎng)合下的使用。基于無(wú)反饋信道的碼率控制算法旨在解決無(wú)反饋信道下如何準(zhǔn)確地估計(jì)出碼率,其缺點(diǎn)是有損解碼質(zhì)量,可能造成視頻不穩(wěn)定等現(xiàn)象。為克服這一矛盾,本文在現(xiàn)有碼率控制算法的基礎(chǔ)上提出了一種混合碼率控制算法,即在編碼端先根據(jù)現(xiàn)有條件估計(jì)出一個(gè)碼率,如果在估計(jì)出的碼率條件下解碼失敗,解碼端可利用反饋信道向編碼端請(qǐng)求校驗(yàn)比特直到成功解碼。

1 Wyner-Ziv視頻編碼方案

001.jpg

  為與現(xiàn)有算法進(jìn)行比較,本文選用比較典型的Discover Wyner-Ziv視頻編碼框架(以早期的斯坦福WZ視頻編解碼結(jié)構(gòu)[3]為基礎(chǔ)),并在此基礎(chǔ)上提出了改進(jìn),具體編解碼流程如圖1所示。圖1中陰影部分是本文在Wyner-Ziv視頻編碼框架上所做的改進(jìn),將在第3節(jié)詳細(xì)介紹。下面簡(jiǎn)單介紹圖1編解碼過(guò)程。

 ?。?)編碼端。首先對(duì)WZ幀進(jìn)行4×4塊的離散余弦變換(DCT),根據(jù)每個(gè)DCT系數(shù)在4×4塊中的位置,將所有系數(shù)重組為系數(shù)帶CK,K=1,2,…,16;然后對(duì)CK進(jìn)行2MK級(jí)均勻量化,從量化后的符號(hào)流中提取比特平面,將比特平面送入LDPCA編碼器編碼,并將編碼生成的校驗(yàn)比特存儲(chǔ)在緩存器中。

  (2)解碼端。首先利用當(dāng)前幀前后兩個(gè)已解碼的關(guān)鍵幀產(chǎn)生邊信息,然后對(duì)邊信息進(jìn)行DCT變換得到WZ幀DCT系數(shù)的估計(jì)值;設(shè)原始WZ幀與邊信息之間的差值被當(dāng)作虛擬信道的噪聲,稱之為相關(guān)噪聲,它滿足拉普拉斯分布,由相關(guān)模型計(jì)算拉普拉斯參數(shù);一旦知道了邊信息的DCT變換系數(shù)和殘差的統(tǒng)計(jì)分布,LDPCA解碼器會(huì)利用接收到的校驗(yàn)位對(duì)邊信息比特面進(jìn)行LDPCA解碼,合并比特面形成量化后的系數(shù)帶;最后利用量化后的系數(shù)帶和邊信息系數(shù)帶重構(gòu)得到WZ幀系數(shù)帶,再進(jìn)行反變換(IDCT)得到解碼后的WZ幀。

2 混合碼率控制算法

  本文編碼端碼率估計(jì)步驟如圖1中陰影部分所示,先在編碼端對(duì)邊信息進(jìn)行估計(jì),再對(duì)邊信息與原始WZ幀的殘差建模,獲得拉普拉斯參數(shù),然后進(jìn)行碼率估計(jì),分比特平面速率估計(jì)和每個(gè)比特的校驗(yàn)碼碼率估計(jì)。詳細(xì)步驟如下。

  2.1 邊信息估計(jì)

  設(shè)XB和XF分別表示當(dāng)前WZ幀的前后參考幀,為了降低Wyner-Ziv編碼器的計(jì)算復(fù)雜度,本文利用XB和XF的簡(jiǎn)單加權(quán)平均來(lái)代替邊信息,即:

  1.png

  其中,A~V32]97U(X(FE$EAAW10NJ.jpg=XF(u,v)/[XF(u,v)+XB(u,v)],A~V32]97U(X(FE$EAAW10NJ.jpg為加權(quán)系數(shù);XB(u,v)和XF(u,v)分別為前后相鄰參考幀在坐標(biāo)(u,v)處的像素值。

  2.2 殘差建模

  設(shè)X是代表WZ幀的隨機(jī)變量,由式(1)得到的邊信息Q}PSW0)PYX@D16S{POD]M70.jpg其實(shí)是原始WZ幀的一個(gè)估計(jì)值,因此Q}PSW0)PYX@D16S{POD]M70.jpg可以看成是有噪聲污染的X,可用式(2)表示二者關(guān)系。

  2.png

  其中,Z表示原始WZ幀以及其估計(jì)值(邊信息)的殘差,即相關(guān)噪聲,服從拉普拉斯分布[4]。Z的概率密度函數(shù)1AU5W[@~08`0WP~2MGONNYD.jpg,A~V32]97U(X(FE$EAAW10NJ.jpg為拉普拉斯參數(shù)。為進(jìn)行碼率控制,需要計(jì)算A~V32]97U(X(FE$EAAW10NJ.jpg值。設(shè)殘差Z(u,v)=Q}PSW0)PYX@D16S{POD]M70.jpg(u,v)-X(u,v),(u,v)為空間坐標(biāo),則可得到相關(guān)噪聲Z的方差z2,再由A~V32]97U(X(FE$EAAW10NJ.jpg=BU}OK1H0])Q8}UF()@XI862.jpg可計(jì)算得到拉普拉斯參數(shù)A~V32]97U(X(FE$EAAW10NJ.jpg。以上參數(shù)A~V32]97U(X(FE$EAAW10NJ.jpg的估計(jì)主要考慮了時(shí)間相關(guān)性,而沒(méi)有考慮空間相關(guān)性。為使拉普拉斯參數(shù)在時(shí)間和空間上更好地適應(yīng)相關(guān)噪聲模型,本文采取下列思想對(duì)A~V32]97U(X(FE$EAAW10NJ.jpg進(jìn)行修正。設(shè)D是WZ幀中當(dāng)前宏塊的周圍宏塊的像素值均值,本文的選取原則如下:

  3.png

  其中,E(Z)是相關(guān)噪聲的期望值。式(3)中第一種情況說(shuō)明當(dāng)前塊與相鄰塊差距比較小,說(shuō)明塊運(yùn)動(dòng)不是很復(fù)雜,此時(shí)邊信息估計(jì)效果比較好。對(duì)于其他情況,直接由相關(guān)噪聲方差得到。仿真實(shí)驗(yàn)表明,同時(shí)考慮拉普拉斯參數(shù)的空時(shí)域相關(guān)性能較好地控制碼率。

  2.3 碼率估計(jì)

  為更好地控制碼率,獲得穩(wěn)定的視頻流且減少解碼端的請(qǐng)求次數(shù)和計(jì)算復(fù)雜度,本文的碼率估計(jì)分為兩部分,包括比特平面速率估計(jì)和每個(gè)比特平面的校驗(yàn)碼碼率估計(jì)。實(shí)驗(yàn)結(jié)果表明,本文的兩重估計(jì)方法在分布式視頻編碼碼率控制方面有較好的性能。

  2.3.1 比特平面速率估計(jì)

  比特平面速率估計(jì)指確定編碼端每秒傳送到解碼器的平面?zhèn)€數(shù),即對(duì)每個(gè)DCT系數(shù)構(gòu)成的比特平面進(jìn)行估計(jì)。由2.2節(jié)相關(guān)噪聲模型得到拉普拉斯參數(shù),圖1中WZ幀經(jīng)4x4 DCT變換,DCT系數(shù)經(jīng)均勻量化器后,則WZ幀的量化失真函數(shù)可用下式計(jì)算得到[5]。

  4.png

  其中,A~V32]97U(X(FE$EAAW10NJ.jpg為拉普拉斯參數(shù),由2.2節(jié)得到;YWX{VQ$WAMOHY]SJT}3_NOO.png為量化步長(zhǎng)且YWX{VQ$WAMOHY]SJT}3_NOO.png=2M-L-1,其中M為比特平面總數(shù),L即為一次需要傳送到解碼端的比特平面?zhèn)€數(shù),在給定失真度D和量化步長(zhǎng)YWX{VQ$WAMOHY]SJT}3_NOO.png下,可計(jì)算得到比特平面速率L。

  2.3.2 校驗(yàn)碼碼率估計(jì)

  本文采用率失真函數(shù)估計(jì)每個(gè)比特平面的校驗(yàn)碼碼率。由分布式信源編碼的率失真模型可得出本文分布式系統(tǒng)的率失真模型如式(5)所示。

  5.png

  其中,3[WP(`3NC2~5YD$TCLK@JE8.pngX2是源信息的方差,D是量化失真,3[WP(`3NC2~5YD$TCLK@JE8.pngZ2是相關(guān)噪聲方差。在實(shí)際編解碼系統(tǒng)中,3[WP(`3NC2~5YD$TCLK@JE8.pngZ2遠(yuǎn)遠(yuǎn)小于3[WP(`3NC2~5YD$TCLK@JE8.pngX2[6],為降低編碼端的計(jì)算復(fù)雜度,可以簡(jiǎn)化R(D),推導(dǎo)過(guò)程如下:

  6.png

3 實(shí)驗(yàn)仿真結(jié)果與分析

004.jpg

  本文選擇兩種標(biāo)準(zhǔn)視頻測(cè)試序列Soccer@30 Hz,Hall Monitor@15 Hz進(jìn)行測(cè)試。將其中的偶數(shù)幀作為關(guān)鍵幀K,奇數(shù)幀作為Wyner-Ziv幀,只對(duì)亮度分量進(jìn)行編碼,采用圖1編解碼框架。表1是不同測(cè)試序列在不同目標(biāo)碼率下,用本文碼率控制方法產(chǎn)生的實(shí)際碼率。從表中可以看出,本文碼率控制算法與實(shí)際碼率誤差平均小于 0.35%,可見(jiàn)本文算法能夠較好地控制碼率。

002.jpg

  另外,與在圖1編碼框架中單純地利用反饋信道控制碼率算法相比,本文碼率控制算法平均反饋次數(shù)可減少40%~58%,從而減少了時(shí)延并可獲得較高效率的解碼,如圖2所示。圖2中的Qi(i=1,2,…,8)是Discover DVC方案中定義的質(zhì)量等級(jí),每一個(gè)質(zhì)量等級(jí)對(duì)應(yīng)不同的量化系數(shù),等級(jí)越高所需碼率越大,解碼一個(gè)WZ幀解碼端會(huì)需要更多的請(qǐng)求次數(shù)。

003.jpg

  參考文獻(xiàn)[7]完全移除了反饋信道,與參考文獻(xiàn)[7]相比,在相同碼率下,本文算法針對(duì)不同測(cè)試序列的峰值信噪比均有不同程度的提高,如圖3所示。由圖3(a)可以看出,對(duì)于運(yùn)動(dòng)復(fù)雜的Soccer視頻序列,本文算法可以使PSNR提高 0.2~0.9 dB;而對(duì)于運(yùn)動(dòng)緩慢的Hall Monitor視頻序列,如圖3(b)所示,本文算法使已解碼圖像PSNR值最高可以提高1.7 dB,可發(fā)現(xiàn)本文算法對(duì)在視頻序列運(yùn)動(dòng)緩慢情況下性能表現(xiàn)比較好,這是由于本文算法考慮了拉普拉斯參數(shù)模型的分類,并進(jìn)行了比特平面速率估計(jì)和校驗(yàn)碼碼率估計(jì)。

4 結(jié)論

  本文主要討論了Wyner-Ziv視頻編碼的碼率控制算法,在現(xiàn)有算法基礎(chǔ)上,提出一種混合碼率控制算法。仿真實(shí)驗(yàn)表明,與現(xiàn)有碼率控制算法相比,Wyner-Ziv編碼框架綜合性能有所提升。但本文后期需要進(jìn)一步研究的問(wèn)題還有很多,如研究質(zhì)量更高的邊信息估計(jì)算法并同時(shí)保證編碼端低復(fù)雜度要求,從而使Wyner-Ziv編碼方案能適應(yīng)多種應(yīng)用場(chǎng)合。

參考文獻(xiàn)

  [1] SLEPIAN D, WOLF J. Noiseless coding of correlated information sources[J]. IEEE Transactions on Information Theory, 1973,19(4):47l-480.

  [2] WYNER A, ZIV J. The rate-distortion function for source coding with side information at the decoder[J]. IEEE Transactions on Information Theory, 1976,22(1):1-10.

  [3] RARON A, RANE S, SETTON E, et al. Transform-domain wyner-ziv codec for video[C]. Visual Communications and Computers, Pacific Grove, CA, January 2004.

  [4] SLOWACK J, SKORUPA J, MYS S, et al. Correlation noise estimation in distributed video coding[C]. Effective Video Coding for Multimedia Applications,2011:133-156.

  [5] ROCA A, MORBEE M, PRADES-NEBOT J, et al. Rate control algorithm for pixel-domain wyner-ziv video coding[C]. Visual Communi-cations and Image Processing 2008, 2008,6822(1):68221T.

  [6] 秦浩,屈蓓,宋彬,等.無(wú)反饋分布式視頻編碼中Wyner-Ziv幀碼率控制算法[J].西安電子科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2012,39(4):34-35.

  [7] BRITES C, PEREIRA F. An efficient encoder rate control solution for transform domain Wyner-Ziv video coding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2011,21(9):1278-1292.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。