《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 3D-HEVC中深度圖幀內預測模式判決過程的改進
3D-HEVC中深度圖幀內預測模式判決過程的改進
2016年電子技術應用第10期
雷海衛(wèi)1,劉文怡1,王安紅2
1.中北大學 儀器科學與動態(tài)測試教育部重點實驗室,山西 太原030051; 2.太原科技大學 電子信息工程學院,山西 太原030024
摘要: 深度圖建模模式的使用可以有效地降低編碼的深度圖內部邊界處的偽影效應,從而改善深度圖的編碼質量,但同時也極大地增加了編碼的計算復雜度。為了降低由此而帶來的計算復雜度,對深度圖幀內預測的模式判決過程和現(xiàn)有的快速模式判決方案進行了分析,同時對不同大小的編碼塊使用深度圖建模模式的情況進行了統(tǒng)計。然后,從編碼塊的特征和編碼塊的大小兩個角度對現(xiàn)有的模式判決過程進行了改進。實驗結果表明,改進后的方案在基本不影響編碼質量的前提下能有效地加速幀內預測的模式判決過程。
中圖分類號: TN919.8
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2016.10.030
中文引用格式: 雷海衛(wèi),劉文怡,王安紅. 3D-HEVC中深度圖幀內預測模式判決過程的改進[J].電子技術應用,2016,42(10):116-119.
英文引用格式: Lei Haiwei,Liu Wenyi,Wang Anhong. Improvement on mode decision process of depth map intra-predicted in 3D-HEVC[J].Application of Electronic Technique,2016,42(10):116-119.
Improvement on mode decision process of depth map intra-predicted in 3D-HEVC
Lei Haiwei1,Liu Wenyi1,Wang Anhong2
1.Key Laboratory of Instrumentation Science & Dynamic Measurement,Ministry of Education,North University of China, Taiyuan 030051,China; 2.School of Electronic Information Engineering,Taiyuan University of Science and Technology,Taiyuan 030024,China
Abstract: The use of depth modelling mode can effectively reduce the artifact effects at the sharp edges of the encoded depth map,and thus improve the encoding quality of the depth map. But it also greatly increase the computational complexity of encoding. In order to reduce the computational complexity,the mode decision process of the depth map intra-predicted and the existing fast mode decision scheme are analyzed. Meanwhile,the usage of depth modelling mode in the case of different block sizes is gathered. Then,the mode decision process is improved based on the characteristic and the size of the block to be encoded. Experimental results show that the improved scheme can effectively accelerate the mode decision process of intra-prediction with negligible coding quality loss.
Key words : 3D-HEVC;depth map coding;intra-predicted;mode decision

0 引言

    3D-HEVC(The 3D Extension of High-efficiency Video Coding)是繼HEVC之后由視頻編碼協(xié)作小組制定的又一個視頻編碼標準,它是HEVC的擴展[1],主要用于實現(xiàn)3D視頻和自由視點視頻(Free Viewpoint Video,F(xiàn)VV)的編碼。在3D-HEVC中,除需要對幾個不同視點的紋理視頻(Texture)進行編碼外,還需要對相應視點的深度圖(Depth)進行編碼。解碼端根據(jù)接收到的紋理視頻和深度圖利用基于深度圖繪制的技術(Depth Image Based Rendering,DIBR)[2]合成中間的虛擬視點視頻。從而可以由少數(shù)的幾個視點的視頻生成更多可觀看的視點。在采用3D-HEVC技術后,用戶可以欣賞到來自同一場景但從不同角度拍攝的視頻內容,此外,視頻的呈現(xiàn)方式也可以是3D的,這樣的視頻被稱為自由視點立體視頻??梢钥闯觯捎?D-HEVC編碼的視頻能給人們帶來更好的視覺感受和增強用戶體驗。但這也造成了3D-HEVC的編碼結構以及編碼過程十分復雜,進而使得編碼時間過長。

    3D-HEVC基本沿用了HEVC中的編碼技術,這些技術能高性能、高質量地完成對紋理視頻的編碼,但對深度圖的編碼效果并不好,因為深度圖有不同于紋理圖的特征,深度圖通常包含了一些銳利的邊界和大片的平坦區(qū)域。采用HEVC中的編碼技術來編碼深度圖,解碼后的深度圖內部邊界處會產(chǎn)生偽影效應,這將影響合成的虛擬視點的質量。為了改善深度圖的編碼效果,3D-HEVC禁用和修改了HEVC中的幾個編碼工具。此外,還加入了一些新的編碼工具,包括深度圖建模模式(Depth Modelling Mode,DMM)[3]、簡化的深度圖編碼(Simplified Depth Coding,SDC)和單一深度幀內模式(Single Depth Intra Mode)等。

1 深度圖建模模式

    深度圖建模模式是一種新的幀內預測模式,用于對深度值有明顯過渡的區(qū)域進行編碼。最初制定了4種預測模式,即DMM1、DMM2、DMM3和DMM4,目前保留使用的是DMM1(Explicit Wedgelet Signalling)和DMM4(Inter-component-predicted Contour partitioning)。兩者采用了不同的劃分類型:楔形和輪廓形劃分。兩種劃分方式均會把一個編碼塊劃分為兩部分(P1和P2),如圖1所示。

jsj1-t1.gif

    圖1中以8×8的編碼塊為例進行說明,左側為連續(xù)空間,右側為對應的離散空間。深度圖建模模式除需要劃分信息外,還需要為劃分出的每個區(qū)域指定一個常量值,來表示這一區(qū)域的深度值。在使用深度圖建模模式對深度圖進行編碼時,可以選擇這兩種模型中的一種對當前編碼塊進行建模,作為當前編碼塊的預測信號。

    在原有預測模式基礎上加入深度圖建模模式后,能有效地降低內部邊界處的偽影效應,改善深度圖的編碼質量,但同時也極大地增加了編碼的計算復雜度。復雜度的增加來自兩個方面:一方面,新增加的模式使可供選擇的模式數(shù)量增加,從而在模式判決時會消耗更多的時間;另一方面,深度圖建模模式自身的建模過程也非常耗時。因此,對模式判決過程或者建模過程進行優(yōu)化都會使編碼過程加速,從而提高編碼效率。本文旨在對模式判決過程進行優(yōu)化。

    HEVC中原有35種幀內預測模式,分別是Planar模式、DC模式以及33種角度模式。對這35種模式,首先采用基于殘差的哈達瑪變換方法進行粗選,針對64×64、32×32和16×16大小的編碼塊會選出3個,針對8×8和4×4大小的塊會選出8個預測模式加入全率失真候選列表,然后進行全率失真代價計算,選取使得率失真代價值最小的模式作為最佳的幀內預測模式。深度圖建模模式被設計為幀內預測模式,因此DMM1和DMM4也被加入到全率失真候選列表參與率失真代價計算。整個幀內預測的模式判決過程如圖2所示。

jsj1-t2.gif

2 相關工作

    如前所述,深度圖包含了大塊的平坦區(qū)域,這也就表明并不是深度圖中的所有編碼塊都適用于深度圖建模模式。因此當對某個塊進行預測編碼時,DMM1和DMM4兩個預測模式無條件地加入到全率失真候選列表進行全率失真代價的計算會額外增加編碼的計算復雜度。

    針對這種情況,一些快速的模式判決算法被提出。文獻[4]基于最大概率模式提出了一個快速的深度圖建模模式選擇算法。文獻[5]提出當預測塊中深度值的變化小于某個閾值時,則略過深度圖建模模式。在文獻[6]中,一個類似的采用閾值的方法被提出。文獻[7]中,一個簡化的邊檢測器和一個基于梯度的模式濾波器被用來決定是否略過深度圖建模模式。文獻[8]采用了一種基于哈達瑪域的邊分類算法來加速模式判決過程。

    其中,文獻[4]和文獻[5]是在視頻編碼協(xié)作小組舉辦的國際會議上提交的提案。提案中的方法已被采納并加入到3D-HEVC的參考軟件HTM中。具體而言,它采用了兩個策略來判斷是否將深度圖建模模式加入到全率失真候選列表。一個是基于最大可能性統(tǒng)計,即認為經(jīng)過粗選之后若候選列表中的第一個預測模式為Planar模式,則當前塊極可能是平坦的或光滑的,因此深度圖建模模式將以極大的概率不會被選作最佳的預測模式。另一個是基于閾值的方法,閾值表達式如式(1)所示,其中QP表示當前編碼塊的量化參數(shù)。當當前編碼塊的深度值變化大于此閾值時,才考慮把深度圖建模模式添加到全率失真候選列表。

    jsj1-gs1.gif

3 提出的改進

    文獻[5]和文獻[6]中提出的方案的目的是使對于那些明顯不適合采用深度圖建模模式進行預測編碼的塊進行模式判決時,不把DMM1和DMM4加入到全率失真候選列表。從而避免對DMM1和DMM4的全率失真代價計算過程,也略過這兩個預測模式自身建模的過程,進而加速了模式判決的過程。本文在此基礎上進一步優(yōu)化模式判決過程,主要提出了兩點改進。

3.1 基于塊特征的方法

    如前所述,無論是DMM1還是DMM4,都會將當前編碼的塊分割成兩個區(qū)域,并為每個區(qū)域指定一個常量值,用這樣的模型作為當前塊的預測信號。深度圖建模模式只適用于對深度值有明顯過渡的塊進行預測,文獻[4]和文獻[5]中的改進也主要基于此思想。改進策略用表達式(2)描述,其中,uiRdModeList[0]表示候選列表中的第一個預測模式,等號右側的0代表Planar模式,variance表示當前塊深度值的變化。

    jsj1-gs2.gif

    觀察發(fā)現(xiàn),采用此方案后,仍有少量平坦的塊被遺漏,因為方案中采用了“或”的運算關系,即當?shù)谝粋€條件滿足時,當前編碼塊仍有可能是平坦的。為此,本文采取邊緣檢測的方法進一步過濾遺漏掉的平坦塊。首先采用canny算法對整幀深度圖像進行邊緣檢測,最初的深度圖像如圖3所示,邊緣檢測的結果如圖4所示,圖中黑色的線條表示深度的過渡。然后,定義圖4中(大塊)的白色區(qū)域為平坦區(qū)域,如果當前正在編碼的深度塊位于平坦區(qū)域處,則不把DMM1和DMM4加入全率失真候選列表。

jsj1-t3.gif

jsj1-t4.gif

3.2 基于塊大小的方法

    與對紋理視頻的編碼方式一樣,對深度圖的編碼同樣也采用了基于塊的編碼方案。一幀圖像按行列的方式被劃分為多個編碼樹單元(Coding Tree Unit,CTU),每個編碼樹單元再以四叉樹的形式遞歸地劃分為更小的編碼單元(Coding Unit,CU)。編碼單元被劃分為更小的預測單元(Predicted Unit,PU),每一個預測單元可采用不同的預測模式來產(chǎn)生它的預測信號。在3D-HEVC標準配置模式下,編碼樹單元的大小為64×64。編碼樹單元允許最多4級的遞歸劃分,因此編碼單元的大小可以是64×64、32×32、16×16或8×8。在采用幀內預測時,編碼單元要么整體作為一個預測單元,要么被四等分為4個預測單元。因此預測單元的大小可以是64×64、32×32、16×16、8×8或4×4。

    由圖2可知,由粗選過程選出前3個(或者前8個)較好的幀內預測模式與DMM1以及DMM4一并被加入到全率失真候選列表,進行全率失真代價計算,最終選取一種預測模式作為最佳預測模式。為了進一步分析深度圖建模模式的使用情況,對在不同塊大小情況下,深度圖建模模式的使用次數(shù)進行了統(tǒng)計,統(tǒng)計的結果如表1所示。

jsj1-b1.gif

    從表1中可以看出,當預測塊的大小為32×32時,深度圖建模模式的使用次數(shù)最少(平均占比為8%)。因此,如果事先規(guī)定當預測塊的大小為32×32時,深度圖建模模式(DMM1和DMM4)將不被加入到全率失真列表,那么就能使這些塊跳過深度圖建模模式全率失真代價的計算過程。在深度圖建模模式使用率較低的前提下,即使對某些特定大小的塊不使用DMM1(或DMM4),這一預測模式也不會對編碼質量產(chǎn)生太大的影響。

3.3 改進后的模式判決過程

    改進后的模式判決過程如圖5所示。為了方便描述,只給出了深度圖建模模式的模式判決過程,其中第1個判斷框為原有方案??梢钥吹?,改進后的方案能對深度圖建模模式起到進一步的過濾作用,從而加快整個模式判決過程。

jsj1-t5.gif

4 實驗結果

    為了評估提出的改進方案,進行了前后對比的測試實驗。實驗在3D-HEVC的參考軟件HTM15.1[9]上進行。8個標準的測試序列作為輸入,讀取每個序列的前100幀進行測試。編碼方案采用通用測試條件[10]中的編碼幀結構,選取的紋理和深度的量化參數(shù)QP分別為25:34、30:39、35:42和40:45。測試的結果如表2所示,表中列出了采用改進后的方案在編碼質量和編碼時間方面較之前的變化。可以看到,紋理視頻的編碼質量和合成視點的編碼質量損失很少,分別為0.16%和0.19%,但整個編碼時間卻節(jié)省了3%。

jsj1-b2.gif

5 結論

    本文針對深度圖編碼中的幀內預測的模式判決過程提出了兩點改進,旨在加快模式判決的過程。實驗結果表明,在基本不影響編碼質量的前提下,改進后的方案能有效地加快模式判決的過程,從而使整體的編碼時間節(jié)省3%。這對促進3D-HEVC的實時性應用具有一定意義。

參考文獻 

[1] MULLER K,SCHWARZ H,MARPE D,et al.3D high-efficiency video coding for multi-view video and depth data [J].Image Processing,IEEE Transactions on,2013,22(9):3366-3378.

[2] FEHN C.Depth-image-based rendering(DIBR),compression and transmission for a new approach on 3D-TV[C].Proceedings of the Stereoscopic Displays and Virtual Reality Systems XI,2004:93-104.

[3] MERKLE P,BARTNIK C,MULLER K,et al.3D video:depth coding based on inter-component prediction of block partitions[C].Proceedings of the Picture Coding Symposium(PCS),2012:149-152.

[4] ZHOUYE G,JIANHUA Z,NAM L,et al.Fast depth modeling mode selection for 3D HEVC depth intra coding[C].Proceedings of the Multimedia and Expo Workshops(ICMEW),2013 IEEE International Conference on,2013:1-4.

[5] GU Z Y,ZHENG J H,LING N,et al.Fast intra prediction mode selection for intra depth map coding[C]. JCT3V-E0238 of JCT-3V,Vienna,AT,2013.

[6] ZHANG Q,LI N,WU Q.Fast mode Ddecision for 3D-HEVC depth intracoding[J].The Scientific World Journal,2014(3):620142.

[7] SANCHEZ G,SALDANHA M,BALOTA G,et al.DMMFast:a complexity reduction scheme for three-dimensional high-efficiency video coding intraframe depth map coding[J].ELECTIM,2015,24(2):1-15.

[8] CHUN-SU P.Edge-based intramode selection for depthmap coding in 3D-HEVC[J].Image Processing,IEEE Transactions on,2015,24(1):155-162.

[9] JCT-3V.Subversion repository for the 3D-HEVC test model version HTM-15.1[EB/OL].[2015-11-28].https://hevc.hhi.fraunhofer.de/svn/svn_3DVCSoftware/tags/HTM-15.1/.

[10] RUSANOVSKYY D,M?譈LLER K,VETRO A.Common test conditions of 3DV core experiments[C].JCT3V-F1100 of JCT-3V,Geneva,Switzerland,2013.

此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。