123,123,123

基于FPGA的HEVC感兴趣区域编码算法研究与设计

2018年电子技术应用第7期

李申1，严伟2，夏珺1，崔正东2，柴志雷1

1.江南大学物联网工程学院，江苏无锡214122；2.北京大学软件与微电子学院，北京102600

摘要： 为了在保证视频质量的前提下降低视频编码码率，基于FPGA并行处理和HEVC视频分块编码的特点，提出一种基于块匹配的高斯背景建模-感兴趣区域(ROI)映射算法，并用于HEVC视频编码。通过基于块匹配的高斯方法建立背景帧后，利用SAD判别准则对视频帧的编码块进行二分类，进而映射到编码树单元(CTU)；然后根据率失真特性对ROI区域和非ROI区域的量化参数进行自适应调整，并进入后续的HEVC编码过程。实验结果表明，在FPGA平台上该算法运行速度高达22 fps@ 1080 p；建模后提取的ROI映射CTU区域变质量编码可得到平均约10%的码率节省，视频质量保持稳定。

關(guān)鍵詞： 感兴趣区域提取背景建模 FPGA 变质量视频编码 HEVC

中圖分類號： TN919.8
文獻識別碼： A
DOI：10.16157/j.issn.0258-7998.180233
中文引用格式： 李申，嚴偉，夏珺，等. 基于FPGA的HEVC感興趣區(qū)域編碼算法研究與設(shè)計[J].電子技術(shù)應(yīng)用，2018，44(7)：52-55.
英文引用格式： Li Shen，Yan Wei，Xia Jun，et al. Study and design of region of interest encoding algorithm for HEVC based on FPGA[J]. Application of Electronic Technique，2018，44(7)：52-55.

Study and design of region of interest encoding algorithm for HEVC based on FPGA

Li Shen1，Yan Wei2，Xia Jun1，Cui Zhengdong2，Chai Zhilei1

1.School of Internet of Things Engineering，Jiangnan University，Wuxi 214122，China； 2.School of Software & Microelectronics，Peking University，Beijing 102600，China

Abstract： In order to decrease the bit-rate of video encoding while keeping quality of video, considering the parallel feature of FPGA and block processing feature of HEVC, a block based Gaussian background model-ROI extraction mapping algorithm is proposed and implemented for HEVC video encoder. Firstly, background frame is set by this method, and current frame is classified as foreground and background by SAD rule, then mapping them into coding tree unit(CTU). Secondly quantization parameter is adjusted according to distortion-rate automatically, well followed by the HEVC encoding procedure. The experimental results show that the speed of this algorithm on FPGA has reached the speed at 22 fps@1 080 p, and the bit-rate is saved about 10% with stable video quality.

Key words : ROI extraction；background model building；FPGA；vary-quality video encoding；HEVC

0 引言

與H.264/AVC相比，新一代視頻壓縮標準H.265/HEVC能夠在相同的圖像質(zhì)量下實現(xiàn)更低的碼率，即更高的壓縮比^[1]。由于人眼的視覺特性，在動態(tài)碼率編碼過程中，不同區(qū)域的碼率分配是研究中的一個關(guān)鍵問題。如果能夠在編碼過程中將視頻劃分為感興趣區(qū)域（Region of Interest，ROI）和普通區(qū)域，動態(tài)調(diào)整二者的碼率分配，則可以在相同甚至更低的碼率下得到更好的主觀視頻質(zhì)量，從而增強用戶體驗^[2-6]。ROI區(qū)域的提取速度和質(zhì)量對編碼算法影響很大，因此實現(xiàn)低復(fù)雜度、高質(zhì)量的ROI區(qū)域提取，并針對H.265/HEVC視頻編碼的自身特點進行碼率的分配尤為重要。

文獻[7]將ROI提取及碼率分配方法用于JPEG 2000靜止圖像壓縮，提升了ROI區(qū)域的圖像質(zhì)量并取得了較好的碼率節(jié)省效果，并利用FPGA對ROI的提取進行了VLSI硬件設(shè)計，從而在不顯著提高圖像編碼時間的前提下得到了滿意的效果，但該系統(tǒng)只能用于靜止圖像編碼；文獻[2-6]均提出了基于ROI的H.265/HEVC碼率控制即壓縮性能優(yōu)化方法，并取得了一定成效。文獻[2-4]的研究表明雖然H.265/HEVC編碼標準已經(jīng)在一定程度上較H.264/AVC標準降低了碼率，但ROI區(qū)域碼率控制對于最新的HEVC標準同樣起作用，但未考慮ROI提取算法復(fù)雜度對編碼速率帶來的影響；文獻[8-9]利用高斯背景模型建立虛擬背景幀，降低了H.265/HEVC編碼的碼率，但未考慮針對人眼特性的ROI變質(zhì)量編碼，也未考慮背景幀建立效率對編碼器速率的影響。

本文基于視頻編碼算法分塊進行的特點和FPGA的細粒度并行特性，提出了基于塊匹配的高斯背景建模-ROI映射方法，并利用HLS工具在FPGA平臺上進行了算法的硬件實現(xiàn)與驗證。FPGA處理速度達到22 fps@1 080 p，對ROI映射CTU區(qū)域進行變質(zhì)量編碼，可得到平均10%左右的碼率節(jié)省，視頻總體質(zhì)量保持穩(wěn)定。

1 高斯背景建模及其面向視頻編碼的改進

1.1 基于像素的高斯背景建模的基本原理

高斯背景建模是一種基于概率模型的背景建模方法，傳統(tǒng)的高斯背景建模算法是以像素為單位的。數(shù)字視頻中的一幀圖像可以看作是對于時空位置(x，y，t)的二維離散函數(shù)f(x，y，t)，在給定色彩空間的給定通道下，對于給定的(x₀，y₀，t₀)，f僅有唯一值；對于給定的時間t₀，f可看成是一個二維隨機場，一般認為其為平穩(wěn)隨機場。

從統(tǒng)計學(xué)角度來看，前景物體的出現(xiàn)與運動是暫時的、突發(fā)性的，而背景則是長期的、具備一定穩(wěn)定性的，對于時間t來說，給定(x₀，y₀)，f(x₀，y₀，t)滿足一定的概率分布，通常符合高斯分布。

高斯背景模型的表達式為：

1.2 基于塊匹配高斯背景建模-ROI映射算法

由原始高斯背景模型的表達式可知，基于像素的高斯背景建模算法需要進行大量的復(fù)雜浮點計算，一般要經(jīng)過數(shù)百幀才能完成模型的建立，導(dǎo)致算法耗時很高且不適合進行硬件實現(xiàn)。

高斯背景建模方法僅考慮了同一位置像素點的時間相關(guān)性，并且將所有的像素看作是孤立的點，一方面需要進行大量的重復(fù)性計算，另一方面在背景產(chǎn)生變化時，會產(chǎn)生“虛警”現(xiàn)象。

視頻序列中存在空間冗余、時間冗余和知識冗余等。針對一幀圖像空間上的冗余，視頻編碼算法中采用分塊方式進行幀內(nèi)預(yù)測，對預(yù)測值與原始值的殘差進行變換編碼和量化編碼，達到視頻壓縮的目的。

本文使用塊匹配方式取代原高斯背景建模的像素匹配和更新方式，提出基于塊匹配的高斯背景建模-ROI提取算法。一方面，基于塊進行背景建模計算可以避免基于像素算法過程中的大量運算；另一方面，基于塊進行高斯背景建?？梢詫⒈尘敖⑴c視頻編碼塊的劃分統(tǒng)一起來。

利用高斯建模建立背景后，將新的視頻幀分塊，根據(jù)SAD判別準則進行前景塊與背景塊的判定，SAD判別的表達式如式(5)所示。其中B表示已經(jīng)建立好的背景塊，C表示當前視頻幀對應(yīng)位置的像素塊，本文中N取8。

其基本步驟描述如下：

步驟1：視頻塊劃分。按N×N尺度將原始視頻劃分成若干個不相交的子區(qū)域。

步驟2：模型初始化。針對分塊區(qū)域，初始化高斯模型的基本參數(shù)μ、σ、λ、α。

步驟3：幀計數(shù)判定。讀入視頻，若視頻幀數(shù)滿足更新周期p，則進入步驟4，否則進入步驟5。

步驟4：模型更新。更新分塊背景模型。

步驟5：前背景判定。根據(jù)SAD判別準則，劃分前景與背景。

步驟6：ROI區(qū)域映射。依據(jù)前景塊分布，對視頻中的CTU進行映射。本文中設(shè)定HEVC CTU尺度為32×32，映射結(jié)果將送入H.265/HEVC編碼器。

算法流程如圖1所示。

2 基于率失真優(yōu)化的ROI區(qū)域自適應(yīng)編碼

2.1 面向ROI區(qū)域的率失真優(yōu)化

為了降低碼率同時達到較好的圖像質(zhì)量，率失真優(yōu)化可以定義為如下優(yōu)化問題：在碼率R≤R_max時，通過調(diào)整編碼算法使得失真D最小，即：

式(8)通常被用作RDO的依據(jù)，但事實上往往編碼塊之間不相互獨立，從而導(dǎo)致求得的值為局部最優(yōu)解。

本文通過ROI區(qū)域的劃分，假設(shè)在一幀中ROI區(qū)域與非ROI區(qū)域獨立同分布，則率失真優(yōu)化函數(shù)可描述為：

由于式（9）考慮到了編碼塊的相關(guān)性問題，能夠在一定程度上避免陷入局部最優(yōu)，分析可知，式（9）將比式（8）得到更優(yōu)解。

進一步地，從主觀視頻質(zhì)量出發(fā)，人眼期望ROI區(qū)域能夠有更好的視頻質(zhì)量，因此，本文在實現(xiàn)過程中加入限制條件：

2.2 集成ROI提取的HEVC編碼

本文將ROI區(qū)域送入HEVC編碼器中進行變質(zhì)量編碼。為了防止ROI區(qū)域與周圍非ROI區(qū)域的編碼參數(shù)差異過大造成明顯的方塊效應(yīng)，本文利用非線性補償對量化參數(shù)進行了調(diào)整，具體做法如下。

記ROI區(qū)域所在的編碼塊A的量化參數(shù)為q₁，在其附近的非ROI區(qū)域中編碼塊B的量化參數(shù)為q₂，A的中心點坐標記作(x_A，y_A)，B的中心點坐標記作(x_B，y_B)，則q₁、q₂以及A、B中心位置的漢明距離D應(yīng)滿足如下關(guān)系：

3 硬件設(shè)計與實現(xiàn)

為了說明本文方法的有效性，將基于塊匹配的高斯背景建模-ROI算法進行了硬件實現(xiàn)并嵌入到HEVC編碼的過程之中。

本文利用高層次綜合(High Level Synthesis，HLS)工具，基于Xilinx MPSoC平臺ZCU102進行了基于背景建模的ROI區(qū)域映射與自適應(yīng)編碼的硬件設(shè)計。HLS工具可以將C/C++語言的高層次描述映射為硬件描述語言（VHDL或Verilog），提高開發(fā)效率。

硬件包括3個模塊，分別為：背景建立、背景更新、ROI判定與映射，最終將映射結(jié)果送入視頻編碼器。其基本結(jié)構(gòu)如圖2所示。

原始視頻數(shù)據(jù)緩存在DDR中，在FPGA內(nèi)部通過行緩存加快存取速率，視頻數(shù)據(jù)多路選擇器在幀計數(shù)器的控制下，將視頻送入不同的處理單元，將ROI區(qū)域映射到H.265標準中的編碼樹單元（CTU），映射結(jié)果送入H.265編碼器。在編碼器中，根據(jù)區(qū)域性質(zhì)進行ROI自適應(yīng)的QP調(diào)整，最終將編碼后生成的碼流寫回DDR。

4 實驗結(jié)果與分析

4.1 實驗環(huán)境

本文基于Xilinx ZCU102嵌入式開發(fā)平臺進行了實驗。ZCU102搭載了Zynq UltraScale XCZU9EG-2FFVB1156 FPGA芯片。該芯片內(nèi)部架構(gòu)主要包括處理器系統(tǒng)(Processing System，PS)和可編程邏輯(Programmable Logic，PL)兩部分。

其中PL端硬件資源消耗情況如表1所示?？紤]到一定的伸縮性，硬件設(shè)計中圖像的分辨率可以進行配置，最高分辨率為1 920×1 080。

4.2 背景建模效果與ROI映射結(jié)果

圖3為基于FPGA的背景建模和ROI映射結(jié)果。所用序列為HEVC標準測試序列BasketballDrill_832×480_50.yuv。圖3(a)為視頻序列的第201幀，圖3(b)為利用前200幀建模得到的背景幀，圖3(c)為針對HEVC CTU的映射結(jié)果，其中白色區(qū)域為映射得到的ROI區(qū)域?？梢钥闯鲆曨l中運動的人物被準確映射到以CTU大小為邊界的區(qū)域中。觀察原始視頻序列可知，原始視頻序列中的背景區(qū)域隨時間變化有變動（如籃筐會隨籃球撞擊而抖動等），但這些變動并未對ROI區(qū)域的映射造成影響（即未出現(xiàn)“虛警”現(xiàn)象），算法具備一定的魯棒性。

表2為不同分辨率下進行處理的速度對比，PL部分的時鐘頻率為120 MHz。由表可知本文設(shè)計在1 920×1 080的分辨率下仍可達到較高的實時性。

4.3 嵌入ROI碼率控制的HEVC視頻編碼性能評估

為了進一步說明嵌入ROI區(qū)域后HEVC編碼的有效性，本文對HEVC編碼器的編碼結(jié)果進行了實驗驗證。分別選取不同分辨率和不同場景下的測試序列，計算總體碼率及PSNR的變化情況，結(jié)果如表3所示。

從表3可以看出，采用本文提出的背景建模-ROI映射算法進行碼率控制，編碼后圖像總體的PSNR沒有較大變化，但是碼率有了平均10%左右的節(jié)省，從而驗證了本文算法在對碼率控制的有效性。

5 結(jié)論

基于視頻編碼算法分塊進行的特點，本文提出一種基于塊的高斯背景建模-ROI映射方法，通過HLS方法在FPGA上實現(xiàn)，并用于H.265/HEVC視頻編碼。實驗結(jié)果表明，在FPGA平臺上該算法運行速度較快，可以有效地集成到H.265/HEVC硬件編碼器中；在H.265/HEVC中對提取ROI區(qū)域進行變質(zhì)量編碼，可得到平均約10%的碼率節(jié)省，總體的視頻質(zhì)量保持穩(wěn)定。

參考文獻

[1] BOSSEN F，BROSS B，SUHRING K，et al.HEVC complexity and implementation analysis[J].IEEE Transactions on Circuits & Systems for Video Technology，2012，22(12)：1685-1696.

[2] MEDDEB M，CAGNAZZO M，PESQUET B P.ROI-based rate control using tiles for an HEVC encoded video stream over a lossy network[C].2015 IEEE International Conference on Image Processing(ICIP)，2015：1389-1393.

[3] ZHANG Z，JING T，HAN J，et al.A New rate control scheme for video coding based on region of interest[J].IEEE Access，2017，5：13677-13688.

[4] 林國川，何小海，李向群，等.基于感興趣區(qū)域的HEVC壓縮性能優(yōu)化[J].電訊技術(shù)，2016，56(1)：38-43.

[5] KO J H，NA T，MUKHOPADHYAY S.An energy-efficient wireless video sensor node with a region-of-interest based multi-parameter rate controller for moving object surveillance[C].2016 13th IEEE International Conference on Advanced Video and Signal Based Surveillance(AVSS)，2016：138-144.

[6] 曾鴻軍，沈燕飛，王毅.基于感興趣區(qū)域的頭像視頻前處理方法[J].計算機工程與應(yīng)用，2017，53(6)：188-192.

[7] 王建新，朱恩，劉文松，等.基于JPEG2000的遙感圖像感興趣區(qū)域編碼新算法及其VLSI設(shè)計[J].電子與信息學(xué)報，2016，38(4)：958-963.

[8] CHEN F，LI H，LI L，et al.Block-composed background reference for high efficiency video coding[J].IEEE Transactions on Circuits and Systems for Video Technology，2017，27(12)：2639-2651.

[9] CHEN F，LI L，LIU D，et al.Efficient background picture coding for videos obtained from static cameras[C].2015 Visual Communications and Image Processing(VCIP)，2015：1-4.

作者信息:

李申1，嚴偉2，夏珺1，崔正東2，柴志雷1

（1.江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院，江蘇無錫214122；2.北京大學(xué) 軟件與微電子學(xué)院，北京102600）

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容