123,123

基于显著图与稀疏特征的图像视觉效果评价

2015年微型机与应用第8期

易瑜1，薄华1，孙强2

（1.上海海事大学信息工程学院，上海 201306；2.西安理工大学自动化与信息工程学院，陕西西安 710000）

摘要： 提出一种基于显著图与稀疏特征的图像视觉评价算法，其中显著图类似于视觉阈值，提取出图像中的视觉注意区域，并使用独立成分分析（Independent Component Analysis ，ICA）等同于稀疏编码，来提取该区域的稀疏特征。最后通过综合特征相似性和灰度相关性，得到一种全参考图像质量评价方法。通过在3个标准图像数据库测试的结果表明，相对于其他评价算法，该方法很好地拟合了人眼主观评价。

關(guān)鍵詞： 稀疏特征显著图 ICA 图像质量评价

Abstract：

Key words :

　　摘要： 提出一種基于顯著圖與稀疏特征的圖像視覺(jué)評(píng)價(jià)算法，其中顯著圖類似于視覺(jué)閾值，提取出圖像中的視覺(jué)注意區(qū)域，并使用獨(dú)立成分分析（Independent Component Analysis ，ICA）等同于稀疏編碼，來(lái)提取該區(qū)域的稀疏特征。最后通過(guò)綜合特征相似性和灰度相關(guān)性，得到一種全參考圖像質(zhì)量評(píng)價(jià)方法。通過(guò)在3個(gè)標(biāo)準(zhǔn)圖像數(shù)據(jù)庫(kù)測(cè)試的結(jié)果表明，相對(duì)于其他評(píng)價(jià)算法，該方法很好地?cái)M合了人眼主觀評(píng)價(jià)。
　　關(guān)鍵詞： 稀疏特征；顯著圖；ICA；圖像質(zhì)量評(píng)價(jià)
0 引言
　　在圖像的獲取、壓縮、傳輸、儲(chǔ)存和重構(gòu)的過(guò)程中，經(jīng)常伴隨著圖像的視覺(jué)效果的變化，有很多方法可以用來(lái)度量這種變化對(duì)圖像視覺(jué)質(zhì)量的影響。隨著圖像與視頻處理技術(shù)的發(fā)展，人們也越來(lái)越需要更加精確的圖像評(píng)價(jià)方法。
　　圖像質(zhì)量評(píng)價(jià)方法可以分成兩大類：通過(guò)人眼的主觀評(píng)價(jià)和使用算法模擬人眼視覺(jué)的客觀評(píng)價(jià)。客觀評(píng)價(jià)算法的理想效果是其預(yù)測(cè)評(píng)價(jià)結(jié)果能考慮人眼主觀評(píng)價(jià)的視覺(jué)機(jī)理?？陀^評(píng)價(jià)方法又可分為三種類型：全參考、半?yún)⒖己蜔o(wú)參考圖像評(píng)價(jià)，本文提出的是一種全參考的評(píng)價(jià)方法，即參考圖像是完全已知的。
　　在視覺(jué)領(lǐng)域，視覺(jué)皮層負(fù)責(zé)人對(duì)視覺(jué)世界大部分的意識(shí)感知，是HVS的重要組成部分[1]。稀疏編碼，類似于ICA[2]，已被證明與視覺(jué)皮層測(cè)量有關(guān)，而且能提供很好的圖像質(zhì)量的量化預(yù)測(cè)。本文所采用的方法是結(jié)合圖像顯著圖與稀疏特征，構(gòu)造出一種度量圖像視覺(jué)效果的指標(biāo)。參考文獻(xiàn)[3]提出了一種視覺(jué)信噪比方法（VSNR），該方法分為兩個(gè)階段：首先用視覺(jué)閾值篩選出視覺(jué)失真部分，然后量化失真部分，作為圖像視覺(jué)質(zhì)量評(píng)價(jià)指標(biāo)。本文中，顯著圖類似于視覺(jué)閾值，篩選出視覺(jué)重要的參考與失真圖像塊對(duì)，然后利用特征檢測(cè)矩陣提取圖像塊的稀疏特征，最后綜合失真圖像與原始圖像的特征相似度與灰度相關(guān)性，得到一個(gè)度量指標(biāo)。
1 圖像視覺(jué)質(zhì)量評(píng)價(jià)方法
　　本文提出的評(píng)價(jià)方法的完整流程圖如圖1所示。

Image 001.png

　　1.1 特征檢測(cè)矩陣的訓(xùn)練
　　每一幅圖像或圖像塊x都可以用矩陣A中的基向量與系數(shù)向量s的線性疊加來(lái)表示：x=A*s。通過(guò)轉(zhuǎn)化又可以變換為s=W*x（W為A的逆矩陣），系數(shù)向量s稱為圖像的稀疏特征。通常稀疏編碼的目的是為了得到一個(gè)權(quán)值矩陣W，本文稱其為特征檢測(cè)矩陣，將圖像塊變換成一個(gè)稀疏系數(shù)向量s。
　　本文選擇FastICA算法[4]從矩陣z中學(xué)習(xí)得到特征檢測(cè)矩陣，z為原始樣本的轉(zhuǎn)換矩陣。首先通過(guò)定點(diǎn)法來(lái)更新正交矩陣Ww的每一列，ww是正交矩陣的列向量：

　　其中，p代表一次迭代過(guò)程，E（·）表示期望，g（·）是方程G（·）的導(dǎo)數(shù)，g′（·）是g（·）的導(dǎo)數(shù)。

　　其中，迭代閾值為：

　　M等于8。最終：

　　V是在PCA降維過(guò)程中得到的8×64的白化矩陣，經(jīng)過(guò)一系列轉(zhuǎn)換最終得到8×64的特征檢測(cè)矩陣W。
　　1.2 圖像顯著圖
　　對(duì)于人眼視覺(jué)，并不是每一個(gè)圖像塊都具有同等的視覺(jué)重要性?？梢酝ㄟ^(guò)一些量化手段，提取圖像中的視覺(jué)重要區(qū)域。本文選用一種譜殘余（Spectral Residual，SR）[5]的方法提取圖像的顯著區(qū)域。SR方法通過(guò)處理圖像的幅度譜得到殘余譜，再利用傅里葉變換得到空間域顯著圖。
　　1.3 參考-失真圖像塊對(duì)的選擇
　　本文用A表示參考圖像，B表示失真圖像，O表示參考圖像的目標(biāo)圖。將這三幅圖像分成8×8且不重疊的圖像塊，然后將每個(gè)圖像塊展開(kāi)成向量形式。

　　其中，N表示圖像塊的個(gè)數(shù)， E2)DODP7PHX4F17TV@7_1CU.png 和 J8~@TE72}B6GO5[9F%{H1PR.jpg 則表示為選擇后的圖像塊。
　　1.4 特征提取與特征相似性測(cè)量
　　選擇完參考-失真圖像塊對(duì)后，分別提取參考圖像與失真圖像塊的稀疏特征。經(jīng)過(guò)變換后的圖像塊向量都會(huì)變成一個(gè)8×1的稀疏系數(shù)向量。

　　Yref和Ydis分別為參考圖像與失真圖像的稀疏特征矩陣。所以，關(guān)于參考-失真圖像的特征相似性的測(cè)量可以表示為：

　　其中，M和N分別代表特征矩陣的行數(shù)和列數(shù)，C為一個(gè)接近于0的正實(shí)數(shù)。
　　1.5 灰度相關(guān)性測(cè)量
　　本文僅測(cè)量圖像顯著性區(qū)域的灰度相關(guān)性，其目的是為了減少非顯著區(qū)域?qū)φw評(píng)價(jià)所產(chǎn)生的干擾。

　　 UB3XEGU$]%OHCELZFX~88)N.jpg 分別表示Ath與Bth的均值，C1為一個(gè)接近于0的正實(shí)數(shù)。
　　1.6 綜合評(píng)價(jià)
　　整合以上兩種測(cè)量方法，可以得到一種綜合的評(píng)價(jià)指標(biāo)：

　　本文中，u的取值為0.55。
2實(shí)驗(yàn)分析
　　在實(shí)驗(yàn)中，本文采用了三個(gè)獨(dú)立的圖像數(shù)據(jù)庫(kù)來(lái)驗(yàn)證所提出的圖像視覺(jué)質(zhì)量評(píng)價(jià)算法，分別是TID2008[6]、CSIQ[7]和A57[2]。該數(shù)據(jù)庫(kù)涵蓋了如壓縮效應(yīng)、模糊、閃變效應(yīng)噪聲和傳輸效應(yīng)失真等，每一個(gè)圖像庫(kù)都附帶人眼主觀評(píng)價(jià)分?jǐn)?shù)。本文使用了斯皮爾曼相關(guān)系數(shù)（SROCC）、皮爾遜相關(guān)系數(shù)（PLOCC）和均方誤差（RMS）評(píng)估指標(biāo)來(lái)比較這些客觀結(jié)果與主觀結(jié)果。
　　最后，將本文評(píng)價(jià)算法的性能評(píng)估結(jié)果與一些圖像評(píng)價(jià)算法進(jìn)行比較，這些算法包括：PSNR、SSIM[8]、PHVSM[9]、IFC[10]、VSNR[3]以及MAD[7]。表1展示了最終的比較結(jié)果，其中權(quán)值平均表示根據(jù)各個(gè)圖像數(shù)據(jù)庫(kù)的情況加權(quán)求均值。對(duì)于評(píng)估指標(biāo)SROCC、PLOCC和RMS，SROCC和PLOCC越接近1表示性能越好，而RMS則越小越好。
　　從實(shí)驗(yàn)的結(jié)果可以看出，在圖庫(kù)TID2008和CSIQ中，相比于其他算法，本文方法的性能更具有優(yōu)越性。但是由于SR方法在壓制圖像非顯著性信息的同時(shí)也壓制了顯著性信息，因此在強(qiáng)調(diào)細(xì)節(jié)重要性的A57圖庫(kù)中，本文方法的效果并不十分明顯。
3 結(jié)論
　　人眼在處理自然場(chǎng)景或圖片時(shí)，并不是對(duì)每一個(gè)空間位置的畸變都能引起同等的視覺(jué)注意。本文正是基于這種理念，只對(duì)圖像中的顯著性區(qū)域進(jìn)行分析，對(duì)該區(qū)域的每一個(gè)圖像塊的稀疏特征進(jìn)行比較，力求做到更細(xì)化的處理。最終的實(shí)驗(yàn)結(jié)果證明，本文方法能得到一個(gè)不錯(cuò)的評(píng)價(jià)效果，但是對(duì)于SR方法的局限性仍有改進(jìn)的空間。此外，用ICA來(lái)模擬視覺(jué)初期也可以用更加細(xì)化的方法替代，這些都是下一步的研究重點(diǎn)。
　　參考文獻(xiàn)
　　[1] SIMONCELLI E P， OLSHAUSEN B A. Natural image statistics and neural representation[J]. Annual Review of Neuroscience，2001， 24（1）： 1193-1216.
　　[2] HYVARINEN A， KARHUNEN J， OJA E. Independent component analysis[M]. John Wiley & Sons， 2004.
　　[3] CHANDLER D M， HEMAMI S S. VSNR： a wavelet-Based visual signal-to-noise ratio for natural images[J]. Image Processing， IEEE Transactions on， 2007，16（9）：2284-2298.
　　[4] HYVARINEN A. Fast and robust fixed-point algorithms for independent component analysis[J]. IEEE Transactions on Neural Networks， 1999，10（3）：626-634.
　　[5] Hou Xiaodi， Zhang Liqing. Saliency detection： a spectral residual approach[C]. IEEE Conference on Computer Vision and Pattern Recognition， CVPR′07，IEEE， 2007：1-8.
　　[6] PONOMARENKO N， LUKIN V， ZELENSKY A， et al. TID2008-a database for evaluation of full-reference visual quality assessment metrics[J]. Advances of Modern Radioelectronics， 2009，10（4）：30-45.
　　[7] LARSON E C， CHANDLER D M. Most apparent distortion： full-reference image quality assessment and the role of strategy[J]. Journal of Electronic Imaging， 2010，19（1）： 011006-1-011006-21.
　　[8] WANG Z， BOVIK A C， SHEIKH H R， et al. Image quality assessment： from error visibility to structural similarity[J]. IEEE Transactions on Image Processing， 2004， 13（4）： 600-612.
　　[9] PONOMARENKO N， SILVESTRI F， EGIAZARIAN K， et al. On between-coefficient contrast masking of DCT basis functions[C]. Proceedings of the Third International Workshop on Video Processing and Quality Metrics， 2007.
　　[10] SHEIKH H R， BOVIK A C， DE VECIANA G. An information fidelity criterion for image quality assessment using natural scene statistics[J]. IEEE Transactions on Image Processing， 2005，14（12）：2117-2128.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容