123,123,123

基于改进协方差矩阵的半色调图像分类研究

2015年微型机与应用第19期

钟智彦，文志强，叶德刚

（湖南工业大学计算机与通信学院，湖南株洲 412007）

摘要： 针对半色调图像分类中只存在0和1的特点，提出了一种基于改进的协方差矩阵在半色调图像中的分类方法。根据协方差矩阵在实现半色调图像分类中个数少且并未体现其局部和全局信息的特性，对协方差矩阵的底层特征进行改进。利用样本的局部特性和核密度估计方法，实现黎曼流形上的贝叶斯分类策略。实验中研究协方差矩阵的底层特征与传统协方差矩阵的特征提取方法并对其进行分类性能比较。实验结果表明，在半色调图像分类中，与传统的协方差矩阵相比较，改进的协方差矩阵提取出的特征在分类中平均错误分类率更低

關(guān)鍵詞： 半色调图像协方差矩阵黎曼流形最近邻分类器

Abstract：

Key words :

　　摘要：針對半色調(diào)圖像分類中只存在0和1的特點，提出了一種基于改進的協(xié)方差矩陣在半色調(diào)圖像中的分類方法。根據(jù)協(xié)方差矩陣在實現(xiàn)半色調(diào)圖像分類中個數(shù)少且并未體現(xiàn)其局部和全局信息的特性，對協(xié)方差矩陣的底層特征進行改進。利用樣本的局部特性和核密度估計方法，實現(xiàn)黎曼流形上的貝葉斯分類策略。實驗中研究協(xié)方差矩陣的底層特征與傳統(tǒng)協(xié)方差矩陣的特征提取方法并對其進行分類性能比較。實驗結(jié)果表明，在半色調(diào)圖像分類中，與傳統(tǒng)的協(xié)方差矩陣相比較，改進的協(xié)方差矩陣提取出的特征在分類中平均錯誤分類率更低。

　　關(guān)鍵詞：半色調(diào)圖像；協(xié)方差矩陣；黎曼流形；最近鄰分類器

0 引言

　　數(shù)字半色調(diào)（也稱為空間抖動）始于19世紀50年代，是將一幅連續(xù)色調(diào)的圖像先進行二值化處理，再用這些黑白二色的點來表示各個等級灰度的技術(shù)[1]。數(shù)字半色調(diào)技術(shù)已廣泛應用于傳真、打印、印刷、顯示設(shè)備及數(shù)字圖像的壓縮存儲等領(lǐng)域。較常用的數(shù)字半色調(diào)方法有：有序抖動法[2]、誤差分散法[3]、點分散法[4]、綠噪聲半調(diào)法[5]等。通過分析現(xiàn)有的半色調(diào)技術(shù)可知，不同半色調(diào)技術(shù)應用于多級圖像時將產(chǎn)生具有各自不同特性的半色調(diào)圖像[6]，有周期性、點分布、點分散性、點相關(guān)性等。當通用型逆半色調(diào)技術(shù)用于某種半色調(diào)圖像的重建時，將缺少相關(guān)半色調(diào)模式信息，所以較難獲得半色調(diào)圖像的最優(yōu)重建。

　　目前數(shù)字半色調(diào)圖像分類方法的研究比較少。Chang[7]首先對半色調(diào)圖像分類進行研究，指出在半色調(diào)圖像恢復成連續(xù)灰度圖像之前運用一維自相關(guān)函數(shù)，提取出四類半色調(diào)圖像，最后用BP神經(jīng)網(wǎng)絡進行分類。雖然該方法分類結(jié)果有時能達到100%，但獲取的類別比較少。文志強[1，8]提出一種在3個方向上利用像素自相關(guān)特征進行同或運算來描述紋理特征的有監(jiān)督流形上的半色調(diào)分類方法，利用圖像分塊的思想獲取紋理特征，目的在于提高建模效率和紋理特征的有效性。

　　以上方法都基于歐式空間，本文提出的方法需在黎曼空間上進行特征匹配，再利用黎曼距離和局部概率密度來實現(xiàn)對半色調(diào)圖像的分類。黎曼流形是具有黎曼度量的微分流形，即有一個對稱正定協(xié)變的二階張量場在這個流形上，相比于歐式空間，具有更豐富的黎曼度量方法，是研究概率分布和模式匹配的有效工具。

1 傳統(tǒng)協(xié)方差矩陣建模方法

　　通過多種半色調(diào)技術(shù)可將多級灰度圖像轉(zhuǎn)化為半色調(diào)圖像樣本，并對其進行分類。12種常用半色調(diào)技術(shù)，如表1所示。圖1給出相應的12幅灰度圖像產(chǎn)生的半色調(diào)圖像（以lena（大?。?56×256）為例）。由圖1可知，不同半色調(diào)技術(shù)產(chǎn)生的半色調(diào)圖像具有不同的紋理特征。一些半色調(diào)圖像紋理比較明顯，如圖1中的（a）、（g）、（h）、（i）子圖；另一些紋理差別不明顯，分類較困難，如圖1中（b）、（c）、（e）和（l）子圖難以區(qū)分，子圖（d）、（f）、（j）和（k）區(qū)別也較小。由分析可知，造成半色調(diào)圖像分類錯誤率高的最主要原因是紋理差別不明顯。因此，本文在半色調(diào)圖像上對協(xié)方差矩陣改進之后再進行構(gòu)建與分類。

　　協(xié)方差矩陣[13-14]（Covariance matrix，COV）是概率論、統(tǒng)計學的一個概念，通過不同維度計算協(xié)方差構(gòu)成的矩陣，衡量兩個隨機變量的變化。協(xié)方差矩陣表示一個多維隨機變量各個維度之間的相關(guān)性。協(xié)方差矩陣于2006年被Tuzel O，Porikli F[15]作為描述子最先應用在醫(yī)學圖像處理的目標檢測中，能夠很好地描述圖像，因為將其用于圖像特征提取時，將區(qū)域圖像不同的特征值通過統(tǒng)計矢量的方式統(tǒng)一于協(xié)方差矩陣中。COV作為描述子具有很好的魯棒性，對外部形態(tài)和光照的改變能很好地維持其主要特征的不變性，所以可將COV應用于半色調(diào)圖像的特征提取中[16]。

　　COV定義如下：

　　設(shè)I為一維強度或三維強度的彩色圖像，f為原圖I內(nèi)具有M×N個像素的區(qū)域圖像，h為該區(qū)域f內(nèi)提取的d維特征向量，如式（1）所示：

　　將區(qū)域f每個像素的特征向量通過共生關(guān)系統(tǒng)一到協(xié)方差矩陣C中，如式（2）所示：

　　其中，h（x，y）為區(qū)域矩陣每個元素的特征向量，u為M×N個dx1維特征向量h（x，y）的均值，h（x，y）表示區(qū)域圖像每個像素的底層特征，如式（3）所示：

　　h（x，y）=[|fxx|，|fyy|，|fx|，|fy|，f（x，y）]T（3）

　　式（2）中C（f）為協(xié)方差矩陣，融合了原始圖像底層的五個特征，等價于公式（4）：

　　C（f）=HHT（4）

　　由公式（1）~（4）可知，COV能夠較好地表示圖像的特征，且具有如下優(yōu)點：

　?。?）很好的辨識度。能夠?qū)^(qū)域圖像多種特征融合于COV中。

　?。?）更低的維數(shù)。COV是一個對稱的半正定矩陣，所以d維的特征向量構(gòu)成的協(xié)方差矩陣具有（d2+d）/2個不同值。

　　（3）很好的魯棒性。將一幅圖像旋轉(zhuǎn)后，若選取的特征適當，則形成的COV不發(fā)生相應的改變。

　　2 改進的協(xié)方差矩陣建模方法

　　COV雖然有很多優(yōu)點，但也存在不足。由公式（2）可知，當h（x，y）=u時，協(xié)方差矩陣的行列式有可能為0，所以準確地講，協(xié)方差矩陣應屬半正定矩陣，針對該問題可采用附加一個足夠小的對角矩陣p來進行預處理。

　　可以看到，圖1中12幅半色調(diào)圖像的紋理不明顯，分類較困難。針對這一難點，可將半色調(diào)圖像求梯度，即通過梯度信息來描述圖像中物體的邊緣、輪廓、形狀等紋理特征。對圖像加入水平邊緣算子[-1，0，1]和垂直邊緣算子[-1，0，1]T，并將該特征加入?yún)f(xié)方差矩陣的底層特征中。所以提出改進的協(xié)方差矩陣（Improved covariance matrix，ICM）。

　　本文獲取區(qū)域半色調(diào)圖像f的底層特征如公式（5）所示，通過公式（2）將其構(gòu)成COV。

　　h（x，y）=[x，y，|fx|，|fxx|，|fy|，|fyy|，f（x，y），

　　其中，x，y分別為區(qū)域半色調(diào)圖像的坐標值，f（x，y）設(shè)定以位置（x，y）為中心的n×n（實驗中n取9）鄰域各個像素值之和，|fx|、|fxx|為像素值在x方向的一階、二階導，|fy|、|fyy|為像素值在y方向的一階、二階導。arctan|fy|/（|fx|+p）為f（x，y）在位置（x，y）處的梯度。由于協(xié)方差矩陣的行列式有可能為0，所以添加一個無窮小量。S1（x，y）=（|Ix|*|Ix|+|Iy|*|Iy|+|fx|*|fx|+|fy|*|fy|），其中Ix為水平邊緣梯度，Iy為垂直邊緣梯度。S2（x，y）=arctan|Iy|/（|Ix|+p）。圖2為對應圖1中ICM特征圖像示例圖。由圖2可知，各矩陣的特征圖都有一定的差別，這說明提取的特征矩陣可用于描述半色調(diào)圖像。即加入梯度算子后，圖像的輪廓明顯變得更清晰。將梯度算子加入COV的底層特征后，特征更明顯，更容易區(qū)分圖像的紋理信息。ICM算法實現(xiàn)步驟如下：

　　算法：ICM算子的構(gòu)造

　　輸入：一幅大小為M×N的區(qū)域半色調(diào)圖像f

　　輸出：能夠表征原始半色調(diào)圖像的改進協(xié)方差矩陣

　　Step1 根據(jù)公式（5）獲取區(qū)域半色調(diào)圖像的十個底層特征，分別是x，y，|fx|，|fxx|，|fy|，|fyy|，f（x，y），arctan|fy|/（|fx|+p），S1（x，y），S2（x，y）；

　　Step2根據(jù)公式（2）計算區(qū)域半色調(diào)圖像f的協(xié)方差矩陣C（f）。

3 實驗結(jié)果及比較

　　3.1 實驗環(huán)境

　　本實驗在Windows 7操作系統(tǒng)環(huán)境下進行，采用VC6.0結(jié)合OpenCV 1.0及MATLAB 7.11進行編程。常用半色調(diào)圖像由VC6.0結(jié)合OpenCV 1.0產(chǎn)生，ICM特征的提取使用MATLAB 7.11生成。

　　3.2 實驗結(jié)果

　　對原始圖像產(chǎn)生12類常用半色調(diào)圖像庫，對每類隨機取出410幅樣本（大小為256×256）。對每幅圖像提取ICM特征，之后從每類410個協(xié)方差矩陣的特征中隨機抽取205個作為訓練樣本，剩余205個作為測試樣本。為驗證提出方法的有效性，取相同K值不同類型的特征矩陣在黎曼流形上采用K最近鄰分類器對紋理特征進行分類?，F(xiàn)取K=23，應用傳統(tǒng)的協(xié)方差矩陣與本文提出方法對隨機取出的410×12幅圖像進行分類，比較其分類精度如表2和表3所示。

　　由表2可知，采用傳統(tǒng)協(xié)方差矩陣對12類常用的半色調(diào)圖像的平均分類正確率為83.487 5%，由表3可知，提出方法對12類常用半色調(diào)圖像的平均分類正確率為92.598 3%。比較表明，本文所提出的方法有所改善。

　　3.3 參數(shù)影響

　　對于多類別（類別數(shù)大于2）投票時可能會出現(xiàn)兩種或多種類別票數(shù)相同問題，這種情況下分類器取K個近鄰值中最小值對應的類別為最終類別。分類結(jié)果性能采用平均分類錯誤率（公式（7））和分類錯誤方差率（公式（8））來評價，其中公式（6）為錯誤分類率。平均分類錯誤率越小說明分類效果越好，分類錯誤方差率越小說明分類器越穩(wěn)定。

　　其中，nj為測試樣本總數(shù)，mj為正確分類樣本數(shù)，N為總的類別數(shù)（N=12），j為類別數(shù)，j=1，2，…，12。

　　本實驗測試不同K值對相同類型的影響。由12類常用半色調(diào)圖像變更不同的K值，分別取11，15，19，23，27，31，35七個值來比較傳統(tǒng)協(xié)方差矩陣和提出方法提取特征矩陣對其進行eave和v比較，折線圖比較如圖3和圖4所示。由圖3可知，常用12類半色調(diào)圖像的分類中，COV在K=19時分類效果最好，ICM在K=23時分類效果最好。但不管K為何值，提出方法效果均優(yōu)于COV。由圖4的v折線圖可知，COV在K=23時分類器最穩(wěn)定，ICM在K=27時v最小，此時的分類器性能最穩(wěn)定。不管K為何值，本文提出方法的分類器更穩(wěn)定。由此證明，提出方法的有效性。

4 總結(jié)

　　針對12類常用半色調(diào)圖像的分類問題，對半色調(diào)圖像的特征建模和分類方法進行了深入研究，提出對傳統(tǒng)的協(xié)方差矩陣進行改進，并用黎曼流形上的K最近鄰方法對提取出的特征矩陣進行分類。通過比較分類精度來驗證提出方法的有效性。實驗證明，將傳統(tǒng)的協(xié)方差矩陣與提出方法進行eave和v比較，可知提出方法在K=23時，eave最低，即分類效果最好；在K=27時，v最小，即分類器性能最穩(wěn)定，所以在選擇K值時應視需求而定。

參考文獻

　　[1] 文志強，胡永祥，朱文球.基于統(tǒng)計量模板的半色調(diào)圖像特征提取與分類[J].計算機科學，2013，40（12）：94-112.

　　[2] LIU Y F， GUO J M. New class tiling design for dot-diffused halftoning[J]. IEEE Trans. on Image Process， 2013，2（3）： 1199-1208.

　　[3] STEVENSON R. Inverse halftoning via MAP estimation[J].IEEE Trans. on Image Processing， 1997， 6（4）： 574-583.

　　[4] MESE M， VAIDYANATHAN P P. Recent advances in digital halftoning and inverse halftoning methods[J]. IEEE Trans. on Ciruits and Systems： Fundamental Theory and Applications， 2002，49（6）： 790-805.

　　[5] LIU Y F， GUO J M， LEE J D. Inverse halftoning based on the Bayesian theorem[J]. IEEE Trans. on Image Process， 2011， 20（4）： 1077-1084.

　　[6] 文志強，胡永祥，朱文球.黎曼流形上半調(diào)圖像的協(xié)方差建模與貝葉斯分類方法[J].模式識別與人工智能，2013，26（11）：993-1003.

　　[7] CHANG P C， YU C S. Neural net classification and LMS reconstruction to halftone images[C]. Proc. of the SPIE Visual Communications and Image Processing， San Jose， USA， 1998： 592-602.

　　[8] Wen Zhiqiang， Hu Yongxiang， Zhu Wenqiu. A novel classification method of halftone image via statistics matrices[J]. IEEE Trans. on Image Process， 2014， 23（11）： 4724-4736.

　　[9] GUO J M， LIU Y F， CHANG J Y， et al. Efficient halftoning based on multiple look-up tables[J]. IEEE Trans. on Image Process， 2013， 22（11）：4522-4531.

　　[10] MESE M， VAIDYANATHAN P P． Recent advances in digital halftoning and inverse halftoning methods[J]. Circuits and Systems I： Fundamental Theory and Applications， IEEE Transactions on， 2002，49（6）：790-805.

　　[11] ULICHNEY R. Digital halftoning and the physical reconstruction function[C]. Ph. D Dissertation. Cambridge， USA： Massachusetts Institute of Technology， 1986.

　　[12] KNUTH D E. Digital halftones by dot diffusion[J]. ACM Trans. on Graphics， 1987， 6（4）：245-273.

　　[13] MESE M， VAIDYANATHAN P P. Optimized halftoning using dot diffusion and methods for inverse halftoning[J]. IEEE Trans. on Images Process， 2000，9（4）：691-709.

　　[14] WU Y， CHENG J， WANG J， et al. Real-time probabilistic covariance tracking with efficient model update[J]. IEEE Trans. on Image Process， 2012，21（5）：2824-2837 .

　　[15] PORIKLI F， TUZEL O， MEER P. Covariance tracking using model update based on lie algebra[C]. Computer Vision and Pattern Recognition， 2006 IEEE Computer Society Conference on. IEEE， 2006：728-735.

　　[16] Wen Zhiqiang， Hu Yongxiang， Zhu Wenqiu. Bayesian classification of halftone image based on region covariance[J]. Intelligent System Design and Engineering Applications， 2013（3）：398-401.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容