摘 要: 超分辨率重建通用方法中,圖像分解后對應(yīng)小波基只能有效稀疏表示單一成分,往往只側(cè)重邊緣成分而忽略了光滑成分等。針對這個問題,本文改進了一種基于壓縮感知的聲納圖像超分辨率重建算法。該算法基于三種不同稀疏字典小波變換模型,運用一種基于K-均值聚類算法的結(jié)構(gòu)化字典訓(xùn)練法,并采用Newton-Raphson法進行迭代算法處理,實現(xiàn)聲納圖像壓縮感知的超分辨率重建。最后通過仿真實驗,驗證了此種算法的可行性和有效性。實驗結(jié)果表明,該算法獲得的超分辨率圖像能夠很好地重建并保持原圖像的特征,能高效地改善并提高重建質(zhì)量。
關(guān)鍵詞: 壓縮感知;超分辨率重建;稀疏字典;K-均值聚類算法;Newton-Raphson迭代法
0 引言
聲納圖像技術(shù)以其系統(tǒng)的先進、穩(wěn)定、高分辨率、高質(zhì)量等優(yōu)點廣泛應(yīng)用于各個領(lǐng)域中。而高分辨率的聲納圖像可獲得更全面更充足的水下情況信息,為聲納圖像技術(shù)的應(yīng)用提供更可靠的數(shù)據(jù)。要獲得高分辨率圖像,最直接的辦法是采用高分辨率圖像傳感器。但由于傳感器和光學器件制造工藝和成本的限制,在很多場合和大規(guī)模部署中很難實現(xiàn)[1]。
超分辨率(Super-resolution,SR)重建即通過序列低分辨率(Low-resolution,LR)圖像獲得高分辨率(High-resolution,HR)圖像的過程。近年來,壓縮感知與圖像處理技術(shù)的融合已成為該領(lǐng)域的熱點研究對象,各研究成果層出不窮,取得很大的進展。壓縮感知理論指出:利用隨機測量矩陣可把一個稀疏(或可壓縮)的高維信號投影到低維(相對于高維)的空間上,并證明了這樣的隨機投影包含了重建信號的足夠信息,即利用信號的稀疏性(或可壓縮性)先驗條件,通過一定的線性或非線性的解碼模型可以以很高的概率重建原始信號[2]。近年來,基于字典學習方法的圖像重建[3]成為各界學者研究的主流。
本文將壓縮感知中的字典學習方法應(yīng)用于聲納圖像超分辨率重建中,改進了一種基于壓縮感知多重稀疏表示的聲納圖像超分辨率重建方法。該方法針對聲納圖像所包含的光滑、邊緣和紋理這三種形態(tài)信息特點,分別建立符合類內(nèi)強稀疏且類間強不相干的過完備稀疏字典,并在傳統(tǒng)字典學習的基礎(chǔ)上,運用一種基于K-均值聚類算法的結(jié)構(gòu)化字典訓(xùn)練法,且采用Newton-Raphson迭代算法快速求解交替迭代的運算過程。通過仿真實驗驗證了該方法在聲納圖像重建中的可行性與有效性。
1 超分辨率模型、稀疏字典及重建
1.1 超分辨率模型
低分辨率圖像由高分辨率圖像經(jīng)過相對運動、光學模糊、下采樣或添加噪聲等處理得到。具體在實際應(yīng)用中表現(xiàn)為數(shù)字圖像采集處理過程中的圖像分辨率的下降,其主要現(xiàn)象為圖像模糊、噪聲與變形。
設(shè)第N幀低分辨率圖像序列為{Vk|k=1,…,N},每幀中的圖像大小為:L=I1×I2。利用超分辨率圖像重建,擬獲得大小為M=r1I1×r2I2的高分辨率圖像I,其中,r1、r2分別表示水平和垂直方向的分辨率提高因子,則超分辨率的通用退化數(shù)學模型[4]表示為:
其中,Vk∈RL表示第k幀低分辨率圖像,Ik∈RM表示原高分辨率圖像,Hk表示Vk相對于I的運動變形矩陣,Bk表示光學模糊矩陣,Dk表示下采樣矩陣,是系統(tǒng)引入的加性且均值為零的高斯白噪聲。
1.2 稀疏字典
字典學習是通過稀疏表示來尋找最優(yōu)基結(jié)構(gòu)的過程,匹配且合適的字典可滿足稀疏表示的各類約束,也能使信號獲得更為精確的表示。字典學習主要包含兩個關(guān)鍵問題:稀疏編碼與字典更新。是否能夠選取匹配的過完備字典與信號的稀疏性息息相關(guān)。通過訓(xùn)練樣本來構(gòu)建過完備字典從而確保信號稀疏性,是通用字典學習的算法之一。
1.3 壓縮感知超分辨率重建
參考文獻[5]提出了一種使用成分稀疏表示來實現(xiàn)超分辨率的方法,該方法在進行超分辨重建時,提取圖像中的卡通成分和紋理成分,接著用兩種不同的小波基對各自成分進行壓縮感知。然而,基于形態(tài)學分析的圖像,其卡通成分通常被分解為光滑成分和邊緣成分,而一種小波基只能有效地稀疏表示一種成分,一般情況下只側(cè)重邊緣成分而忽略了光滑成分。但對于聲納圖像來說,噪聲在一定程度上影響了其成像效果,因此對聲納圖像的光滑成分的研究對于超分辨率重建也起著重要的作用。
根據(jù)Meyer提出的卡通紋模式圖像分解模型[6],圖像分解成光滑、邊緣、紋理三種結(jié)構(gòu)形態(tài)后,選用不同的過完備字典稀疏來表示每個成分。所選用的字典應(yīng)盡可能匹配各部分的結(jié)構(gòu)形態(tài),且各成分的字典需保持類內(nèi)強稀疏、類間不相干的特性。因此,根據(jù)離散平穩(wěn)小波變換(Discrete Stationary Wavelet Transform,DSWT)[7-8]、輪廓小波變換[9]即塔型方向濾波器組(Pyramidal Directional Filter Bank,PDFB)、伽柏小波變換[10]建立對應(yīng)稀疏字典。設(shè)圖像I的光滑成分、邊緣成分、紋理成分分別為Is、Ie和It,其對應(yīng)的三個類內(nèi)強稀疏且類間不相干的過完備字典為。
對于圖像I,在過完備字典的作用下,其壓縮感知稀疏表示為:
根據(jù)超分辨率退化模型,基于壓縮感知的退化模型可表示為:
而超分辨率圖像的重建是上述過程的逆過程,其過程表示為,則超分辨率圖像可表示為:
圖像I的光滑、邊緣、紋理三個成分分別為Is、Ie和It,對應(yīng)三個類內(nèi)強稀疏且類間不相干的過完備字典為,可得圖像壓縮感知超分辨率退化模型如下:
運用拉格朗日乘數(shù)法可求解壓縮感知稀疏表示退化模型,得:
其中,是用來平衡各部分比重的參數(shù),其能夠控制誤差和稀疏性之間的平衡,而迭代過程中的方程模型可看做三個非線性凸優(yōu)化問題,即可通過基追蹤去噪法對其進行求解。
上述過程的逆過程為超分辨率圖像的重建,則超分辨率圖像的獲得可表示為:
2 基于壓縮感知的聲納圖像超分辨率重建算法設(shè)計
基于壓縮感知聲納圖像超分辨率重建算法首先對原始圖像進行K-均值聚類算法的結(jié)構(gòu)化字典訓(xùn)練,得到光滑、邊緣、紋理成分對應(yīng)的過完備字典,然后運用Newton-Raphson迭代法求解圖像退化模型中各成分的系數(shù),最后通過超分辨率重建,獲得重建圖像。
2.1 本文基于壓縮感知的聲納圖像超分辨率重建算法實現(xiàn)
本文分別建立三個符合類內(nèi)強稀疏且類間強不相干的過完備稀疏字典,運用一種基于K-均值聚類算法的結(jié)構(gòu)化字典訓(xùn)練法,并采用Newton-Raphson迭代算法快速求解迭代過程,最后選取各數(shù)據(jù)重建聲納圖像。
基于壓縮感知的聲納圖像超分辨率重建框圖如圖1所示。
綜合算法步驟如下:
(1)輸入原始圖像I,圖像維度M,平衡參數(shù),迭代閾值N。
?。?)對參數(shù)進行初始化設(shè)置:設(shè)光滑部分系數(shù)為,邊緣部分系數(shù),紋理部分系數(shù)為。
?。?)運用基于K-均值聚類算法的結(jié)構(gòu)化字典訓(xùn)練法獲得光滑、邊緣、紋理成分對應(yīng)的過完備字典
(4)運用Newton-Raphson迭代法稀疏表示退化模型中光滑、邊緣、紋理成分的系數(shù)。
?。?)輸出
2.2 本文K-均值聚類算法的結(jié)構(gòu)化字典訓(xùn)練算法的設(shè)計
字典訓(xùn)練方法有很多,如最大似然法、最優(yōu)方向法、最大后驗法等,而結(jié)構(gòu)化的字典訓(xùn)練可以反映數(shù)據(jù)中隱藏的結(jié)構(gòu),并構(gòu)造結(jié)構(gòu)化字典,從而提高稀疏表示的精度。
運用一種基于K-均值聚類算法的結(jié)構(gòu)化字典訓(xùn)練法作為綜合算法獲得各過完備字典的第一步。將字典中的原子平均分配到K個聚類中,并利用原子聚類索引計算得出拉普拉斯矩陣L,從而進一步利用GOMP算法[11]最后得到結(jié)構(gòu)化過完備字典?鬃。
整個過完備字典訓(xùn)練過程算法如下:
(1)輸入光滑成分對應(yīng)初始過完備字典,聚類數(shù)Z,訓(xùn)練樣本Ys,迭代閾值N0,正則化參數(shù)λs;
?。?)對參數(shù)進行初始化設(shè)置:設(shè)迭代次數(shù)n=1,聚類中心矩陣,J=1;
?。?)將字典中的原子dj分到與聚類中心最相似的Z個聚類集合中,并通過對矩陣的第z列更新,其中,
聚類集合可表示為:
?。?)J=J+1;循環(huán)(3)~(5)步,獲得穩(wěn)定聚類原子索引;
?。?)根據(jù)原子索引d計算權(quán)重矩陣Ws、對角矩陣Cs及拉普拉斯矩陣Ls,并根據(jù)GOMP算法求出稀疏表示系數(shù),最后更新字典,其過程為:
?。?)n=n+1;循環(huán)(3)~(6)步至滿足停止條件;
?。?)輸出光滑成分對應(yīng)的過完備字典。
同理,運用該結(jié)構(gòu)化字典訓(xùn)練法獲得邊緣成分及紋理成分對應(yīng)的過完備字典和
2.3 結(jié)合Newton-Raphson迭代算法流程
?。?)根據(jù)式(5),恒定Ie、It,更新Is,計算,具體表達式為:
(2)同理,在恒定Is、It的條件下更新Ie,計算;在恒定Is、Ie的條件下更新It,計算;
?。?)n=n+1;循環(huán)迭代直至滿足閾值N時迭代停止。
(4)輸出
3 仿真結(jié)果及分析
設(shè)圖像維度為M,則選取:選擇像素為256×256的原始高分辨率圖像I,經(jīng)過水平、垂直方向平移、高斯模糊、2倍率下采樣及方差為15的高斯白噪聲退化,生成128×128的低分辨率圖像。原始高分辨率圖像和退化后低分辨率圖像如圖2所示。
平衡參數(shù)rs=re=rt選取值為10,噪聲方差為15時,分別用MSRSR法、未使用基于K-均值聚類算法的結(jié)構(gòu)化字典訓(xùn)練一般方法及本文方法對圖像L進行超分辨率重建。各方法重建效果如圖3所示。
噪聲方差為15時,重建結(jié)果的峰值信噪比變化函數(shù)及峰值信噪比的相對誤差變化曲線如圖4所示。
由圖4可以看出,隨著迭代次數(shù)的增加,峰值信噪比值先上升直至趨于平穩(wěn),相對誤差值先下降直至趨于平穩(wěn)。因此,為達到更好的實驗效果,選取停止參數(shù)N>相對誤差值時迭代停止。多次實驗表明,10-4≤N≤10-3時,可得到較好的重建效果。因此,在重建實驗中選取N=10-3。
實驗中,在不同噪聲方差的條件下分別使用MSRSR、一般字典訓(xùn)練重建法及本文方法來觀察聲納圖像重建的效果。具體比較結(jié)果如表1。
實驗結(jié)果表明,三種方法都具有較好的重建效果。MSRSR法所得的峰值信噪比值略小于本文算法,而一般字典訓(xùn)練重建法的峰值信噪比與本文算法結(jié)果近似。但MSRSR方法更易受噪聲影響,且由于稀疏字典與各成分匹配需要一定時間,因而本文算法的運行時間較長于MSRSR法;一般字典訓(xùn)練重建法運算時間較本文算法略大。即t一般字典訓(xùn)練法>t本文方法>tMSRSR。
4 結(jié)論
本文把壓縮感知的方法運用到聲納圖像超分辨率重建中,著重研究了超分辨率模型三種稀疏字典的建立,并結(jié)合K-均值聚類結(jié)構(gòu)化字典訓(xùn)練法訓(xùn)練稀疏字典,最后采用Newton-Raphson迭代法求解圖像退化模型中各成分的系數(shù),代入超分辨率重建模型算法實現(xiàn)重建。實驗結(jié)果表明該改進的基于壓縮感知的超分辨率圖像重建綜合算法與傳統(tǒng)的重建算法相比較,重建質(zhì)量與效果在各個方面都有了較大的改善。
參考文獻
[1] 王梁,郝燕玲,張振興.基于多重稀疏表示的聲納圖像超分辨率重建方法[J].系統(tǒng)工程與電子技術(shù),2012,34(1):204-207.
[2] 方紅,章權(quán)兵,韋穗.基于非常稀疏隨機投影的圖像重建方法[J].計算機工程與應(yīng)用,2007,43(22):25-27.
[3] YAGHOOBI M, BLUMENSATH T, DAVIES M E. Dictionary learning for sparse approxunatuibs with the majorization method[J]. IEEE Tranansaction on Signal Processing, 2009,57(6):2178-2191.
[4] NG M K, BOSE N K, Mathematical analysis of super-resolution methodology[J]. IEEE Signal Processing Magazine, 2003, 20(3):62-74.
[5] 孫玉寶,韋志輝,肖亮,等.多形態(tài)稀疏性正則化的圖像超分辨率算法[J].電子學報,2010(12):2898-2903.
[6] MEYER Y. Oscillating patterns is image processing and nonlinear evolution equations[M]. Boston: Amer. Mathematical Society, 2001.
[7] ZHANG C, WANG X, ZHANG H. An intelligent algorithm for enhancing contrast for image based on discrete stationary wavelet transform and in-complete beta transform[C]. International Conference on Effective Computing and Intelligent Interaction, Beijing: Springer Verlog, 2005:135-143.
[8] WANG X H, ISTEPANIAN R S H, YONG H S. Microarray image enhancement by denoising using stationary wavelet transform[J]. IEEE Transaction on Nanobioscience,2003,2(4):184-189.
[9] DO M N, VETTERLI M. Contourlets: a new directional multi-resolution image representation[C]. The Thirty-Sixth Asilomar Conference on Signals Systems and Computer, Pacific Groove, CA, United states: Institute of Electrical and Electronics Engineers Computer Society, 2002:497-501.
[10] 謝建輝.紋理特征提取與分類研究[D].武漢:華中科技大學,2008.
[11] 李祥燦.基于組稀疏表示的自然圖像超分辨率算法研究[D].南京:南京理工大學,2014.