文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2016.12.013
中文引用格式: 楊茹,秦振濤,楊武年. 基于字典學(xué)習(xí)的古建筑圖像修復(fù)研究[J].電子技術(shù)應(yīng)用,2016,42(12):51-53,57.
英文引用格式: Yang Ru,Qin Zhentao,Yang Wunian. Study on inpainting of drawings of ancient buildings based on dictionary learning[J].Application of Electronic Technique,2016,42(12):51-53,57.
0 引言
古代建筑圖紙能夠反映古人對(duì)建筑獨(dú)特的認(rèn)識(shí)與理解,不僅具有極高的歷史價(jià)值、文化價(jià)值和科學(xué)價(jià)值,同時(shí)也是現(xiàn)代仿古建筑、園林景觀和旅游景區(qū)的重要借鑒[1]。建筑圖紙的質(zhì)地、圖形、字體及涂料具有多樣性,需要特別的保護(hù)。當(dāng)前,在實(shí)際的工作環(huán)境中,大部分建筑圖紙以卷宗的形式進(jìn)行保存,隨著時(shí)間的變遷,建筑圖紙的缺損非常嚴(yán)重,且在掃描、微縮處理中,圖紙的像素丟失嚴(yán)重。對(duì)建筑圖紙進(jìn)行修復(fù)、評(píng)估及再利用,一直作為建筑學(xué)科及計(jì)算機(jī)圖像處理等領(lǐng)域的研究熱點(diǎn)而受到關(guān)注[2]。僛文峰等人指出圖紙的破損主要是由于圖紙質(zhì)地的酸性化而變黃、發(fā)干, 以及隨之而來(lái)的粉碎和撕毀情況比較嚴(yán)重;由于時(shí)間久遠(yuǎn),圖紙質(zhì)地及顏料也會(huì)出現(xiàn)不同程度的缺損、黃色斑點(diǎn)等破損;在對(duì)古建筑圖紙進(jìn)行信息化加工的過(guò)程中也會(huì)造成像素的丟失,出現(xiàn)黑色斑點(diǎn)等。本文針對(duì)掃描及微縮以后的古建筑圖像提出一種新的基于字典學(xué)習(xí)的修復(fù)方法,該算法在稀疏域針對(duì)污損圖像的特迭代處理,從而達(dá)到古建筑圖紙修復(fù)的目的。通過(guò)實(shí)驗(yàn)表明,該算法能較好地修復(fù)古建筑圖像,降低了圖像的均方誤差,在實(shí)際應(yīng)用中具有良好的前景。
1 古建筑圖像修復(fù)模型
1.1 基于稀疏表示的古建筑圖像處理模型
在圖像處理領(lǐng)域[3],任一理想的古建筑圖像可以表示為y0∈RN,稀疏表示的目標(biāo)是找到一個(gè)稀疏表示向量x0,且x0的0范數(shù)||x0||0=k0,滿足:y0=Ax0。A為字典,B為圖像退化算子,表示圖像丟失掉的p個(gè)采樣,則:y=By0。B表示單位矩陣(大小為:n×n)根據(jù)丟失掉的(缺損)采樣去除p行后的矩陣,其大小為(n-p)×n,則古建筑圖像修復(fù)問(wèn)題就轉(zhuǎn)化為求其稀疏表示向量進(jìn)而獲得未降質(zhì)圖像則可以建模為式(1)[4]:
1.2 對(duì)模型的求解
該問(wèn)題中由于原始古建筑圖像y0未知,且古建筑圖像一般較大,存在多種類(lèi)型的缺損,因此需要對(duì)大的圖像進(jìn)行分塊。根據(jù)給定的字典A,將大的圖像分割成一些小的塊后,每個(gè)塊都有其稀疏表示系數(shù),降質(zhì)操作B為一矩陣,根據(jù)Elad等人的原理,該問(wèn)題屬于M-稀疏域模型,則可以轉(zhuǎn)化如下最大后驗(yàn)概率問(wèn)題[5]:
下一部分獲得該模型中字典A的求解,通過(guò)式(5)能夠獲得輸出圖像,對(duì)丟失掉的像素,通過(guò)塊中已知像素進(jìn)行平均獲得。
2 字典學(xué)習(xí)算法
字典學(xué)習(xí)過(guò)程一般分為2個(gè)階段,分別是稀疏編碼及字典更新。在對(duì)式(5)求解時(shí),一般假設(shè)字典A∈Rn×k(k>n)為已知,如DCT、DWT和FFT等。為了進(jìn)一步提高修復(fù)古建筑圖像的修復(fù)能力,本文分別通過(guò)MOD算法和K-SVD算法進(jìn)行字典學(xué)習(xí),在字典學(xué)習(xí)過(guò)程中需考慮缺損像素。因此,一旦獲得字典,就可以完成稀疏編碼,然后固定系數(shù),再更新字典,從而轉(zhuǎn)化為求式(6)錯(cuò)誤的最小值:
2.1 MOD字典學(xué)習(xí)算法
MOD算法(Method of Optimal Direction)也稱為最優(yōu)方向法[6],該算法由K.Engan等人在1999年提出,通過(guò)對(duì)錯(cuò)誤求導(dǎo),然后令其為0,則可得:
2.2 改進(jìn)的K-SVD字典學(xué)習(xí)算法
本文根據(jù)缺損的古建筑圖像進(jìn)行K-SVD字典學(xué)習(xí),利用K-SVD算法[7]每次更新字典A的一列,對(duì)字典的第j列aj,根據(jù)式(6),僅有第k塊用到了這個(gè)原子,將其表示為域Pk,則可將式(6)進(jìn)行如下轉(zhuǎn)化:
將圖像塊合并后輸出即可獲得最終修復(fù)圖像,經(jīng)過(guò)字典學(xué)習(xí)后獲得的MOD字典及K-SVD字典如圖1和圖2所示。由圖可見(jiàn),K-SVD字典包含了缺損圖像形變區(qū)的原子,表明K-SVD字典能夠根據(jù)圖像的特點(diǎn)進(jìn)行自適應(yīng)調(diào)整,從而保留更多的細(xì)節(jié)和邊緣信息,更加有利于后續(xù)的處理。
2.3 算法分析
該算法的計(jì)算復(fù)雜度可以分為兩部分:稀疏編碼、字典更新(迭代J次)與最終的輸出過(guò)程構(gòu)成。古建筑圖像中的每個(gè)像素點(diǎn)的計(jì)算復(fù)雜度為:O(K×L×J),其中,K為字典的列向量的個(gè)數(shù),L為每個(gè)系數(shù)的非零元素的個(gè)數(shù),一般取決于古建筑圖像的噪聲的方差和缺損像素的個(gè)數(shù)。
3 模擬實(shí)驗(yàn)
對(duì)本文提出算法的性能進(jìn)行測(cè)試,實(shí)驗(yàn)用古建筑圖像稱為重檐四角亭,來(lái)源于成都理工大學(xué);圖像的大小為256×256。實(shí)驗(yàn)所使用的PC是CPU 3.0 GHz,內(nèi)存為2 GB,算法用GNUOctave進(jìn)行實(shí)現(xiàn)。圖3分別為加噪20 dB后,損失50%像素后的原始古建筑圖像,以及采用MOD字典學(xué)習(xí)算法的修復(fù)結(jié)果和采用K-SVD字典學(xué)習(xí)算法的修復(fù)結(jié)果圖。設(shè)置字典原子的個(gè)數(shù)為256,圖像塊大小為8×8。圖4為隨著迭代次數(shù)的增加,MOD字典學(xué)習(xí)算法和K-SVD字典學(xué)習(xí)算法的修復(fù)效果對(duì)比圖。表1為采用MOD字典學(xué)習(xí)算法和K-SVD字典學(xué)習(xí)算法迭代15次后所獲得的RMSE(均方根誤差)。由圖3可見(jiàn),采用K-SVD算法修復(fù)的效果明顯優(yōu)于采用MOD算法修復(fù)的效果,尤其是右上角塔頂處的局部放大圖所示。
本實(shí)驗(yàn)中運(yùn)用K-SVD字典學(xué)習(xí)算法實(shí)現(xiàn)了對(duì)古建筑圖像的修復(fù),由圖4可見(jiàn),K-SVD字典學(xué)習(xí)算法的修復(fù)效果優(yōu)于MOD字典學(xué)習(xí)算法,且 K-SVD算法的魯棒性更強(qiáng)。
4 結(jié)論
本文通過(guò)對(duì)缺損古建筑圖像問(wèn)題進(jìn)行建模,然后利用字典學(xué)習(xí)算法實(shí)現(xiàn)對(duì)缺損圖像的修復(fù)。通過(guò)對(duì)重檐四角亭古建筑圖像進(jìn)行修復(fù)試驗(yàn),表明K-SVD字典學(xué)習(xí)算法具有更優(yōu)的效果。本文利用機(jī)器學(xué)習(xí)及圖像處理技術(shù)對(duì)解決古建筑圖紙、古文獻(xiàn)修復(fù)等問(wèn)題提出了新的思路,對(duì)該算法的優(yōu)化和應(yīng)用的拓展是下一步研究的重點(diǎn)。
參考文獻(xiàn)
[1] 王茹.古建筑數(shù)字化及三維建模關(guān)鍵技術(shù)研究[D].西安:西北大學(xué),2010.
[2] 李四明.工程圖紙輸入與自動(dòng)識(shí)別系統(tǒng)的研究[D].北京:中國(guó)農(nóng)業(yè)大學(xué),2000.
[3] N Metaxas D,AXEL L.Recent novel methods and approaches in sparsity-based compressive sensing and sparse learning have shown promising results. Introduction[J].Med Image Anal,2014,18(6):819.
[4] ELDAR Y C.Compressed sensing:theory and applications[M].Cambridge University Press,2012:556.
[5] ELAD M,AHARON M.Image denoising via sparse and redundant representations over learned dictionaries[J].IEEE Transactions Image Process,2006,15(12):3736-3745.
[6] OLSHAUSEN B A,F(xiàn)IELD D J.Sparse coding with an overcomplete basis set: a strategy employed by V1[J].Vision Research,1997,37(23):3311-3325.
[7] RUBINSTEIN R,PELEG T,ELAD M.Analysis K-SVD:a dictionary-learning algorithm for the analysis sparse model[J].IEEE Transactions on Signal Processing,2013,61(3):661-677.