123,123

基于字典学习的古建筑图像修复研究

2016年电子技术应用第12期

杨茹1，秦振涛1，杨武年2

1.攀枝花学院数学与计算机学院，四川攀枝花617000； 2.成都理工大学地学空间信息技术国土资源部重点实验室，四川成都610059

摘要： 古代建筑图纸是我国重要的民族瑰宝，亟待利用现代计算机技术对古代建筑图纸进行信息化和修复。提出了一种新的基于字典学习的古建筑图像修复模型，通过K-svd算法进行字典学习，在稀疏域利用已知像素信息填充缺损像素，从而实现对古建筑图像的修复及噪声的滤除。实验表明，该算法能较好地修复古建筑图像，降低图像的均方误差，在实际应用中具有良好的可行性和应用前景。

關(guān)鍵詞： 稀疏表示古代建筑图纸字典学习图像修复

中圖分類號： TN911
文獻標識碼： A
DOI：10.16157/j.issn.0258-7998.2016.12.013
中文引用格式： 楊茹，秦振濤，楊武年. 基于字典學習的古建筑圖像修復(fù)研究[J].電子技術(shù)應(yīng)用，2016，42(12)：51-53，57.
英文引用格式： Yang Ru，Qin Zhentao，Yang Wunian. Study on inpainting of drawings of ancient buildings based on dictionary learning[J].Application of Electronic Technique，2016，42(12)：51-53，57.

Study on inpainting of drawings of ancient buildings based on dictionary learning

Yang Ru1，Qin Zhentao1，Yang Wunian2

1.School of Mathematics and Computer Science，Panzhihua College，Panzhihua 617000，China； 2.Key Laboratory of Geo-special Information Technology，Ministry of Land and Resources，Chengdu University of Technology， Chengdu 610059，China

Abstract： Drawings of ancient buildings are tenures of traditional Chinese culture, and need to be informatization and inpainting urgently. A novel model of inpainting the drawings of ancient buildings is proposed, which carry on the dictionary learning by K-svd algorithm, and filling missing pixels by known pixels in sparse domain，so as to implement the inpainting of drawings of ancient buildings and remove impulsive noise. The experimental results show that the algorithm can inpaint the image more effectively and decrease the RMSE, this method has better performance than other dictionary learning algorithm, and has good application potential and good application prospects.

Key words : sparse representation；drawings of ancient buildings；dictionary learning；inpainting of drawings

0 引言

古代建筑圖紙能夠反映古人對建筑獨特的認識與理解，不僅具有極高的歷史價值、文化價值和科學價值，同時也是現(xiàn)代仿古建筑、園林景觀和旅游景區(qū)的重要借鑒^[1]。建筑圖紙的質(zhì)地、圖形、字體及涂料具有多樣性，需要特別的保護。當前，在實際的工作環(huán)境中，大部分建筑圖紙以卷宗的形式進行保存，隨著時間的變遷，建筑圖紙的缺損非常嚴重，且在掃描、微縮處理中，圖紙的像素丟失嚴重。對建筑圖紙進行修復(fù)、評估及再利用，一直作為建筑學科及計算機圖像處理等領(lǐng)域的研究熱點而受到關(guān)注^[2]。僛文峰等人指出圖紙的破損主要是由于圖紙質(zhì)地的酸性化而變黃、發(fā)干, 以及隨之而來的粉碎和撕毀情況比較嚴重；由于時間久遠，圖紙質(zhì)地及顏料也會出現(xiàn)不同程度的缺損、黃色斑點等破損；在對古建筑圖紙進行信息化加工的過程中也會造成像素的丟失，出現(xiàn)黑色斑點等。本文針對掃描及微縮以后的古建筑圖像提出一種新的基于字典學習的修復(fù)方法，該算法在稀疏域針對污損圖像的特迭代處理，從而達到古建筑圖紙修復(fù)的目的。通過實驗表明，該算法能較好地修復(fù)古建筑圖像，降低了圖像的均方誤差，在實際應(yīng)用中具有良好的前景。

1 古建筑圖像修復(fù)模型

1.1 基于稀疏表示的古建筑圖像處理模型

在圖像處理領(lǐng)域^[3]，任一理想的古建筑圖像可以表示為y₀∈R^N，稀疏表示的目標是找到一個稀疏表示向量x₀，且x₀的0范數(shù)||x₀||₀=k₀，滿足：y₀=Ax₀。A為字典，B為圖像退化算子，表示圖像丟失掉的p個采樣，則：y=By₀。B表示單位矩陣(大小為：n×n)根據(jù)丟失掉的（缺損）采樣去除p行后的矩陣，其大小為(n-p)×n，則古建筑圖像修復(fù)問題就轉(zhuǎn)化為求其稀疏表示向量進而獲得未降質(zhì)圖像則可以建模為式(1)^[4]：

1.2 對模型的求解

該問題中由于原始古建筑圖像y₀未知，且古建筑圖像一般較大，存在多種類型的缺損，因此需要對大的圖像進行分塊。根據(jù)給定的字典A，將大的圖像分割成一些小的塊后，每個塊都有其稀疏表示系數(shù)，降質(zhì)操作B為一矩陣，根據(jù)Elad等人的原理，該問題屬于M-稀疏域模型，則可以轉(zhuǎn)化如下最大后驗概率問題^[5]：

下一部分獲得該模型中字典A的求解，通過式(5)能夠獲得輸出圖像，對丟失掉的像素，通過塊中已知像素進行平均獲得。

2 字典學習算法

字典學習過程一般分為2個階段，分別是稀疏編碼及字典更新。在對式(5)求解時，一般假設(shè)字典A∈R^n×k(k>n)為已知，如DCT、DWT和FFT等。為了進一步提高修復(fù)古建筑圖像的修復(fù)能力，本文分別通過MOD算法和K-SVD算法進行字典學習，在字典學習過程中需考慮缺損像素。因此，一旦獲得字典，就可以完成稀疏編碼，然后固定系數(shù)，再更新字典，從而轉(zhuǎn)化為求式(6)錯誤的最小值：

2.1 MOD字典學習算法

MOD算法（Method of Optimal Direction）也稱為最優(yōu)方向法^[6]，該算法由K.Engan等人在1999年提出,通過對錯誤求導(dǎo)，然后令其為0，則可得：

2.2 改進的K-SVD字典學習算法

本文根據(jù)缺損的古建筑圖像進行K-SVD字典學習，利用K-SVD算法[7]每次更新字典A的一列，對字典的第j列a_j，根據(jù)式(6)，僅有第k塊用到了這個原子，將其表示為域P_k，則可將式(6)進行如下轉(zhuǎn)化：

將圖像塊合并后輸出即可獲得最終修復(fù)圖像，經(jīng)過字典學習后獲得的MOD字典及K-SVD字典如圖1和圖2所示。由圖可見，K-SVD字典包含了缺損圖像形變區(qū)的原子，表明K-SVD字典能夠根據(jù)圖像的特點進行自適應(yīng)調(diào)整，從而保留更多的細節(jié)和邊緣信息，更加有利于后續(xù)的處理。

2.3 算法分析

該算法的計算復(fù)雜度可以分為兩部分：稀疏編碼、字典更新（迭代J次）與最終的輸出過程構(gòu)成。古建筑圖像中的每個像素點的計算復(fù)雜度為：O(K×L×J)，其中，K為字典的列向量的個數(shù)，L為每個系數(shù)的非零元素的個數(shù)，一般取決于古建筑圖像的噪聲的方差和缺損像素的個數(shù)。

3 模擬實驗

對本文提出算法的性能進行測試，實驗用古建筑圖像稱為重檐四角亭，來源于成都理工大學；圖像的大小為256×256。實驗所使用的PC是CPU 3.0 GHz，內(nèi)存為2 GB，算法用GNUOctave進行實現(xiàn)。圖3分別為加噪20 dB后，損失50%像素后的原始古建筑圖像，以及采用MOD字典學習算法的修復(fù)結(jié)果和采用K-SVD字典學習算法的修復(fù)結(jié)果圖。設(shè)置字典原子的個數(shù)為256，圖像塊大小為8×8。圖4為隨著迭代次數(shù)的增加，MOD字典學習算法和K-SVD字典學習算法的修復(fù)效果對比圖。表1為采用MOD字典學習算法和K-SVD字典學習算法迭代15次后所獲得的RMSE(均方根誤差)。由圖3可見，采用K-SVD算法修復(fù)的效果明顯優(yōu)于采用MOD算法修復(fù)的效果，尤其是右上角塔頂處的局部放大圖所示。

本實驗中運用K-SVD字典學習算法實現(xiàn)了對古建筑圖像的修復(fù)，由圖4可見，K-SVD字典學習算法的修復(fù)效果優(yōu)于MOD字典學習算法，且 K-SVD算法的魯棒性更強。

4 結(jié)論

本文通過對缺損古建筑圖像問題進行建模，然后利用字典學習算法實現(xiàn)對缺損圖像的修復(fù)。通過對重檐四角亭古建筑圖像進行修復(fù)試驗，表明K-SVD字典學習算法具有更優(yōu)的效果。本文利用機器學習及圖像處理技術(shù)對解決古建筑圖紙、古文獻修復(fù)等問題提出了新的思路，對該算法的優(yōu)化和應(yīng)用的拓展是下一步研究的重點。

參考文獻

[1] 王茹.古建筑數(shù)字化及三維建模關(guān)鍵技術(shù)研究[D].西安：西北大學，2010.

[2] 李四明.工程圖紙輸入與自動識別系統(tǒng)的研究[D].北京：中國農(nóng)業(yè)大學，2000.

[3] N Metaxas D，AXEL L.Recent novel methods and approaches in sparsity-based compressive sensing and sparse learning have shown promising results. Introduction[J].Med Image Anal，2014，18(6)：819.

[4] ELDAR Y C.Compressed sensing：theory and applications[M].Cambridge University Press，2012：556.

[5] ELAD M，AHARON M.Image denoising via sparse and redundant representations over learned dictionaries[J].IEEE Transactions Image Process，2006，15(12)：3736-3745.

[6] OLSHAUSEN B A，F(xiàn)IELD D J.Sparse coding with an overcomplete basis set: a strategy employed by V1[J].Vision Research，1997，37(23)：3311-3325.

[7] RUBINSTEIN R，PELEG T，ELAD M.Analysis K-SVD：a dictionary-learning algorithm for the analysis sparse model[J].IEEE Transactions on Signal Processing，2013，61(3)：661-677.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容