《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 基于最小二乘法擬合的漢字圖像筆畫點研究
基于最小二乘法擬合的漢字圖像筆畫點研究
來源:微型機(jī)與應(yīng)用2011年第20期
劉榮生, 傅惠南, 庫才高
(廣東工業(yè)大學(xué) 機(jī)電工程學(xué)院, 廣東 廣州510006)
摘要: 結(jié)合C程序,將預(yù)處理后的單個漢字圖像與原圖像進(jìn)行逐個像素對比以判斷讀寫,描寫出原漢字字形。對經(jīng)過預(yù)處理的單個漢字圖像進(jìn)行分析,提出了運用最小二乘法對二值化筆畫點進(jìn)行分組擬合的方法,從分布散亂的像素點中擬合出直線或曲線,畫出漢字筆畫,并計算相關(guān)系數(shù)、相關(guān)指數(shù)、殘差及其平方和等參數(shù),評估相關(guān)性、回歸特性等擬合效果。最后,采用計算坐標(biāo)平均的方法平整左右上下線,將其矯正成左右邊豎直、上下邊水平的口字形。
Abstract:
Key words :

摘  要: 結(jié)合C程序,將預(yù)處理后的單個漢字圖像與原圖像進(jìn)行逐個像素對比以判斷讀寫,描寫出原漢字字形。對經(jīng)過預(yù)處理的單個漢字圖像進(jìn)行分析,提出了運用最小二乘法對二值化筆畫點進(jìn)行分組擬合的方法,從分布散亂的像素點中擬合出直線或曲線,畫出漢字筆畫,并計算相關(guān)系數(shù)、相關(guān)指數(shù)、殘差及其平方和等參數(shù),評估相關(guān)性、回歸特性等擬合效果。最后,采用計算坐標(biāo)平均的方法平整左右上下線,將其矯正成左右邊豎直、上下邊水平的口字形。
關(guān)鍵詞: 圖像分析;最小二乘法;擬合;像素對比;漢字筆畫

    由于數(shù)字圖像的復(fù)雜性,至今仍沒有一種通用的處理檢測算法。在處理時,對被處理的圖像有相當(dāng)?shù)囊蕾囆?不同的算法都有其優(yōu)點,同時也存在各自的不足[1]。
    將原圖像與預(yù)處理后的圖像進(jìn)行像素對比讀寫,從而描繪出與原圖像相仿的漢字字形。該方法以C程序來實現(xiàn),簡單而實用。
  通過預(yù)處理操作,單個漢字圖像的筆畫會變成一些看似有規(guī)律分布的像素點,其中,不少的像素點已經(jīng)被處理掉,筆畫變得斷斷續(xù)續(xù)、參差不齊,不好判斷其原字形。應(yīng)用最小二乘法進(jìn)行擬合能將這些點按照某種規(guī)律連續(xù)起來,可以很大程度地還原筆畫,為進(jìn)一步的識別打下基礎(chǔ)[2]。
    曲線擬合中最基本和最常用的是直線擬合[3]。設(shè)x和y之間的函數(shù)關(guān)系為:
  

 


    計算結(jié)果與擬合效果評定如下:
    斜率b=1.326 167 238 195 73;截距a=16.116 855 710 894 2;回歸方程為y=1.326 167 238 195 73x+16.116 855 710 894 2;相關(guān)系數(shù):r=0.929 217 368 156 058,正相關(guān)很強(qiáng);相關(guān)指數(shù)R2=0.863 444 917 282 872,回歸效果很好;殘差平方和為527.222 104 985 4。
2.3  “口”字形筆畫點
    采用最小二乘法進(jìn)行擬合的方法進(jìn)行口字分組擬合直線,以提取“苦”中的“口”字形。鑒于像素點數(shù)量過大不便于進(jìn)行擬合實驗,本文先進(jìn)行二值化處理減少筆畫點,再進(jìn)行直線擬合。圖3為選取各組不同閾值進(jìn)行二值化得到的結(jié)果,可以看出,當(dāng)閾值變小時,筆畫點的數(shù)量也將減少。
    從圖3可以看出,當(dāng)閾值取60時,筆畫的數(shù)量合適,便于進(jìn)行擬合分析,因此選取圖3(d)圖進(jìn)行坐標(biāo)點賦值和擬合實驗。

   將X右、Y底、X左、Y上作為筆畫的四邊,得到矯正后的口字形,同時4個對角點位置由所得4個平均坐標(biāo)組合得到,確定筆畫的邊界。坐標(biāo)平均矯正的結(jié)果如圖5(b)所示。
    本文對最小二乘法擬合原理計算公式進(jìn)行了闡述,提出的像素點對比方法達(dá)到了提出漢字整體輪廓的目的。同時也提出將最小二乘法直線擬合運用到單個漢字筆畫點字形提取當(dāng)中,得到了與原字形相符的“口”字形筆畫,擬合效果好,達(dá)到了預(yù)期的目的,同時為漢字的自動識別提取研究打下基礎(chǔ)。
    另外,對以下幾個方面作進(jìn)一步說明:(1)對于彎曲曲線的字形筆畫,可以嘗試用最小二乘法進(jìn)行曲線擬合,同時,其他高等數(shù)學(xué)擬合方法也可以用來對筆畫點進(jìn)行分析;(2)漢字筆畫點自動識別提取,實現(xiàn)對筆畫點自動擬合;(3)筆畫點二值化處理的閾值選擇與筆畫點數(shù)量的確定需要進(jìn)行更客觀的規(guī)律分析,達(dá)到閾值的優(yōu)化選擇,筆畫點數(shù)量范圍更大。
參考文獻(xiàn)
[1] 朱輝,楊揚,頡斌,等.SVM在小字符集手寫體漢字識別中的應(yīng)用研究[J].微計算機(jī)信息,2004(8-1):21-23.
[2] 樊鈞,王潤生.從圖像中提取文字[J].國防科技大學(xué)學(xué)報,2002(01):59-62.
[3] 黨興菊,吳文良.最小二乘法擬合直線公式的推導(dǎo)[J].重慶科技學(xué)院學(xué)報(自然科學(xué)版),2010,12(4):185-187.
[4] 薛鵬濤,雷金山,肖立.土工直剪試驗的最小二乘法擬合[J].中外公路,2007,27(5):41-44.
[5] 丁克良,沈云中,歐吉坤.整體最小二乘法直線擬合[J].遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版),2010,29(1):44-47.
[6] 馬建波.C語言圖像處理程序集[M].北京:海洋出版社,1992.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。