摘 要: 為進(jìn)一步提高牛肉大理石紋評(píng)級(jí)的正確率,提出了基于完整局部二值模式(Completed Local Binary Pattern,CLBP)、改進(jìn)核主成分分析(Kernel Principal Component Analysis,KPCA)和隨機(jī)森林(Random Forests,RF)的牛肉大理石紋評(píng)級(jí)方法。首先,利用CLBP提取牛肉大理石紋圖像的紋理特征;其次,采用混沌蜂群算法對(duì)KPCA的核參數(shù)進(jìn)行優(yōu)化,使KPCA的降維效果和特征提取達(dá)到最優(yōu),獲得表征牛肉大理石紋樣本圖像的特征向量;最后,使用隨機(jī)森林完成牛肉大理石紋樣本的分級(jí)識(shí)別,獲得最終評(píng)級(jí)結(jié)果。大量實(shí)驗(yàn)結(jié)果表明,與基于分形維和圖像特征的方法、基于灰度共生矩陣和BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)法相比,本文方法所得識(shí)別率最高。
關(guān)鍵詞: 牛肉大理石紋評(píng)級(jí);圖像處理;完整局部二值模式;混沌蜂群優(yōu)化;核主成分分析;隨機(jī)森林
0 引言
牛肉大理石紋的豐富程度與牛肉的口感、質(zhì)地、多汁性及風(fēng)味有著直接關(guān)系,它直接影響著牛肉的定價(jià)與消費(fèi),被國(guó)內(nèi)外普遍作為牛肉評(píng)級(jí)的主要指標(biāo)之一。人工的評(píng)級(jí)結(jié)果容易受到個(gè)人差異性和主觀性的影響,存在評(píng)級(jí)準(zhǔn)確率低和速度慢的問(wèn)題,研究實(shí)現(xiàn)牛肉大理石紋的自動(dòng)化評(píng)級(jí),對(duì)提高牛肉質(zhì)量評(píng)定的準(zhǔn)確率和速度有著重要的現(xiàn)實(shí)意義[1-2]。
近年來(lái),將圖像處理技術(shù)應(yīng)用于牛肉大理石紋的自動(dòng)評(píng)級(jí)成為國(guó)內(nèi)外人們的研究熱點(diǎn)[3-5]。參考文獻(xiàn)[6-7]大多僅考慮肌內(nèi)脂肪的面積比例和顆粒數(shù)量,沒(méi)有深入考慮大理石花紋的紋理特征。參考文獻(xiàn)[8-9]采用圖像灰度共生矩陣的統(tǒng)計(jì)量描述牛肉大理石紋特征,再分別結(jié)合BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)或線性回歸模型進(jìn)行評(píng)級(jí),該類(lèi)方法還需要引入其他的紋理特征和評(píng)價(jià)指標(biāo)來(lái)進(jìn)一步提升方法的評(píng)級(jí)正確率。參考文獻(xiàn)[10]提出了完整局部二值模式(Completed LBP,CLBP),在紋理圖像的分類(lèi)應(yīng)用中發(fā)揮了顯著作用。采用CLBP計(jì)算牛肉大理石紋圖像的特征參數(shù),可以更好地表征大理石紋的分布性狀特點(diǎn),有助于提高最終的評(píng)級(jí)正確率。由于所得特征參數(shù)維數(shù)較大,需進(jìn)行降維處理。本文采用混沌蜂群優(yōu)化的核主成分分析(Kernel Principal Component Analysis,KPCA)方法來(lái)實(shí)現(xiàn)降維過(guò)程。KPCA[11]被人們廣泛應(yīng)用于非線性特征提取,但由于其核參數(shù)選擇大多依據(jù)經(jīng)驗(yàn),導(dǎo)致特征提取和降維的效果受到了不同程度的影響。采用結(jié)構(gòu)簡(jiǎn)單且可有效避免局部極值的混沌蜂群算法對(duì)核參數(shù)進(jìn)行優(yōu)化,可以更好地減少時(shí)間花費(fèi),參數(shù)優(yōu)化后的KPCA具備最優(yōu)的特征提取和降維性能。
隨機(jī)森林(Random Forests,RF)[12-13]是一種較新的分類(lèi)器,它具有適應(yīng)高維小樣本數(shù)據(jù)、可以自動(dòng)地進(jìn)行功能選擇、對(duì)無(wú)關(guān)特征不敏感、同等適用于二類(lèi)分類(lèi)和多類(lèi)分類(lèi)問(wèn)題等優(yōu)點(diǎn),且不需要進(jìn)行復(fù)雜的參數(shù)選擇,分類(lèi)正確率和識(shí)別效率都優(yōu)于多元線性回歸模型、BP神經(jīng)網(wǎng)絡(luò)方法。結(jié)合RF實(shí)現(xiàn)牛肉大理石紋的評(píng)級(jí)可望獲得更高的評(píng)級(jí)正確率和效率。
基于上述分析,本文提出基于CLBP、混沌蜂群優(yōu)化KPCA和RF的牛肉大理石紋評(píng)級(jí)方法。首先利用CLBP提取表征牛肉大理石紋圖像的特征參數(shù);其次,采用混沌蜂群優(yōu)化的KPCA對(duì)CLBP編碼信息進(jìn)行降維,得到樣本圖像的特征向量;最后利用RF完成評(píng)級(jí)。
1 牛肉大理石紋圖像的特征提取和降維
1.1 CLBP特征提取
牛肉大理石紋圖像的LBP編碼是按照式(1)計(jì)算得出的。
式中,gc是中心像素點(diǎn)的灰度值,gp是鄰域像素點(diǎn)的灰度值,P是鄰域像素點(diǎn)數(shù),R是鄰域半徑。
通過(guò)對(duì)圖像進(jìn)行局部差值符號(hào)與大小的轉(zhuǎn)換(Local Difference Sign-Magnitude Transform,LDSMT)分析,可以得到中心描述子(CLBP-Center,CLBP_C)、符號(hào)描述子(CLBP-Sign,CLBP_S)和大小描述子(CLBP-Magnitude,CLBP_M)。參照局部二值模式方法,計(jì)算中心像素灰度值與鄰域像素灰度值之差:dp=gp-gc,dp又可以分解為:
dp=sp×mp,sp=sgn(dp),mp=|dp|(2)
式中,,表示dp的符號(hào),mp表示dp的大小。
CLBP_M編碼和CLBP_C編碼的計(jì)算公式分別如式(3)和式(4)所示:
式中,c是局部圖像中mp的均值。
FCLBP_CP,R=s(gc,cI),s(x,cI)=1,x≥cI0,x<cI(4)
式中,cI是局部圖像的灰度均值。
建立融合CLBP_S、CLBP_M和CLBP_C的3維聯(lián)合直方圖,記為“CLBP_S/M/C”,以此表征紋理圖像的特征。
1.2 混沌蜂群優(yōu)化KPCA
設(shè)xi(i=1,2,…,N)是牛肉大理石紋圖像的N個(gè)訓(xùn)練樣本,被函數(shù)映射到高維空間中成為(xi)。假設(shè),利用式(5)計(jì)算訓(xùn)練樣本在高維特征空間的協(xié)方差矩陣C。
那么,式(8)變?yōu)椋?/p>
)
求解式(9)可以得到特征值λk、參數(shù)向量?琢k和特征向量νk,那么任意樣本在高維特征空間的投影是:
以主成分貢獻(xiàn)率大于或等于90%為標(biāo)準(zhǔn),則綜合評(píng)價(jià)函數(shù)為:
式中,p是主成分個(gè)數(shù),是各主成分的貢獻(xiàn)率。
采用多項(xiàng)式K(x,xi)=[a(x,xi)+b]q作為核函數(shù),核參數(shù)a,b和q將直接影響KPCA特征提取和降維的效果。通常確定上述核參數(shù)大多依靠經(jīng)驗(yàn),使得KPCA特征提取和降維效果很難達(dá)到最優(yōu)。選用混沌蜂群優(yōu)化算法對(duì)核參數(shù)進(jìn)行選擇,有望使KPCA具備最優(yōu)的特征提取和降維性能。
混沌蜂群優(yōu)化KPCA具體步驟如下:
?。?)初始化食物源,種群大小ns為30,維數(shù)D為3,a∈[0,1],b∈[2,3],q∈[1,2],引領(lǐng)蜂與觀察蜂的數(shù)目為ns/2,局部搜索最大循環(huán)次數(shù)nMC為20,跳出局部極值的界限nL為3,當(dāng)前循環(huán)次數(shù)CT為1,最大循環(huán)次數(shù)CM為20。
?。?)將KPCA的綜合評(píng)價(jià)函數(shù)式(12)作為混沌蜂群算法的目標(biāo)函數(shù),引領(lǐng)蜂產(chǎn)生候選食物源,并在原食物源和候選食物源之間產(chǎn)生新的食物源。
?。?)觀察蜂依據(jù)每個(gè)食物源的選擇概率,選擇一個(gè)食物源,并執(zhí)行與該位置引領(lǐng)蜂相同的操作,進(jìn)一步局部搜索。
(4)引領(lǐng)蜂進(jìn)入偵查階段,依據(jù)nL判定食物源是否陷入局部極值,對(duì)陷入局部極值的食物源利用式(13)產(chǎn)生的Tent映射混沌序列進(jìn)行擾動(dòng),得到新的食物源。并更新陷入局部極值的食物源。
式中,i=1,2,…,k且cHi≠0.25,0.5和0.75,k是混沌序列的長(zhǎng)度大小。
?。?)若CT達(dá)到最大循環(huán)次數(shù)CM,則循環(huán)結(jié)束,輸出最優(yōu)參數(shù)a、b和q,否則CT=CT+1。
2 牛肉大理石紋圖像的等級(jí)評(píng)定
RF是以統(tǒng)計(jì)學(xué)習(xí)為理論基礎(chǔ),通過(guò)對(duì)測(cè)試樣本的重復(fù)抽樣隨機(jī)產(chǎn)生多棵決策樹(shù),再構(gòu)成森林,最后用簡(jiǎn)單的多數(shù)投票法來(lái)確定分類(lèi)的結(jié)果。RF具體包含學(xué)習(xí)和分類(lèi)2個(gè)過(guò)程[14-15]。
?。?)學(xué)習(xí)過(guò)程。設(shè)決策樹(shù)的數(shù)量是M,訓(xùn)練樣本集為T(mén)={(x1,y1),(x2,y2),…,(xi,yi),…,(xl,yl)},其中xi∈Rn,yi∈R,i=1,2,…,l,xi表示樣本特征向量,yi為樣本類(lèi)別,l為樣本數(shù)量。首先采用具備無(wú)權(quán)重、有放回特點(diǎn)的Bagging方法,利用原訓(xùn)練集生成M個(gè)有差異的子集;然后,采用CART(Classification And Regression Trees)算法進(jìn)行節(jié)點(diǎn)分裂,再利用隨機(jī)選擇輸入變量(Forest-RI)的方式實(shí)現(xiàn)隨機(jī)特征變量的選取,計(jì)算出節(jié)點(diǎn)屬性指標(biāo),分裂終止即構(gòu)建出一顆二叉決策樹(shù);最后,由所有的決策樹(shù)構(gòu)成RF。
?。?)分類(lèi)過(guò)程。將待分類(lèi)樣本集輸入到RF,用簡(jiǎn)單多數(shù)投票的方式作為RF的輸出結(jié)果,實(shí)現(xiàn)最終分類(lèi)。
綜上所述,本文方法的實(shí)現(xiàn)流程如圖1所示。
3 實(shí)驗(yàn)結(jié)果與分析
本文所使用的樣本圖像是由專業(yè)評(píng)級(jí)師將牛肉劃分為五級(jí)之后,再使用CCD相機(jī)在流水線上獲取的,共250張圖像,每級(jí)50張,其中訓(xùn)練樣本50張、待評(píng)級(jí)樣本200張。采用本文提出的基于CLBP、混沌蜂群優(yōu)化KPCA和RF的牛肉大理石紋等級(jí)評(píng)定方法進(jìn)行實(shí)驗(yàn),并將所得評(píng)級(jí)結(jié)果與參考文獻(xiàn)[7]方法、參考文獻(xiàn)[8]方法進(jìn)行了對(duì)比。實(shí)驗(yàn)是在Intel(R)Core(TM)Duo CPU T5550 1.83 GHz、4 GB RAM、MATLAB7.8環(huán)境中進(jìn)行的。圖2為我國(guó)NY/T676-2010牛肉大理石紋圖譜實(shí)例,為該等級(jí)的最低標(biāo)準(zhǔn);圖3為背最長(zhǎng)肌最大內(nèi)接矩形區(qū)域的灰度圖像,用以牛肉大理石紋圖像的CLBP特征提取和混沌蜂群優(yōu)化的KPCA降維。
采用CLBP提取50張訓(xùn)練樣本牛肉大理石紋圖像特征參數(shù),用于混沌蜂群的KPCA參數(shù)優(yōu)化訓(xùn)練,經(jīng)過(guò)多次實(shí)驗(yàn),結(jié)果表明降維后前4維主成分的累積貢獻(xiàn)率已達(dá)到98.05%,因此選用降維后的前4維主成分組成特征向量就可以有效體現(xiàn)原始的特征向量,同時(shí)也達(dá)到了預(yù)期的降維目的。表1列舉說(shuō)明了經(jīng)混沌蜂群優(yōu)化的KPCA降維后,前4維主成分的單獨(dú)貢獻(xiàn)率和累積貢獻(xiàn)率。
表2給出了利用本文所涉及的3種方法得到的牛肉大理石紋圖像待評(píng)級(jí)樣本單級(jí)識(shí)別率和總體識(shí)別率??梢钥闯觯c參考文獻(xiàn)[7]方法和參考文獻(xiàn)[8]方法相比,本文方法得到的單級(jí)識(shí)別率和總體識(shí)別率均更高。參考文獻(xiàn)[7]方法中構(gòu)造多元多項(xiàng)式模型的三個(gè)特征變量是:基于計(jì)盒維數(shù)、脂肪面積比率、脂肪顆??倲?shù),這三個(gè)特征變量主要反映的是牛肉大理石紋圖像中脂肪和肌肉數(shù)量上的統(tǒng)計(jì)信息,并不能夠完整地反映出由肌內(nèi)脂肪顆粒的分布情況所呈現(xiàn)的紋理信息;加之,多元線性回歸模型屬于線性估計(jì)解決方法,它容易因受到樣本特征空間數(shù)據(jù)間的相互作用影響,出現(xiàn)對(duì)稱效應(yīng)、叢聚效應(yīng)和屏蔽效應(yīng),因此,由構(gòu)造成的多元線性回歸模型所獲得的牛肉大理石紋圖像單級(jí)識(shí)別率和總體識(shí)別率還不夠高。參考文獻(xiàn)[8]方法中通過(guò)計(jì)算牛肉大理石紋圖像的灰度共生矩陣統(tǒng)計(jì)量作為特征值,能夠較好地反映圖像的紋理特征,但由于選用的特征量數(shù)量有限,還不能夠反映出牛肉大理石紋圖像中所有的紋理信息;另外,所用的分類(lèi)器是BP神經(jīng)網(wǎng)絡(luò)分類(lèi)器,它的構(gòu)造原則是依據(jù)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化,對(duì)樣本數(shù)量的依賴程度高,容易出現(xiàn)過(guò)學(xué)習(xí)現(xiàn)象,同時(shí)還存在易陷入局部最優(yōu)問(wèn)題,最后所得的牛肉大理石紋圖像單級(jí)識(shí)別率和總體識(shí)別率還不太高。本文方法中,采用CLBP計(jì)算牛肉大理石紋圖像的特征參數(shù),利用混沌蜂群優(yōu)化的KPCA對(duì)特征參數(shù)進(jìn)行降維,最終用前4維主成分表征牛肉大理石紋圖像,可以避免不能完全反映圖像紋理信息的問(wèn)題;結(jié)合RF進(jìn)行分類(lèi)識(shí)別,可以有效地提高分類(lèi)精度和穩(wěn)定性。實(shí)驗(yàn)結(jié)果表明,本文方法所得單級(jí)識(shí)別率和總體識(shí)別率均最高,是一種行之有效的牛肉大理石紋評(píng)級(jí)方法。
4 結(jié)論
本文提出基于CLBP、混沌蜂群優(yōu)化KPCA和RF的牛肉大理石紋等級(jí)評(píng)定方法。首先采用CLBP編碼方式來(lái)提取表征牛肉大理石紋圖像的特征參數(shù);然后,利用混沌蜂群優(yōu)化的KPCA方法對(duì)表征牛肉大理石紋圖像的參數(shù)進(jìn)行降維,降低冗余度,選取累積貢獻(xiàn)率達(dá)到 98.05%的前4維主成分構(gòu)造特征向量;最后,使用RF完成分類(lèi)識(shí)別。通過(guò)大量的實(shí)驗(yàn),結(jié)果表明評(píng)級(jí)正確率分別達(dá)到100%(一級(jí))、95%(二級(jí))、95%(三級(jí))、 97.5%(四級(jí))、100%(五級(jí))。相比文獻(xiàn)[7]方法、文獻(xiàn)[8]方法,采用本文方法所得的評(píng)級(jí)正確率最高,可有助于提高牛肉大理石紋評(píng)級(jí)的準(zhǔn)確率和速度。
參考文獻(xiàn)
[1] 湯曉艷,王敏,錢(qián)永忠,等.牛肉分級(jí)標(biāo)準(zhǔn)及分級(jí)技術(shù)發(fā)展概況綜述[J].食品科學(xué),2011,32(19):288-293.
[2] 周彤,彭彥昆.牛肉大理石花紋圖像特征信息提取及自動(dòng)分級(jí)方法[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(15):286-293.
[3] 陳坤杰,姬長(zhǎng)英.牛肉自動(dòng)分級(jí)技術(shù)研究進(jìn)展分析[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2006,37(3):153-156.
[4] TAN J. Meat quality evaluation by computer vision[J]. Journal of Food Engineering, 2004, 61(1): 27-35.
[5] FUKUDA O, NABEOKA N, MIYAJIMA T. Estimation of marbling score in live cattle based on ICA and a neural network[C]. IEEE 2013 International Conference on Systems Man and Cybernetics, Manchester, 2013: 1622-1627.
[6] 陳坤杰,姬長(zhǎng)英.基于圖像運(yùn)算的牛肉大理石花紋分割方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2007,38(5):195-196.
[7] 陳坤杰,吳貴茹,於海明,等.基于分形維和圖像特征的牛肉大理石花紋等級(jí)判定模型[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2012,43(5):147-151.
[8] 謝元澄,徐煥良,謝莊.基于牛肉大理石花紋標(biāo)準(zhǔn)(BMS)圖像的紋理特征分析[J].中國(guó)農(nóng)業(yè)科學(xué),2010,43(24):5121-5128.
[9] 張建勛,李濤,孫權(quán),等.豬眼肌B超圖像紋理特征提取與分類(lèi)[J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué)版,2013(2):74-78.
[10] Guo Zhenhua, Zhang Lei, ZHANG D. A completed modeling of local binary pattern operator for texture classification[J]. IEEE Transactions on Image Processing, 2010,19(6):1657-1663.
[11] Zhang Yi, Han Jing, Yue Jiang, et al. Weighted KPCA degree of homogeneity amended non-classical receptive field inhibition model for salient contour extraction in low-light-level image[J]. IEEE Transactions on Image Processing, 2014,23(6): 2732-2743.
[12] CHOI J H, SONG G Y, LEE J W. Road identification in monocular color images using random forest and color correlogram[J]. International Journal of Automotive Technology, 2012,13(6):941-948.
[13] 楊帆,林琛,周綺鳳,等.基于隨機(jī)森林的潛在k近鄰算法及其在基因表達(dá)數(shù)據(jù)分類(lèi)中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2012,32(4):815-825.
[14] 陳超,李文藻.一種基于隨機(jī)森林與顏色特征的巖屑識(shí)別算法[J].四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,49(3):587-592.
[15] 曹正鳳.隨機(jī)森林算法優(yōu)化研究[D].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué),2014.