摘 要: 針對小樣本、多類煤礦頂板的狀態(tài)檢測問題,提出了基于支持向量機集成的算法。采用深度優(yōu)先搜索對支持向量機集成參數(shù)進行優(yōu)化,并結(jié)合煤礦頂板敲擊聲信號的人耳聽覺功率譜特征,對煤礦頂板中浮石、剝層等現(xiàn)象進行分類識別。實驗表明,該算法能夠?qū)Χ囝愴敯鍫顟B(tài)進行有效分類,且識別率較高,能夠作為安全開采的保障手段。
關(guān)鍵詞: 支持向量機集成;人耳聽覺功率譜;頂板狀態(tài)檢測;深度優(yōu)先搜索
我國是一個煤炭大國,煤炭資源豐富,且煤炭消費量逐年增加。為保證國民經(jīng)濟的持續(xù)健康發(fā)展,需要有計劃地大規(guī)模開采煤炭資源。然而,我國在煤炭開采中的安全事故經(jīng)常發(fā)生。其中,冒頂事故是最常見的安全事故之一,給國家和人民帶來了巨大的損失。而要避免和減少冒頂事故的發(fā)生,關(guān)鍵就是要對頂板的安全性能進行及時、有效地檢測,以便工程技術(shù)人員及時排除安全隱患。
敲幫問頂(wall tapping and roof sounding)是依靠人耳極其靈敏的聽覺系統(tǒng)和長期的實踐經(jīng)驗來判斷頂板的安全穩(wěn)定性的,是目前被廣泛沿用的對頂板進行安全檢測的重要途徑。但這種方法對工人自身技能要求較高,且對工人的人身安全有一定的安全隱患。因此,研究新的檢測技術(shù)就顯得非常迫切。其中,基于模式識別的檢測是目前研究的重要方向之一。在應(yīng)用現(xiàn)代模式識別技術(shù)對頂板進行狀態(tài)監(jiān)測和故障診斷中,功率特征提取和分類器模型設(shè)計是兩個至關(guān)重要的因素。本文采用基于聽覺模型和支持向量機集成算法。基于聽覺模型的聲信號特征提取、分類、識別的研究,近年來得到了國內(nèi)外學(xué)者的高度重視,特別在語音信號處理方面。但是針對煤礦頂板敲擊聲音信號方面重視較少。支持向量機SVM(Support Vector Machines)是Vapnik等人根據(jù)統(tǒng)計學(xué)習(xí)理論中結(jié)構(gòu)風(fēng)險最小化原則提出的。而支持向量機集成SVME(Support Vector Machine Ensemble)可以提高支持向量機的分類性能[1-2]。
本文正是基于以上原因,針對小樣本、多類煤礦頂板,提出了基于支持向量機集成算法對煤礦頂板安全性能進行檢測的方法。
1 人耳聽覺功率譜特征提取
人們通過對生理聲學(xué)、心理聲學(xué)和信號處理的研究和分析[3-4],建立了人耳聽覺模型,并且利用此模型來對聲音信號進行聽覺譜特征提取。該聽覺譜特征[5]提取過程如圖1所示。
通過對模仿人的聽覺感知機理進行分析,聽覺譜特征提取算法主要有三個方面的處理:(1)臨界頻帶段分析處理;(2)等響度級預(yù)處理;(3)等響度轉(zhuǎn)換。利用臨界頻帶分析,計算模型考慮了耳蝸的分頻特性,由此可以反映人耳的掩蔽效應(yīng)。
在循環(huán)體中,首先從給出的訓(xùn)練樣本集X中按照一定的概率抽取樣本并獲得新的訓(xùn)練樣本Xt;然后,依據(jù)新獲得的訓(xùn)練樣本Xt來優(yōu)化選擇個體SVMC核函數(shù)參數(shù),并訓(xùn)練SVM以獲得分類超平面ft(Xt);再次,計算出該分類超平面的加權(quán)分類錯誤率;最后,做出一個判斷:即判斷計算出的加權(quán)分類錯誤率是否≥0.5或=1。如果條件成立,則結(jié)束該循環(huán),并運用加權(quán)多數(shù)投票法集成個體SVMC;反之,則改變加權(quán)系數(shù),進行下一輪循環(huán),直至條件成立,退出循環(huán)。
要想獲得一個高性能和高精度的支持向量機集成模型,就必需要對優(yōu)化不敏感損失函數(shù)ε、懲罰系數(shù)c和核參數(shù)γ等參數(shù)進行優(yōu)化處理,而這些參數(shù)之間相互影響。實際上,選擇過程是一個優(yōu)化搜索的過程,由于深度優(yōu)先算法具有全局搜索性能力強、并行性和啟發(fā)式等優(yōu)點,所以本文采用深度優(yōu)先算法對SVMC參數(shù)進行尋優(yōu)。深度優(yōu)先算法[6]是一種基于圖論的優(yōu)化算法,其基本思想:為了求得問題的解,先選擇某一種可能情況向前(子結(jié)點)探索,在探索過程中,一旦發(fā)現(xiàn)原來的選擇不符合要求,則回溯至父親結(jié)點重新選擇另一結(jié)點,繼續(xù)向前探索。如此反復(fù)進行,直至求得最優(yōu)解。深度優(yōu)先搜索的實現(xiàn)方式可以采用遞歸或者棧來實現(xiàn)。
采用深度優(yōu)先搜索對SVMC參數(shù)c、γ和ε進行優(yōu)化的具體步驟如下:
(1)對SVMC中的參數(shù)c、γ和ε進行初始范圍的確定,按照步長對參數(shù)c、γ和ε進行等量劃分,以此獲得離散數(shù)組。
?。?)首先利用LIBSVM軟件采用交叉驗證方法對參數(shù)c、γ和ε進行建立模型和預(yù)測;然后對每組均方根誤差進行比較;最后選擇最小的均方根誤差所對應(yīng)的參數(shù)為本次的SVMC最佳參數(shù)組合。
?。?)將本次最優(yōu)參數(shù)和上一次最優(yōu)參數(shù)的均方根誤差進行比較,如果均方根誤差小于上一次均方根誤差,則跳轉(zhuǎn)到步驟(4),否則跳轉(zhuǎn)到步驟(5)。
?。?)根據(jù)上一次的最優(yōu)參數(shù),并且采用啟發(fā)式方式在該參數(shù)附近進行參數(shù)范圍修改,從而加快參數(shù)搜索速度;然后跳轉(zhuǎn)到步驟(1),重新進行遞歸運算。
(5)參數(shù)優(yōu)化結(jié)束后,退出運算,取此時的參數(shù)c、γ和ε為SVMC的最優(yōu)參數(shù)。
深度優(yōu)先搜索參數(shù)優(yōu)化流程圖如圖3所示。
3 實驗及結(jié)果
3.1 實驗數(shù)據(jù)集
本文實驗數(shù)據(jù)是從我國東北某大型煤礦井下頂板上采集的,共有4類目標(biāo):一類是安全頂板,另3類是3種危險頂板(浮石、剝層和斷裂)。信號的采樣頻率是20 000 Hz,每個樣本長度為4 096個點。安全頂板、浮石頂板、剝層頂板和斷裂頂板的樣本數(shù)目分別為2 000、200、500、150。由于受到實驗數(shù)據(jù)采樣頻率(20 000 Hz)的限制,本文只在20~10 000 Hz頻率范圍內(nèi)(即前22個臨界頻帶內(nèi))提取了4類頂板的敲擊聲信號的聽覺譜特征。
3.2 實驗
在分類實驗中,訓(xùn)練樣本數(shù)目和測試樣本數(shù)目的比值是1﹕4,提取樣本的聽覺譜特征后,分別用SVME算法和單個SVMC對4類目標(biāo)進行頂板狀態(tài)診斷實驗。為了避免樣本選取的隨機性對實驗結(jié)果帶來的誤差,實驗分別進行了20次,最終結(jié)果為20次實驗結(jié)果的平均值。檢測結(jié)果如表1所示。
從表1可以看出,支持向量機集成算法可以有效識別安全頂板和危險頂板,并進行狀態(tài)診斷,而且其識別4類目標(biāo)的正確識別率都比單個SVMC要高。特別是本文所提出的算法對危險頂板的正確識別率比單個SVMC提高了2.57%~3.22%。實驗結(jié)果證明,本文提出的支持向量機集成(SVME)算法是有效的,可以應(yīng)用于煤礦頂板狀態(tài)識別和故障診斷中。
本文提出了支持向量機集成(SVME)算法,采用了深度優(yōu)先搜索對支持向量機集成參數(shù)進行優(yōu)化,并結(jié)合敲擊聲信號的人耳聽覺譜特征用于頂板狀態(tài)的分類識別。實驗證明,本文所提出的SVME算法識別率較高,可以滿足現(xiàn)場檢測的要求,為煤礦頂板狀態(tài)診斷提供了新的方法。
參考文獻
[1] VAPNIK V. The nature of statistical learning theory[M]. New York: Springer-Verlag, 1999.
[2] 楊宏暉,孫進才.基于支持向量機集成的水下目標(biāo)自動識別系統(tǒng)[J].測控技術(shù), 2006, 25(12).
[3] ZWICKER E, FASTL H. Psychoacoustics facts and models [M]. NewYork: Springer-Verlag,1999.
[4] HERMANSK H. Perceptual linear predictive(PLP) analysisof speech[J]. Journal of the Acoustical Society ofAmeri-ca, 1990, 87(4): 1738-1751.
[5] 楊宏暉,侯宏,曾向陽.基于聲信號人耳聽覺譜特征的風(fēng)機故障診斷[J].儀器儀表學(xué)報,2009,30(1).
[6] 李立紅,許元飛.深度優(yōu)先搜索的支持向量機參數(shù)優(yōu)化算法[J].計算機仿真,2011,28(7):216-219.