文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.174111
中文引用格式: 朱菲,金煒東. 一種SVM-DS決策融合方法及在高鐵故障中的應用[J].電子技術應用,2018,44(7):127-130,134.
英文引用格式: Zhu Fei,Jing Weidong. A decision fusion method of SVM-DS and its application in high-speed rail fault[J]. Application of Electronic Technique,2018,44(7):127-130,134.
0 引言
DS證據(jù)理論因具有很強的處理不確定信息的能力,近年來在信息融合領域得到廣泛應用。然而,如何構造DS證據(jù)理論中的基本概率賦值函數(shù)(Basic Probability Assignment,BPA),一直是信息融合中的一大難題。對此,許多學者都做出了研究[1-8]。ZHU Y M等[1]利用模糊-均值聚類實現(xiàn)了BPA的獲??;蔣雯等[2]基于樣本差異度的方法構造初始BPA函數(shù);FLOREA M C等[3]基于隸屬度生成BPA;周皓等[4]將SVM通過Platt的概率模型來確定BPA;Ai Lingmei 等[5]通過神經(jīng)網(wǎng)絡的輸出來構造BPA。
支持向量機(Support Vector Machine,SVM)是目前廣泛應用的一種智能診斷分類器,該模型建立在統(tǒng)計學習理論和結構風險最小化原理上,不僅能夠克服“維數(shù)災難”、“過擬合”以及其他傳統(tǒng)學習算法不可避免的問題,還在小樣本學習問題上表現(xiàn)出較大優(yōu)勢。但SVM輸出的是測試樣本的類別標簽,為硬輸出,進行多個SVM輸出映射時主要采用的是投票法,這很大程度上限制了SVM在信息融合領域中的應用。很多學者已經(jīng)展開了對于SVM概率輸出問題的研究[9-12]。其中,由PLATT J C[9]提出的計算后驗概率的方法得到普遍的應用。
本文提出一種SVM-DS決策融合方法,結合了DS與SVM的優(yōu)點,同時解決了兩者在實際應用中的一些局限性問題。通過Platt的概率模型分別將RBF核函數(shù)SVM分類器(SVM-RBF)、線性核函數(shù)SVM分類器(SVM-Linear)和多項式核函數(shù)SVM分類器(SVM-Quadratic)的硬輸出轉化為相應的后驗概率;利用混淆矩陣來計算分類器的局部可信度;根據(jù)SVM后驗概率以及分類器局部可信度,建立BPA函數(shù),解決了DS理論在決策融合中BPA難以確定的問題。通過在UCI標準數(shù)據(jù)集、高速鐵路轉向架故障數(shù)據(jù)上的實驗,也證明了本文決策融合方法能獲得比單一分類器更高的分類準確率,且有效提高了方法穩(wěn)定性。
1 DS證據(jù)理論
2 SVM介紹
2.1 SVM基本概念
2.2 SVM后驗概率輸出
PLATT J C[9]利用sigmoid函數(shù),將SVM的硬輸出映射到概率區(qū)間[0,1],計算后驗概率的模型為:
3 基于混淆矩陣的可信度計算
在實際問題中,不同分類器對同一類別數(shù)據(jù)的識別能力是不一樣的。將多個分類器的輸出直接融合,沒有考慮到分類器的可信度,這樣可能會得到偏離實際的決策結果。因此,本文用混淆矩陣對分類器的局部可信度進行描述,并將得到的局部可信度作為DS融合時的折扣因子。
假設待分類任務包含k個類別,數(shù)據(jù)集X中的樣本數(shù)為M,每個模式類別中有Mi個樣本(i=1,2,…,k)。利用分類器L對數(shù)據(jù)集分類后可以得到混淆矩陣Cl表示如下:
4 SVM與DS的融合分類方法
(1)將訓練樣本分別通過SVM-RBF分類器、SVM- Linear分類器和SVM-Quadratic分類器進行訓練,將各分類器的硬輸出轉化為軟輸出。
(2)獲得各分類器的混淆矩陣,計算出各分類器的局部可信度。
(3)將獲得的分類器局部可信度作為融合時的折扣因子。當分類器對某一樣本x判決為wi時,該分類器輸出的結果可信度為PC(wi),后驗概率為Pi,則按式(11)進行加權處理:
(4)由式(11)獲得DS決策融合時的BPA,通過DS融合得到最終決策結果。SVM-DS決策融合模型如圖1所示。
5 實驗結果及分析
5.1 高鐵轉向架故障數(shù)據(jù)實驗
本文研究的高速列車轉向架監(jiān)測數(shù)據(jù)由實測得到。在速度為200 m/s的高速列車上共計安裝了22個傳感器,由此22個傳感器對應輸出的58個通道數(shù)據(jù)作為本文的實驗數(shù)據(jù)。高速列車轉向架單故障包含3種工況,分別為正常、橫向減振器失效和抗蛇行減振器失效。
5.1.1 橫向減振器單故障數(shù)據(jù)實驗
橫向減振器失效包含4種不同故障類型,每種故障類型樣本數(shù)均為140組。實驗隨機采用一半樣本進行訓練,另一半的樣本用作測試。
對高速列車橫向減振器單故障的實測數(shù)據(jù)分別提取均值、方差、裕度指標等統(tǒng)計特征組成27維的特征集,特征分布情況見圖2。
將特征集輸入不同核函數(shù)的SVM分類器得到混淆矩陣分別如下,其中CM1、CM2、CM3分別表示SVM- Linear、SVM-Quadratic和SVM-RBF分類器輸出的混淆矩陣。
根據(jù)得到的混淆矩陣,由式(10)計算各分類器的局部可信度見表1。
按式(11)將局部可信度折扣到后驗概率,再以DS理論融合后得到的分類混淆矩陣如下:
對橫向減振器單故障的測試樣本最后的分類情況見表2。
單一分類器中,SVM-Linear表現(xiàn)最好,SVM-Linear的標準差僅為0.008 6,穩(wěn)定性明顯高于其他兩個單一分類器,其準確率為96.8%,略大于SVM-RBF分類器,比SVM-Quadratic高出2.09%。
本文SVM-DS決策方法得到的準確率為97.41%,比單一分類器中表現(xiàn)最好的SVM-Linear分類器提高了0.61%。SVM-DS方法的標準差為0.005 5,穩(wěn)定性遠高于SVM-Quadratic和SVM-RBF分類器,比單一分類器中表現(xiàn)最好的SVM-Linear分類器的標準差降低了0.003 1,有效地提升了方法的穩(wěn)定性。
5.1.2 抗蛇行減振器單故障數(shù)據(jù)實驗
抗蛇行減振器失效包含5種不同故障類型,樣本數(shù)為150組。實驗中隨機采用一半的樣本進行訓練,另一半的樣本用作測試。
由于抗蛇行單故障中各故障類型之間相似度較大,因而各分類器得到的分類準確率都不太高。由表3知,在單一分類器中,SVM-RBF分類準確率為84.28%,高于其他兩個分類器。SVM-Quadratic與SVM- Linear分類器分類準確率相差不大。就穩(wěn)定性而已,表現(xiàn)最好的是SVM-Linear分類器。本文提出的SVM-DS決策融合方法準確率為86.14%,比單一分類器中表現(xiàn)最好的SVM-RBF提高了1.86%。SVM-DS方法標準差為0.016 1,比SVM-Linear降低了0.005 3,比SVM-Quadratic降低了0.011 5。可見在抗蛇行單故障中,SVM-DS決策融合方法的穩(wěn)定性遠高于各單一分類器。
對比兩種工況的分類結果可以看出,在橫向減振器單故障實驗中,表現(xiàn)最好的是SVM-Linear,在抗蛇行單故障實驗中分類準確率最好的是SVM-RBF,穩(wěn)定性最好的是SVM-Linear。這說明,分類器對不同故障數(shù)據(jù)的分類能力是不一樣的,單一分類器幾乎無法做到對各種工況的故障數(shù)據(jù)都表現(xiàn)良好,這也是本文要采用多分類器聯(lián)合的決策融合方法的原因。高鐵轉向架單故障數(shù)據(jù)實驗驗證了本文SVM-DS決策融合方法的有效性,該方法實現(xiàn)了故障分類的優(yōu)化,穩(wěn)定地提升了故障識別率。
5.2 UCI標準數(shù)據(jù)集驗證
為了充分驗證SVM-DS決策融合方法的有效性,本文使用表4所示UCI數(shù)據(jù)集進行實驗分析。
限于篇幅,特征分布圖以Iris數(shù)據(jù)集的特征集為例。圖3是Iris標準數(shù)據(jù)集是特征集歸一化后的特征分布圖。
在Wine和Iris數(shù)據(jù)集上,單一分類器表現(xiàn)最好的都是SVM-Linear分類器。在Breast-w數(shù)據(jù)集上,不同核函數(shù)SVM分類器分類效果差異不大。但SVM-DS方法在3種數(shù)據(jù)集上的準確率都高于各單一分類器,穩(wěn)定性也是最好的。這驗證了SVM-DS方法在UCI標準數(shù)據(jù)集上提高分類準確率的同時,也提高了方法的穩(wěn)定性。
6 結束語
本文提出一種基于SVM與DS相結合的決策融合方法。該方法根據(jù)SVM的實際分類結果,從中獲取分類標簽、后驗概率和混淆矩陣等信息。用混淆矩陣來衡量分類器性能,計算局部可信度,再結合SVM分類器后驗概率來構造BPA,使獲得的基本概率賦值函數(shù)更加可靠和符合實際,從而有效解決了證據(jù)理論應用中的一大難題。從實驗結果可以看出,與單一分類器的分類結果相比,結合3種不同SVM分類器的SVM-DS決策融合方法能夠穩(wěn)定地提高分類準確率。
參考文獻
[1] ZHU Y M,BENTABET L,DUPUIS O,et al.Automatic determination of mass functions in Dempster-Shafer theory using fuzzy c-means and spatial neighborhood information for image segmentation[J].Optical Engineering,2002,41(4):760-770.
[2] 蔣雯,陳運東,湯潮,等.基于樣本差異度的基本概率指派生成方法[J].控制與決策,2015,30(1):71-75.
[3] FLOREA M C,JOUSSELME A L,GRENIER D,et al.Approximation techniques for the transformation of fuzzy sets into random sets[J].Fuzzy Sets and Systems,2008,159(3):270-288.
[4] 周皓,李少洪.支持向量機與證據(jù)理論在信息融合中的結合[J].傳感器技術學報,2008,21(9):1566-1570.
[5] Ai Lingmei,Wang Jue,Wang Xuelian.Multi-features fusion diagnosis of tremor based on artificial neural network and D-S evidence theory[J].Signal Processing,2008,88(12):2927-2935.
[6] Han Deqiang,Deng Yong,Han Chongzhao.Novel approaches for the transformation of fuzzy membership function into basic probability assignment based on uncertain optimization[J].International Journal of Uncertainty Fuzziness and Knowledge-Based Systems,2013,21(2):289-322.
[7] 韓德強,楊藝,韓崇昭.DS證據(jù)理論研究進展及相關問題探討[J].控制與決策,2014,29(1):1-11.
[8] SUH D,YOOK J.A method to determine basic probability assignment in context awareness of a moving object[J].International Journal of Distributed Sensor Networks,2013(2):167-174.
[9] PLATT J C.Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods[J].Advances in Large Margain Classifiers,2000,10(4):61-74.
[10] 王磊.支持向量機學習算法的若干問題研究[D].長沙:國防科學技術大學研究生院,2009.
[11] CHANG C C,LIN C J. LIBSVM:a library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology(TIST),2011,2(3):1-27.
[12] 雷蕾,王曉丹,邢雅瓊,等.結合SVM和DS證據(jù)理論的多極化HRRP分類研究[J].控制與決策,2013(6):861-866.
[13] 張靜,宋銳,郁文賢,等.基于混淆矩陣和Fisher準則構造層次化分類器[J].軟件學報,2005,16(9):1560-1567.
[14] 袁憲鋒,宋沐民,周風余,等.多PCA模型及SVM-DS融合決策的服務機器人故障診斷[J].振動、測試與診斷,2015,35(3):434-440.
作者信息:
朱 菲,金煒東
(西南交通大學 電氣工程學院,四川 成都610031)