文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.174111
中文引用格式: 朱菲,金煒東. 一種SVM-DS決策融合方法及在高鐵故障中的應(yīng)用[J].電子技術(shù)應(yīng)用,2018,44(7):127-130,134.
英文引用格式: Zhu Fei,Jing Weidong. A decision fusion method of SVM-DS and its application in high-speed rail fault[J]. Application of Electronic Technique,2018,44(7):127-130,134.
0 引言
DS證據(jù)理論因具有很強(qiáng)的處理不確定信息的能力,近年來(lái)在信息融合領(lǐng)域得到廣泛應(yīng)用。然而,如何構(gòu)造DS證據(jù)理論中的基本概率賦值函數(shù)(Basic Probability Assignment,BPA),一直是信息融合中的一大難題。對(duì)此,許多學(xué)者都做出了研究[1-8]。ZHU Y M等[1]利用模糊-均值聚類(lèi)實(shí)現(xiàn)了BPA的獲取;蔣雯等[2]基于樣本差異度的方法構(gòu)造初始BPA函數(shù);FLOREA M C等[3]基于隸屬度生成BPA;周皓等[4]將SVM通過(guò)Platt的概率模型來(lái)確定BPA;Ai Lingmei 等[5]通過(guò)神經(jīng)網(wǎng)絡(luò)的輸出來(lái)構(gòu)造BPA。
支持向量機(jī)(Support Vector Machine,SVM)是目前廣泛應(yīng)用的一種智能診斷分類(lèi)器,該模型建立在統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理上,不僅能夠克服“維數(shù)災(zāi)難”、“過(guò)擬合”以及其他傳統(tǒng)學(xué)習(xí)算法不可避免的問(wèn)題,還在小樣本學(xué)習(xí)問(wèn)題上表現(xiàn)出較大優(yōu)勢(shì)。但SVM輸出的是測(cè)試樣本的類(lèi)別標(biāo)簽,為硬輸出,進(jìn)行多個(gè)SVM輸出映射時(shí)主要采用的是投票法,這很大程度上限制了SVM在信息融合領(lǐng)域中的應(yīng)用。很多學(xué)者已經(jīng)展開(kāi)了對(duì)于SVM概率輸出問(wèn)題的研究[9-12]。其中,由PLATT J C[9]提出的計(jì)算后驗(yàn)概率的方法得到普遍的應(yīng)用。
本文提出一種SVM-DS決策融合方法,結(jié)合了DS與SVM的優(yōu)點(diǎn),同時(shí)解決了兩者在實(shí)際應(yīng)用中的一些局限性問(wèn)題。通過(guò)Platt的概率模型分別將RBF核函數(shù)SVM分類(lèi)器(SVM-RBF)、線(xiàn)性核函數(shù)SVM分類(lèi)器(SVM-Linear)和多項(xiàng)式核函數(shù)SVM分類(lèi)器(SVM-Quadratic)的硬輸出轉(zhuǎn)化為相應(yīng)的后驗(yàn)概率;利用混淆矩陣來(lái)計(jì)算分類(lèi)器的局部可信度;根據(jù)SVM后驗(yàn)概率以及分類(lèi)器局部可信度,建立BPA函數(shù),解決了DS理論在決策融合中BPA難以確定的問(wèn)題。通過(guò)在UCI標(biāo)準(zhǔn)數(shù)據(jù)集、高速鐵路轉(zhuǎn)向架故障數(shù)據(jù)上的實(shí)驗(yàn),也證明了本文決策融合方法能獲得比單一分類(lèi)器更高的分類(lèi)準(zhǔn)確率,且有效提高了方法穩(wěn)定性。
1 DS證據(jù)理論
2 SVM介紹
2.1 SVM基本概念
2.2 SVM后驗(yàn)概率輸出
PLATT J C[9]利用sigmoid函數(shù),將SVM的硬輸出映射到概率區(qū)間[0,1],計(jì)算后驗(yàn)概率的模型為:
3 基于混淆矩陣的可信度計(jì)算
在實(shí)際問(wèn)題中,不同分類(lèi)器對(duì)同一類(lèi)別數(shù)據(jù)的識(shí)別能力是不一樣的。將多個(gè)分類(lèi)器的輸出直接融合,沒(méi)有考慮到分類(lèi)器的可信度,這樣可能會(huì)得到偏離實(shí)際的決策結(jié)果。因此,本文用混淆矩陣對(duì)分類(lèi)器的局部可信度進(jìn)行描述,并將得到的局部可信度作為DS融合時(shí)的折扣因子。
假設(shè)待分類(lèi)任務(wù)包含k個(gè)類(lèi)別,數(shù)據(jù)集X中的樣本數(shù)為M,每個(gè)模式類(lèi)別中有Mi個(gè)樣本(i=1,2,…,k)。利用分類(lèi)器L對(duì)數(shù)據(jù)集分類(lèi)后可以得到混淆矩陣Cl表示如下:
4 SVM與DS的融合分類(lèi)方法
(1)將訓(xùn)練樣本分別通過(guò)SVM-RBF分類(lèi)器、SVM- Linear分類(lèi)器和SVM-Quadratic分類(lèi)器進(jìn)行訓(xùn)練,將各分類(lèi)器的硬輸出轉(zhuǎn)化為軟輸出。
(2)獲得各分類(lèi)器的混淆矩陣,計(jì)算出各分類(lèi)器的局部可信度。
(3)將獲得的分類(lèi)器局部可信度作為融合時(shí)的折扣因子。當(dāng)分類(lèi)器對(duì)某一樣本x判決為wi時(shí),該分類(lèi)器輸出的結(jié)果可信度為PC(wi),后驗(yàn)概率為Pi,則按式(11)進(jìn)行加權(quán)處理:
(4)由式(11)獲得DS決策融合時(shí)的BPA,通過(guò)DS融合得到最終決策結(jié)果。SVM-DS決策融合模型如圖1所示。
5 實(shí)驗(yàn)結(jié)果及分析
5.1 高鐵轉(zhuǎn)向架故障數(shù)據(jù)實(shí)驗(yàn)
本文研究的高速列車(chē)轉(zhuǎn)向架監(jiān)測(cè)數(shù)據(jù)由實(shí)測(cè)得到。在速度為200 m/s的高速列車(chē)上共計(jì)安裝了22個(gè)傳感器,由此22個(gè)傳感器對(duì)應(yīng)輸出的58個(gè)通道數(shù)據(jù)作為本文的實(shí)驗(yàn)數(shù)據(jù)。高速列車(chē)轉(zhuǎn)向架單故障包含3種工況,分別為正常、橫向減振器失效和抗蛇行減振器失效。
5.1.1 橫向減振器單故障數(shù)據(jù)實(shí)驗(yàn)
橫向減振器失效包含4種不同故障類(lèi)型,每種故障類(lèi)型樣本數(shù)均為140組。實(shí)驗(yàn)隨機(jī)采用一半樣本進(jìn)行訓(xùn)練,另一半的樣本用作測(cè)試。
對(duì)高速列車(chē)橫向減振器單故障的實(shí)測(cè)數(shù)據(jù)分別提取均值、方差、裕度指標(biāo)等統(tǒng)計(jì)特征組成27維的特征集,特征分布情況見(jiàn)圖2。
將特征集輸入不同核函數(shù)的SVM分類(lèi)器得到混淆矩陣分別如下,其中CM1、CM2、CM3分別表示SVM- Linear、SVM-Quadratic和SVM-RBF分類(lèi)器輸出的混淆矩陣。
根據(jù)得到的混淆矩陣,由式(10)計(jì)算各分類(lèi)器的局部可信度見(jiàn)表1。
按式(11)將局部可信度折扣到后驗(yàn)概率,再以DS理論融合后得到的分類(lèi)混淆矩陣如下:
對(duì)橫向減振器單故障的測(cè)試樣本最后的分類(lèi)情況見(jiàn)表2。
單一分類(lèi)器中,SVM-Linear表現(xiàn)最好,SVM-Linear的標(biāo)準(zhǔn)差僅為0.008 6,穩(wěn)定性明顯高于其他兩個(gè)單一分類(lèi)器,其準(zhǔn)確率為96.8%,略大于SVM-RBF分類(lèi)器,比SVM-Quadratic高出2.09%。
本文SVM-DS決策方法得到的準(zhǔn)確率為97.41%,比單一分類(lèi)器中表現(xiàn)最好的SVM-Linear分類(lèi)器提高了0.61%。SVM-DS方法的標(biāo)準(zhǔn)差為0.005 5,穩(wěn)定性遠(yuǎn)高于SVM-Quadratic和SVM-RBF分類(lèi)器,比單一分類(lèi)器中表現(xiàn)最好的SVM-Linear分類(lèi)器的標(biāo)準(zhǔn)差降低了0.003 1,有效地提升了方法的穩(wěn)定性。
5.1.2 抗蛇行減振器單故障數(shù)據(jù)實(shí)驗(yàn)
抗蛇行減振器失效包含5種不同故障類(lèi)型,樣本數(shù)為150組。實(shí)驗(yàn)中隨機(jī)采用一半的樣本進(jìn)行訓(xùn)練,另一半的樣本用作測(cè)試。
由于抗蛇行單故障中各故障類(lèi)型之間相似度較大,因而各分類(lèi)器得到的分類(lèi)準(zhǔn)確率都不太高。由表3知,在單一分類(lèi)器中,SVM-RBF分類(lèi)準(zhǔn)確率為84.28%,高于其他兩個(gè)分類(lèi)器。SVM-Quadratic與SVM- Linear分類(lèi)器分類(lèi)準(zhǔn)確率相差不大。就穩(wěn)定性而已,表現(xiàn)最好的是SVM-Linear分類(lèi)器。本文提出的SVM-DS決策融合方法準(zhǔn)確率為86.14%,比單一分類(lèi)器中表現(xiàn)最好的SVM-RBF提高了1.86%。SVM-DS方法標(biāo)準(zhǔn)差為0.016 1,比SVM-Linear降低了0.005 3,比SVM-Quadratic降低了0.011 5??梢?jiàn)在抗蛇行單故障中,SVM-DS決策融合方法的穩(wěn)定性遠(yuǎn)高于各單一分類(lèi)器。
對(duì)比兩種工況的分類(lèi)結(jié)果可以看出,在橫向減振器單故障實(shí)驗(yàn)中,表現(xiàn)最好的是SVM-Linear,在抗蛇行單故障實(shí)驗(yàn)中分類(lèi)準(zhǔn)確率最好的是SVM-RBF,穩(wěn)定性最好的是SVM-Linear。這說(shuō)明,分類(lèi)器對(duì)不同故障數(shù)據(jù)的分類(lèi)能力是不一樣的,單一分類(lèi)器幾乎無(wú)法做到對(duì)各種工況的故障數(shù)據(jù)都表現(xiàn)良好,這也是本文要采用多分類(lèi)器聯(lián)合的決策融合方法的原因。高鐵轉(zhuǎn)向架單故障數(shù)據(jù)實(shí)驗(yàn)驗(yàn)證了本文SVM-DS決策融合方法的有效性,該方法實(shí)現(xiàn)了故障分類(lèi)的優(yōu)化,穩(wěn)定地提升了故障識(shí)別率。
5.2 UCI標(biāo)準(zhǔn)數(shù)據(jù)集驗(yàn)證
為了充分驗(yàn)證SVM-DS決策融合方法的有效性,本文使用表4所示UCI數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)分析。
限于篇幅,特征分布圖以Iris數(shù)據(jù)集的特征集為例。圖3是Iris標(biāo)準(zhǔn)數(shù)據(jù)集是特征集歸一化后的特征分布圖。
在Wine和Iris數(shù)據(jù)集上,單一分類(lèi)器表現(xiàn)最好的都是SVM-Linear分類(lèi)器。在Breast-w數(shù)據(jù)集上,不同核函數(shù)SVM分類(lèi)器分類(lèi)效果差異不大。但SVM-DS方法在3種數(shù)據(jù)集上的準(zhǔn)確率都高于各單一分類(lèi)器,穩(wěn)定性也是最好的。這驗(yàn)證了SVM-DS方法在UCI標(biāo)準(zhǔn)數(shù)據(jù)集上提高分類(lèi)準(zhǔn)確率的同時(shí),也提高了方法的穩(wěn)定性。
6 結(jié)束語(yǔ)
本文提出一種基于SVM與DS相結(jié)合的決策融合方法。該方法根據(jù)SVM的實(shí)際分類(lèi)結(jié)果,從中獲取分類(lèi)標(biāo)簽、后驗(yàn)概率和混淆矩陣等信息。用混淆矩陣來(lái)衡量分類(lèi)器性能,計(jì)算局部可信度,再結(jié)合SVM分類(lèi)器后驗(yàn)概率來(lái)構(gòu)造BPA,使獲得的基本概率賦值函數(shù)更加可靠和符合實(shí)際,從而有效解決了證據(jù)理論應(yīng)用中的一大難題。從實(shí)驗(yàn)結(jié)果可以看出,與單一分類(lèi)器的分類(lèi)結(jié)果相比,結(jié)合3種不同SVM分類(lèi)器的SVM-DS決策融合方法能夠穩(wěn)定地提高分類(lèi)準(zhǔn)確率。
參考文獻(xiàn)
[1] ZHU Y M,BENTABET L,DUPUIS O,et al.Automatic determination of mass functions in Dempster-Shafer theory using fuzzy c-means and spatial neighborhood information for image segmentation[J].Optical Engineering,2002,41(4):760-770.
[2] 蔣雯,陳運(yùn)東,湯潮,等.基于樣本差異度的基本概率指派生成方法[J].控制與決策,2015,30(1):71-75.
[3] FLOREA M C,JOUSSELME A L,GRENIER D,et al.Approximation techniques for the transformation of fuzzy sets into random sets[J].Fuzzy Sets and Systems,2008,159(3):270-288.
[4] 周皓,李少洪.支持向量機(jī)與證據(jù)理論在信息融合中的結(jié)合[J].傳感器技術(shù)學(xué)報(bào),2008,21(9):1566-1570.
[5] Ai Lingmei,Wang Jue,Wang Xuelian.Multi-features fusion diagnosis of tremor based on artificial neural network and D-S evidence theory[J].Signal Processing,2008,88(12):2927-2935.
[6] Han Deqiang,Deng Yong,Han Chongzhao.Novel approaches for the transformation of fuzzy membership function into basic probability assignment based on uncertain optimization[J].International Journal of Uncertainty Fuzziness and Knowledge-Based Systems,2013,21(2):289-322.
[7] 韓德強(qiáng),楊藝,韓崇昭.DS證據(jù)理論研究進(jìn)展及相關(guān)問(wèn)題探討[J].控制與決策,2014,29(1):1-11.
[8] SUH D,YOOK J.A method to determine basic probability assignment in context awareness of a moving object[J].International Journal of Distributed Sensor Networks,2013(2):167-174.
[9] PLATT J C.Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods[J].Advances in Large Margain Classifiers,2000,10(4):61-74.
[10] 王磊.支持向量機(jī)學(xué)習(xí)算法的若干問(wèn)題研究[D].長(zhǎng)沙:國(guó)防科學(xué)技術(shù)大學(xué)研究生院,2009.
[11] CHANG C C,LIN C J. LIBSVM:a library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology(TIST),2011,2(3):1-27.
[12] 雷蕾,王曉丹,邢雅瓊,等.結(jié)合SVM和DS證據(jù)理論的多極化HRRP分類(lèi)研究[J].控制與決策,2013(6):861-866.
[13] 張靜,宋銳,郁文賢,等.基于混淆矩陣和Fisher準(zhǔn)則構(gòu)造層次化分類(lèi)器[J].軟件學(xué)報(bào),2005,16(9):1560-1567.
[14] 袁憲鋒,宋沐民,周風(fēng)余,等.多PCA模型及SVM-DS融合決策的服務(wù)機(jī)器人故障診斷[J].振動(dòng)、測(cè)試與診斷,2015,35(3):434-440.
作者信息:
朱 菲,金煒東
(西南交通大學(xué) 電氣工程學(xué)院,四川 成都610031)