文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.191123
中文引用格式: 可婷,葛雪純,張立東,等. 鐵路道岔故障的智能診斷[J].電子技術(shù)應(yīng)用,2020,46(4):29-33.
英文引用格式: Ke Ting,Ge Xuechun,Zhang Lidong,et al. An intelligent diagnosis for railway turnout fault[J]. Application of Electronic Technique,2020,46(4):29-33.
0 引言
作為一種重要的鐵路信號(hào)基礎(chǔ)設(shè)備,道岔的運(yùn)行情況與列車的安全運(yùn)行和運(yùn)輸效率密不可分,一旦道岔運(yùn)行發(fā)生故障沒有及時(shí)檢修,會(huì)帶來非常大的安全隱患,對(duì)人們的生命和財(cái)產(chǎn)安全造成巨大損失[1]。因此,實(shí)時(shí)監(jiān)控其運(yùn)行狀態(tài)并及時(shí)處理故障是鐵路安全運(yùn)行的關(guān)鍵問題之一。
目前,我國大部分地區(qū)鐵路道岔故障的傳統(tǒng)檢測方法是利用微機(jī)監(jiān)測系統(tǒng)采集道岔轉(zhuǎn)轍機(jī)動(dòng)作時(shí)的電流值。圖1給出了隨著時(shí)間變化,道岔轉(zhuǎn)轍機(jī)動(dòng)作時(shí)產(chǎn)生的電流變化趨勢(shì)圖。該圖可分為切斷表示電流、解鎖、轉(zhuǎn)換、鎖閉、接通表示電流5個(gè)階段。道岔傳統(tǒng)的故障檢測方式主要是現(xiàn)場工作人員將微機(jī)監(jiān)測系統(tǒng)監(jiān)測出的道岔動(dòng)作電流曲線與總結(jié)得到的電流曲線進(jìn)行人為比對(duì),最終確定道岔的工作狀態(tài)。然而,這種人工識(shí)別方式存在3個(gè)方面的缺陷:(1)對(duì)維護(hù)人員的工作經(jīng)驗(yàn)依賴度較高,容易出現(xiàn)誤判或漏判等情況,特別是當(dāng)?shù)啦砉收媳徽`判為正常狀態(tài)時(shí),會(huì)導(dǎo)致未及時(shí)采取維護(hù)措施,造成無法挽回的損失;(2)在中國高速鐵路和客運(yùn)專線飛速發(fā)展的今天,這種單純靠人工經(jīng)驗(yàn)判斷錯(cuò)綜復(fù)雜的道岔設(shè)備的運(yùn)行狀態(tài)需要耗費(fèi)大量的人力、物力和財(cái)力;(3)人工判斷效率極其低下,已經(jīng)完全不能滿足經(jīng)濟(jì)發(fā)展的要求和人民出行的需求。因此,在當(dāng)今人工智能和中國鐵路事業(yè)飛速發(fā)展的大背景下,研究一種具備學(xué)習(xí)能力的道岔故障智能識(shí)別系統(tǒng)是亟待解決的問題之一。
隨著人工智能方法的逐漸成熟和完善,國內(nèi)外專家學(xué)者利用人工智能方法對(duì)鐵路道岔故障的識(shí)別進(jìn)行了初步的研究,并取得了一些成果。例如,邢玉龍等人考慮外部環(huán)境因素,對(duì)數(shù)據(jù)做特殊處理,建立數(shù)學(xué)模型進(jìn)行故障檢測[2]。然而,該模型和方法的分類性能并不穩(wěn)定,泛化能力不強(qiáng)。王思明、雷燁和關(guān)瓊利用支持向量機(jī)方法設(shè)計(jì)不同的求解算法,實(shí)現(xiàn)道岔設(shè)備的故障診斷[3-4]。鐘志旺、唐濤和王峰通過分詞算法將故障文檔表達(dá)在詞項(xiàng)特征空間中,并將故障文檔表達(dá)在主題特征空間上,以SVM算法構(gòu)造診斷器[5]。DIEGO J和GARCIA M F則是將模糊理論與神經(jīng)網(wǎng)絡(luò)結(jié)合設(shè)計(jì)改進(jìn)算法,用于道岔故障診斷[6-7]。然而,神經(jīng)網(wǎng)絡(luò)在訓(xùn)練樣本較少時(shí)分類性能不佳,會(huì)出現(xiàn)過擬合現(xiàn)象??傊?,以上方法只有在擁有大量的故障樣本(均衡數(shù)據(jù))時(shí)才具有較好的識(shí)別效果。事實(shí)上,在實(shí)際的運(yùn)行環(huán)境中,每個(gè)道岔出現(xiàn)故障的概率十分小,即故障樣本遠(yuǎn)少于正常樣本,是一種不均衡問題。此外,不同道岔電流數(shù)據(jù)維度并不相同,且道岔電流數(shù)據(jù)往往維度很高,這也會(huì)導(dǎo)致以上方法的運(yùn)算時(shí)間較長,不能滿足鐵路道岔實(shí)時(shí)檢測的要求。
針對(duì)以上兩個(gè)普遍存在的問題,本文提出一種基于不均衡問題的鐵路道岔故障智能診斷技術(shù),具體地,包括道岔數(shù)據(jù)的缺失值補(bǔ)齊、特征提取、道岔智能識(shí)別問題的轉(zhuǎn)化、道岔的智能識(shí)別技術(shù)、識(shí)別性能指標(biāo)的設(shè)計(jì)等方面的研究。以廣州鐵路局的道岔數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù),在環(huán)境為MATLAB 2014a,Windows 7,Intel Core i3 2.4 GHz CPU下進(jìn)行實(shí)驗(yàn)?zāi)M。實(shí)驗(yàn)結(jié)果表明,本文的識(shí)別系統(tǒng)在不均衡道岔樣本中仍具有很好的識(shí)別能力,并具有強(qiáng)泛化能力,且其識(shí)別平均時(shí)間為0.04 s,滿足智能識(shí)別的實(shí)時(shí)性要求。
1 道岔故障智能識(shí)別系統(tǒng)
1.1 道岔電流數(shù)據(jù)特征選擇
微機(jī)監(jiān)測采集數(shù)據(jù)的周期為0.04 s,道岔正常轉(zhuǎn)換時(shí),需要6.4 s~10 s,于是會(huì)產(chǎn)生160~250個(gè)電流數(shù)據(jù);而道岔卡阻時(shí),其轉(zhuǎn)換時(shí)間可能長達(dá)30 s,甚至更長時(shí)間,此時(shí)會(huì)采集600多個(gè)甚至更多的電流數(shù)據(jù)。因此,這就可能存在兩個(gè)問題:(1)以道岔動(dòng)作一次得到的電流值為一個(gè)樣本向量,那么多次動(dòng)作將得到多個(gè)樣本向量,以這些樣本向量作為本文的訓(xùn)練樣本,發(fā)現(xiàn)其維度并不相同,這將大大增加后面的訓(xùn)練難度; (2)道岔卡阻時(shí)會(huì)產(chǎn)生高維數(shù)據(jù),這必然增加模型學(xué)習(xí)的訓(xùn)練時(shí)間,導(dǎo)致道岔故障識(shí)別遲緩。因此,本文首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,即利用缺失值補(bǔ)零的方式將所有數(shù)據(jù)補(bǔ)為維度相同的向量。然而,補(bǔ)零操作必會(huì)出現(xiàn)高維小樣本數(shù)據(jù),導(dǎo)致過擬合現(xiàn)象的出現(xiàn)。因此,接下來就需要對(duì)高維小樣本數(shù)據(jù)進(jìn)行特征提取,本文采取主成分分析方法對(duì)數(shù)據(jù)進(jìn)行特征選擇和提取。主成分分析(Principal Component Analysis,PCA)是KARL P發(fā)明的一種特征提取技術(shù)[8],它對(duì)多個(gè)樣本的輸入矩陣求協(xié)方差矩陣,根據(jù)協(xié)方差矩陣的特征值確定方差較大的屬性,通過獲得累計(jì)方差貢獻(xiàn)率,選擇協(xié)方差矩陣相應(yīng)的特征向量,確定主成分。具體的數(shù)據(jù)處理步驟如下:
(1)輸入:鐵路道岔電流的n個(gè)樣本向量、參數(shù)θ;
(2)原始數(shù)據(jù)預(yù)處理:以樣本的最高維度m為訓(xùn)練樣本的維度,將低于m維的樣本進(jìn)行補(bǔ)零操作,初步得樣本如下:
1.2 智能識(shí)別問題的轉(zhuǎn)化
一方面,道岔異??赡艹霈F(xiàn)在任何一個(gè)階段,且異常情況極其復(fù)雜;另一方面,出現(xiàn)異常道岔的概率較低,即本文得到的訓(xùn)練數(shù)據(jù)為不均衡數(shù)據(jù),正常數(shù)據(jù)較多,而異常數(shù)據(jù)極少。鑒于此特點(diǎn),區(qū)別于已有方法,本文將學(xué)習(xí)問題轉(zhuǎn)化為不均衡分類問題,即設(shè)道岔故障電流曲線數(shù)據(jù)為正類數(shù)據(jù),記作x1,x2,…,xp,其標(biāo)簽記為yi=1,i=1,…,p;道岔正常電流曲線數(shù)據(jù)為負(fù)類數(shù)據(jù),記作xp+1,xp+2,…,xn,其標(biāo)簽記為yi=-1,i=p+1,…,n。與負(fù)類樣本相比較,正類數(shù)據(jù)的錯(cuò)誤識(shí)別會(huì)導(dǎo)致更加嚴(yán)重的后果。因此,本文更看重正類數(shù)據(jù)的正確識(shí)別。本文在已知兩類訓(xùn)練樣本前提下,通過學(xué)習(xí)一個(gè)決策函數(shù)f(x)判斷任何新來道岔電流數(shù)據(jù)x∈Rr×1的所屬類別。
1.3 道岔故障識(shí)別器
由CORTES C和VAPNIK V開發(fā)出來的分類技術(shù)[9]——支持向量機(jī)(SVM),是以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為原則,將最大間隔思想和基于核的方法結(jié)合起來,構(gòu)建優(yōu)化模型。在很多實(shí)際應(yīng)用中,該模型都表現(xiàn)出了很好的泛化能力?;诖?,為了保證正類樣本能正確分類,本文設(shè)定正類樣本的懲罰參數(shù)大于負(fù)類樣本的懲罰參數(shù),來構(gòu)建如下非均衡學(xué)習(xí)的SVM模型:
由此可以推出:
1.4 道岔故障識(shí)別性能指標(biāo)
在學(xué)習(xí)到一個(gè)分類器之后,需要對(duì)它的分類性能進(jìn)行評(píng)估。目前,有許多標(biāo)準(zhǔn)來評(píng)估一個(gè)分類器性能,如:分類精度(分類的正確率)、分類錯(cuò)誤率。然而,在鐵路道岔故障識(shí)別的電流數(shù)據(jù)中可能有高達(dá)98%的情況是正常道岔, 那么一個(gè)分類器不做任何分析而簡單地把每個(gè)數(shù)據(jù)分成“負(fù)類”就能達(dá)到98%的精度。顯然,分類精度這樣的評(píng)價(jià)準(zhǔn)則在鐵路道岔識(shí)別問題中是毫無用處的。本文更看重鐵路故障道岔(正類)的識(shí)別情況,受自然語言處理問題及部分監(jiān)督學(xué)習(xí)問題[10]的啟發(fā),本文設(shè)計(jì)正類樣本的查全率及查準(zhǔn)率兩個(gè)評(píng)價(jià)標(biāo)準(zhǔn)。具體的定義如下:
式(14)和(15)中各個(gè)指標(biāo)的具體含義如圖2所示。
這兩個(gè)評(píng)估標(biāo)準(zhǔn)的直觀含義是十分明顯的,即更加關(guān)注正類樣本是否更加準(zhǔn)確及全面地識(shí)別。然而,由于這兩個(gè)標(biāo)準(zhǔn)從兩個(gè)角度說明正類樣本的識(shí)別性能,并不相關(guān)。這時(shí),可以對(duì)查全率和查準(zhǔn)率求調(diào)和平均數(shù),得到新的評(píng)價(jià)標(biāo)準(zhǔn),即F值:
該評(píng)價(jià)標(biāo)準(zhǔn)對(duì)故障道岔的識(shí)別提出更高的要求,只有查全率和查準(zhǔn)率都大時(shí),F(xiàn)值才大;有一個(gè)小,F(xiàn)值就不高。
2 數(shù)值實(shí)驗(yàn)
2.1 實(shí)驗(yàn)安排
本文實(shí)驗(yàn)數(shù)據(jù)為廣州鐘村站的2016年11月28日-2017年6月14日的兩種類型鐵路道岔電流值,記為W1902#和W1904#。這些數(shù)據(jù)包括道岔的定位到反位、反位到定位數(shù)據(jù)(包括故障位)。經(jīng)過前期的數(shù)據(jù)缺失值補(bǔ)零預(yù)處理及特征提取后,隨機(jī)取其中的80%作為訓(xùn)練集,剩余的20%作為測試集進(jìn)行預(yù)測。實(shí)驗(yàn)重復(fù)進(jìn)行100次,取平均F值即為本文分類器最終的分類性能的評(píng)估。
2.2 參數(shù)設(shè)置
本文取累計(jì)貢獻(xiàn)率?茲=95%,保證95%的數(shù)據(jù)信息量不丟失,利用主成分分析進(jìn)行數(shù)據(jù)降維。本文采用十折交叉驗(yàn)證方法對(duì)偏置-SVM的模型進(jìn)行選擇。十折交叉驗(yàn)證(10-fold cross-validation)[11]是將數(shù)據(jù)集隨機(jī)分成10份,輪流將其中9份作為訓(xùn)練樣本,1份作為驗(yàn)證樣本。懲罰參數(shù)C+,C-在集合{2-10,2-9,…,210}中選擇。此外,本文采用高斯核K(xi,x)=進(jìn)行數(shù)據(jù)分類,核參數(shù)?滓在集合{2-10,2-9,…,210}中選擇。每組參數(shù)在十折交叉驗(yàn)證中得到10個(gè)F值,計(jì)算其平均F值。本文取最高平均F值所對(duì)應(yīng)的參數(shù)為最優(yōu)參數(shù),同時(shí)偏置支持向量機(jī)的模型隨之確定。
2.3 實(shí)驗(yàn)結(jié)果
通過MATLAB軟件實(shí)現(xiàn)對(duì)數(shù)據(jù)的缺失值補(bǔ)零及PCA降維處理后,得到的訓(xùn)練樣本如表1所示。其中,#正樣本表示異常道岔數(shù)據(jù)量,#負(fù)樣本表示正常道岔數(shù)據(jù)量,#特征表示道岔數(shù)據(jù)通過PCA降維后的數(shù)據(jù)維數(shù),#訓(xùn)練(80%)表示隨機(jī)取80%數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)的個(gè)數(shù),#測試(20%)表示測試數(shù)據(jù)個(gè)數(shù)。通過表1發(fā)現(xiàn)在進(jìn)行數(shù)據(jù)降維之后,樣本的屬性個(gè)數(shù)有明顯的下降,從600多降到7~8維,這說明采集到的電流值大部分都是冗余的,沒有區(qū)分度和實(shí)際意義的。
在進(jìn)行100次的實(shí)驗(yàn)運(yùn)行后,得到W1902#和W1904#道岔檢測的平均查全率、查準(zhǔn)率及F值,如表2、表3所示。表2說明W1902#道岔的查全率高達(dá)0.98以上,平均F值為0.94以上。
表3體現(xiàn)了W1904#極好的效果,平均查全率值高達(dá)100%,即本文偏置-SVM智能識(shí)別器可以精準(zhǔn)檢測故障道岔。
3 結(jié)論
本文提出了一種鐵路智能檢測系統(tǒng),該系統(tǒng)從數(shù)據(jù)預(yù)處理、特征選擇、SVM建模到性能評(píng)價(jià)標(biāo)準(zhǔn)設(shè)計(jì)這幾個(gè)方面做了詳細(xì)的研究,最后針對(duì)廣州鐘村站的道岔電流數(shù)據(jù),利用MATLAB軟件進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示,該智能系統(tǒng)具有強(qiáng)的泛化能力,即在環(huán)境復(fù)雜變化時(shí)仍具有極高的檢測效果,同時(shí)運(yùn)行時(shí)間為0.04 s,滿足實(shí)時(shí)性要求。
參考文獻(xiàn)
[1] 中華人民共和國鐵道部.鐵路行車事故案例選編[M].北京:中國鐵道版社,1999.
[2] 邢玉龍,趙會(huì)兵,田健.道岔動(dòng)作電流曲線的特征提取方法及道岔故障診斷方法:中國,CN105260595B[P].2017-03-15.
[3] 王思明,雷燁.一種基于LS-SVM的道岔控制電路故障診斷[J].蘭州交通大學(xué)學(xué)報(bào),2010,29(4):1-5.
[4] 關(guān)瓊.基于FOA-LSSVM的高速鐵路道岔故障診斷[J].科技通報(bào),2015,31(4):230-232.
[5] 鐘志旺,唐濤,王峰.基于PLSA和SVM的道岔故障特征提取與診斷方法研究[J].鐵道學(xué)報(bào),2018,40(7):80-87.
[6] DIEGO J,PEDREGALA F P,GARCIA F S.RCM2 predictive maintenance of railway systems based on unobserved components models[J].Reliability Engineering and System Safety,2004,83(1):103-110.
[7] GARCIA M F,SCHMID F,CONDE J.Wear assessment employing remote condition monitoring:a case study[J].Wear,2003,255(7):1209-1220.
[8] KARL P.Principal component analysis[J].Chemometrics & Intelligent Laboratory Systems,1987,2(1):37-52.
[9] CORTES C,VAPNIK V.Support-vector network[J].Machine Learning,1995,20:273-297.
[10] KE T,JING L,LV H,et al.Global and local learning from positive and unlabeled examples[J].Applied Intelligence,2018,48(8):2373-2392.
[11] 鄧乃揚(yáng),田英杰.支持向量機(jī)——理論、算法與拓展[M].北京:科學(xué)出版社, 2009.
作者信息:
可 婷1,葛雪純2,張立東1,呂 慧1
(1.天津科技大學(xué) 理學(xué)院,天津300457;2.北京華鐵信息技術(shù)有限公司,北京100081)