123,123

鐵路道岔故障的智能診斷

2020年電子技術(shù)應(yīng)用第4期

可婷1，葛雪純2，張立東1，呂慧1

1.天津科技大學(xué) 理學(xué)院，天津300457；2.北京華鐵信息技術(shù)有限公司，北京100081

摘要： 傳統(tǒng)的道岔故障檢測(cè)方式不僅會(huì)耗費(fèi)大量人力、物力、財(cái)力，而且檢測(cè)結(jié)果完全依賴于個(gè)人工作經(jīng)驗(yàn)。隨著人工智能的飛速發(fā)展，研究鐵路道岔的智能診斷器是亟待解決的問(wèn)題。提出一種智能檢測(cè)系統(tǒng)，該系統(tǒng)從預(yù)處理數(shù)據(jù)、特征提取、構(gòu)建不均衡數(shù)據(jù)的智能識(shí)別器以及設(shè)計(jì)更符合要求的評(píng)價(jià)標(biāo)準(zhǔn)方面進(jìn)行了具體而深入的研究。最后，通過(guò)MATLAB軟件對(duì)廣州鐘村站W(wǎng)1902#和W1904#型號(hào)的道岔動(dòng)作電流數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示，智能檢測(cè)系統(tǒng)不僅具有非常高的識(shí)別性能和泛化能力,而且識(shí)別時(shí)間僅為0.04 s, 滿足鐵路實(shí)時(shí)性要求。

關(guān)鍵詞： 鐵路道岔故障檢測(cè) 支持向量機(jī) 不均衡問(wèn)題主成分分析

中圖分類號(hào)： TN98；TP319
文獻(xiàn)標(biāo)識(shí)碼： A
DOI：10.16157/j.issn.0258-7998.191123
中文引用格式： 可婷，葛雪純，張立東，等. 鐵路道岔故障的智能診斷[J].電子技術(shù)應(yīng)用，2020，46(4)：29-33.
英文引用格式： Ke Ting，Ge Xuechun，Zhang Lidong，et al. An intelligent diagnosis for railway turnout fault[J]. Application of Electronic Technique，2020，46(4)：29-33.

An intelligent diagnosis for railway turnout fault

Ke Ting1，Ge Xuechun2，Zhang Lidong1，Lv Hui1

1.College of Science，Tianjin University of Science & Technology，Tianjin 300457，China； 2.Beijing Huatie Information Technology Co.，Ltd.，Beijing 100081，China

Abstract： The traditional turnout fault detection method not only leads to consume a lot of manpower, material resources and financial resources, but also relies on manual experience. With the rapid development of artificial intelligence, designing an intelligent diagnostic system to diagnose the turnout is a key problem. In this paper, an intelligent detection system is proposed, which contains data preprocessing, feature extraction, switch intelligent classifier and more suitable evaluation criterion design. It is simulated by MATLAB, the experimental results on Guangzhou village station switch current data of model W1902# and model W1904# shows that the current intelligent detection method not only has the ability of self-learning, but also can be detected efficiently in the complex changes of the environment, and the recognition time is only 0.04 s, which meets the real-time requirement of railway.

Key words : railway turnout；fault detection; support vector machine(SVM)；imbalanced datasets；principal component analysis

0 引言

作為一種重要的鐵路信號(hào)基礎(chǔ)設(shè)備，道岔的運(yùn)行情況與列車的安全運(yùn)行和運(yùn)輸效率密不可分，一旦道岔運(yùn)行發(fā)生故障沒(méi)有及時(shí)檢修，會(huì)帶來(lái)非常大的安全隱患，對(duì)人們的生命和財(cái)產(chǎn)安全造成巨大損失^[1]。因此，實(shí)時(shí)監(jiān)控其運(yùn)行狀態(tài)并及時(shí)處理故障是鐵路安全運(yùn)行的關(guān)鍵問(wèn)題之一。

目前，我國(guó)大部分地區(qū)鐵路道岔故障的傳統(tǒng)檢測(cè)方法是利用微機(jī)監(jiān)測(cè)系統(tǒng)采集道岔轉(zhuǎn)轍機(jī)動(dòng)作時(shí)的電流值。圖1給出了隨著時(shí)間變化，道岔轉(zhuǎn)轍機(jī)動(dòng)作時(shí)產(chǎn)生的電流變化趨勢(shì)圖。該圖可分為切斷表示電流、解鎖、轉(zhuǎn)換、鎖閉、接通表示電流5個(gè)階段。道岔傳統(tǒng)的故障檢測(cè)方式主要是現(xiàn)場(chǎng)工作人員將微機(jī)監(jiān)測(cè)系統(tǒng)監(jiān)測(cè)出的道岔動(dòng)作電流曲線與總結(jié)得到的電流曲線進(jìn)行人為比對(duì)，最終確定道岔的工作狀態(tài)。然而，這種人工識(shí)別方式存在3個(gè)方面的缺陷：(1)對(duì)維護(hù)人員的工作經(jīng)驗(yàn)依賴度較高，容易出現(xiàn)誤判或漏判等情況，特別是當(dāng)?shù)啦砉收媳徽`判為正常狀態(tài)時(shí)，會(huì)導(dǎo)致未及時(shí)采取維護(hù)措施，造成無(wú)法挽回的損失；(2)在中國(guó)高速鐵路和客運(yùn)專線飛速發(fā)展的今天，這種單純靠人工經(jīng)驗(yàn)判斷錯(cuò)綜復(fù)雜的道岔設(shè)備的運(yùn)行狀態(tài)需要耗費(fèi)大量的人力、物力和財(cái)力；(3)人工判斷效率極其低下，已經(jīng)完全不能滿足經(jīng)濟(jì)發(fā)展的要求和人民出行的需求。因此，在當(dāng)今人工智能和中國(guó)鐵路事業(yè)飛速發(fā)展的大背景下，研究一種具備學(xué)習(xí)能力的道岔故障智能識(shí)別系統(tǒng)是亟待解決的問(wèn)題之一。

隨著人工智能方法的逐漸成熟和完善，國(guó)內(nèi)外專家學(xué)者利用人工智能方法對(duì)鐵路道岔故障的識(shí)別進(jìn)行了初步的研究，并取得了一些成果。例如，邢玉龍等人考慮外部環(huán)境因素，對(duì)數(shù)據(jù)做特殊處理，建立數(shù)學(xué)模型進(jìn)行故障檢測(cè)^[2]。然而，該模型和方法的分類性能并不穩(wěn)定，泛化能力不強(qiáng)。王思明、雷燁和關(guān)瓊利用支持向量機(jī)方法設(shè)計(jì)不同的求解算法，實(shí)現(xiàn)道岔設(shè)備的故障診斷^[3-4]。鐘志旺、唐濤和王峰通過(guò)分詞算法將故障文檔表達(dá)在詞項(xiàng)特征空間中，并將故障文檔表達(dá)在主題特征空間上，以SVM算法構(gòu)造診斷器^[5]。DIEGO J和GARCIA M F則是將模糊理論與神經(jīng)網(wǎng)絡(luò)結(jié)合設(shè)計(jì)改進(jìn)算法，用于道岔故障診斷^[6-7]。然而，神經(jīng)網(wǎng)絡(luò)在訓(xùn)練樣本較少時(shí)分類性能不佳，會(huì)出現(xiàn)過(guò)擬合現(xiàn)象?？傊?，以上方法只有在擁有大量的故障樣本(均衡數(shù)據(jù))時(shí)才具有較好的識(shí)別效果。事實(shí)上，在實(shí)際的運(yùn)行環(huán)境中，每個(gè)道岔出現(xiàn)故障的概率十分小，即故障樣本遠(yuǎn)少于正常樣本，是一種不均衡問(wèn)題。此外，不同道岔電流數(shù)據(jù)維度并不相同，且道岔電流數(shù)據(jù)往往維度很高，這也會(huì)導(dǎo)致以上方法的運(yùn)算時(shí)間較長(zhǎng)，不能滿足鐵路道岔實(shí)時(shí)檢測(cè)的要求。

針對(duì)以上兩個(gè)普遍存在的問(wèn)題，本文提出一種基于不均衡問(wèn)題的鐵路道岔故障智能診斷技術(shù)，具體地，包括道岔數(shù)據(jù)的缺失值補(bǔ)齊、特征提取、道岔智能識(shí)別問(wèn)題的轉(zhuǎn)化、道岔的智能識(shí)別技術(shù)、識(shí)別性能指標(biāo)的設(shè)計(jì)等方面的研究。以廣州鐵路局的道岔數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù)，在環(huán)境為MATLAB 2014a，Windows 7，Intel Core i3 2.4 GHz CPU下進(jìn)行實(shí)驗(yàn)?zāi)M。實(shí)驗(yàn)結(jié)果表明，本文的識(shí)別系統(tǒng)在不均衡道岔樣本中仍具有很好的識(shí)別能力，并具有強(qiáng)泛化能力，且其識(shí)別平均時(shí)間為0.04 s，滿足智能識(shí)別的實(shí)時(shí)性要求。

1 道岔故障智能識(shí)別系統(tǒng)

1.1 道岔電流數(shù)據(jù)特征選擇

微機(jī)監(jiān)測(cè)采集數(shù)據(jù)的周期為0.04 s，道岔正常轉(zhuǎn)換時(shí)，需要6.4 s~10 s，于是會(huì)產(chǎn)生160~250個(gè)電流數(shù)據(jù)；而道岔卡阻時(shí)，其轉(zhuǎn)換時(shí)間可能長(zhǎng)達(dá)30 s，甚至更長(zhǎng)時(shí)間，此時(shí)會(huì)采集600多個(gè)甚至更多的電流數(shù)據(jù)。因此，這就可能存在兩個(gè)問(wèn)題：(1)以道岔動(dòng)作一次得到的電流值為一個(gè)樣本向量，那么多次動(dòng)作將得到多個(gè)樣本向量，以這些樣本向量作為本文的訓(xùn)練樣本，發(fā)現(xiàn)其維度并不相同，這將大大增加后面的訓(xùn)練難度; (2)道岔卡阻時(shí)會(huì)產(chǎn)生高維數(shù)據(jù)，這必然增加模型學(xué)習(xí)的訓(xùn)練時(shí)間，導(dǎo)致道岔故障識(shí)別遲緩。因此，本文首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理，即利用缺失值補(bǔ)零的方式將所有數(shù)據(jù)補(bǔ)為維度相同的向量。然而，補(bǔ)零操作必會(huì)出現(xiàn)高維小樣本數(shù)據(jù)，導(dǎo)致過(guò)擬合現(xiàn)象的出現(xiàn)。因此，接下來(lái)就需要對(duì)高維小樣本數(shù)據(jù)進(jìn)行特征提取，本文采取主成分分析方法對(duì)數(shù)據(jù)進(jìn)行特征選擇和提取。主成分分析(Principal Component Analysis，PCA)是KARL P發(fā)明的一種特征提取技術(shù)^[8]，它對(duì)多個(gè)樣本的輸入矩陣求協(xié)方差矩陣，根據(jù)協(xié)方差矩陣的特征值確定方差較大的屬性，通過(guò)獲得累計(jì)方差貢獻(xiàn)率，選擇協(xié)方差矩陣相應(yīng)的特征向量，確定主成分。具體的數(shù)據(jù)處理步驟如下：

(1)輸入：鐵路道岔電流的n個(gè)樣本向量、參數(shù)θ；

(2)原始數(shù)據(jù)預(yù)處理：以樣本的最高維度m為訓(xùn)練樣本的維度，將低于m維的樣本進(jìn)行補(bǔ)零操作，初步得樣本如下：

1.2 智能識(shí)別問(wèn)題的轉(zhuǎn)化

一方面，道岔異?？赡艹霈F(xiàn)在任何一個(gè)階段，且異常情況極其復(fù)雜；另一方面，出現(xiàn)異常道岔的概率較低，即本文得到的訓(xùn)練數(shù)據(jù)為不均衡數(shù)據(jù)，正常數(shù)據(jù)較多，而異常數(shù)據(jù)極少。鑒于此特點(diǎn)，區(qū)別于已有方法，本文將學(xué)習(xí)問(wèn)題轉(zhuǎn)化為不均衡分類問(wèn)題，即設(shè)道岔故障電流曲線數(shù)據(jù)為正類數(shù)據(jù)，記作x₁，x₂，…，x_p，其標(biāo)簽記為y_i=1，i=1，…，p；道岔正常電流曲線數(shù)據(jù)為負(fù)類數(shù)據(jù)，記作x_p+1，x_p+2，…，x_n，其標(biāo)簽記為yi=-1，i=p+1，…，n。與負(fù)類樣本相比較，正類數(shù)據(jù)的錯(cuò)誤識(shí)別會(huì)導(dǎo)致更加嚴(yán)重的后果。因此，本文更看重正類數(shù)據(jù)的正確識(shí)別。本文在已知兩類訓(xùn)練樣本前提下，通過(guò)學(xué)習(xí)一個(gè)決策函數(shù)f(x)判斷任何新來(lái)道岔電流數(shù)據(jù)x∈R^r×1的所屬類別。

1.3 道岔故障識(shí)別器

由CORTES C和VAPNIK V開發(fā)出來(lái)的分類技術(shù)^[9]——支持向量機(jī)(SVM)，是以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為原則，將最大間隔思想和基于核的方法結(jié)合起來(lái)，構(gòu)建優(yōu)化模型。在很多實(shí)際應(yīng)用中，該模型都表現(xiàn)出了很好的泛化能力。基于此，為了保證正類樣本能正確分類，本文設(shè)定正類樣本的懲罰參數(shù)大于負(fù)類樣本的懲罰參數(shù)，來(lái)構(gòu)建如下非均衡學(xué)習(xí)的SVM模型：

由此可以推出：

1.4 道岔故障識(shí)別性能指標(biāo)

在學(xué)習(xí)到一個(gè)分類器之后，需要對(duì)它的分類性能進(jìn)行評(píng)估。目前，有許多標(biāo)準(zhǔn)來(lái)評(píng)估一個(gè)分類器性能，如：分類精度(分類的正確率)、分類錯(cuò)誤率。然而，在鐵路道岔故障識(shí)別的電流數(shù)據(jù)中可能有高達(dá)98%的情況是正常道岔，那么一個(gè)分類器不做任何分析而簡(jiǎn)單地把每個(gè)數(shù)據(jù)分成“負(fù)類”就能達(dá)到98%的精度。顯然，分類精度這樣的評(píng)價(jià)準(zhǔn)則在鐵路道岔識(shí)別問(wèn)題中是毫無(wú)用處的。本文更看重鐵路故障道岔(正類)的識(shí)別情況，受自然語(yǔ)言處理問(wèn)題及部分監(jiān)督學(xué)習(xí)問(wèn)題^[10]的啟發(fā)，本文設(shè)計(jì)正類樣本的查全率及查準(zhǔn)率兩個(gè)評(píng)價(jià)標(biāo)準(zhǔn)。具體的定義如下：

式(14)和(15)中各個(gè)指標(biāo)的具體含義如圖2所示。

這兩個(gè)評(píng)估標(biāo)準(zhǔn)的直觀含義是十分明顯的，即更加關(guān)注正類樣本是否更加準(zhǔn)確及全面地識(shí)別。然而，由于這兩個(gè)標(biāo)準(zhǔn)從兩個(gè)角度說(shuō)明正類樣本的識(shí)別性能，并不相關(guān)。這時(shí)，可以對(duì)查全率和查準(zhǔn)率求調(diào)和平均數(shù)，得到新的評(píng)價(jià)標(biāo)準(zhǔn)，即F值：

該評(píng)價(jià)標(biāo)準(zhǔn)對(duì)故障道岔的識(shí)別提出更高的要求，只有查全率和查準(zhǔn)率都大時(shí)，F(xiàn)值才大；有一個(gè)小，F(xiàn)值就不高。

2 數(shù)值實(shí)驗(yàn)

2.1 實(shí)驗(yàn)安排

本文實(shí)驗(yàn)數(shù)據(jù)為廣州鐘村站的2016年11月28日-2017年6月14日的兩種類型鐵路道岔電流值，記為W1902#和W1904#。這些數(shù)據(jù)包括道岔的定位到反位、反位到定位數(shù)據(jù)(包括故障位)。經(jīng)過(guò)前期的數(shù)據(jù)缺失值補(bǔ)零預(yù)處理及特征提取后，隨機(jī)取其中的80%作為訓(xùn)練集，剩余的20%作為測(cè)試集進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)重復(fù)進(jìn)行100次，取平均F值即為本文分類器最終的分類性能的評(píng)估。

2.2 參數(shù)設(shè)置

本文取累計(jì)貢獻(xiàn)率?茲=95%，保證95%的數(shù)據(jù)信息量不丟失，利用主成分分析進(jìn)行數(shù)據(jù)降維。本文采用十折交叉驗(yàn)證方法對(duì)偏置-SVM的模型進(jìn)行選擇。十折交叉驗(yàn)證(10-fold cross-validation)^[11]是將數(shù)據(jù)集隨機(jī)分成10份，輪流將其中9份作為訓(xùn)練樣本，1份作為驗(yàn)證樣本。懲罰參數(shù)C₊，C_-在集合{2^-10，2^-9，…，2¹⁰}中選擇。此外，本文采用高斯核K(x_i，x)= rgzn2-2.2-x1.gif 進(jìn)行數(shù)據(jù)分類，核參數(shù)?滓在集合{2^-10，2^-9，…，2¹⁰}中選擇。每組參數(shù)在十折交叉驗(yàn)證中得到10個(gè)F值，計(jì)算其平均F值。本文取最高平均F值所對(duì)應(yīng)的參數(shù)為最優(yōu)參數(shù)，同時(shí)偏置支持向量機(jī)的模型隨之確定。

2.3 實(shí)驗(yàn)結(jié)果

通過(guò)MATLAB軟件實(shí)現(xiàn)對(duì)數(shù)據(jù)的缺失值補(bǔ)零及PCA降維處理后，得到的訓(xùn)練樣本如表1所示。其中，#正樣本表示異常道岔數(shù)據(jù)量，#負(fù)樣本表示正常道岔數(shù)據(jù)量，#特征表示道岔數(shù)據(jù)通過(guò)PCA降維后的數(shù)據(jù)維數(shù)，#訓(xùn)練(80%)表示隨機(jī)取80%數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)的個(gè)數(shù)，#測(cè)試(20%)表示測(cè)試數(shù)據(jù)個(gè)數(shù)。通過(guò)表1發(fā)現(xiàn)在進(jìn)行數(shù)據(jù)降維之后，樣本的屬性個(gè)數(shù)有明顯的下降，從600多降到7~8維，這說(shuō)明采集到的電流值大部分都是冗余的，沒(méi)有區(qū)分度和實(shí)際意義的。

在進(jìn)行100次的實(shí)驗(yàn)運(yùn)行后，得到W1902#和W1904#道岔檢測(cè)的平均查全率、查準(zhǔn)率及F值，如表2、表3所示。表2說(shuō)明W1902#道岔的查全率高達(dá)0.98以上，平均F值為0.94以上。

表3體現(xiàn)了W1904#極好的效果，平均查全率值高達(dá)100%，即本文偏置-SVM智能識(shí)別器可以精準(zhǔn)檢測(cè)故障道岔。

3 結(jié)論

本文提出了一種鐵路智能檢測(cè)系統(tǒng)，該系統(tǒng)從數(shù)據(jù)預(yù)處理、特征選擇、SVM建模到性能評(píng)價(jià)標(biāo)準(zhǔn)設(shè)計(jì)這幾個(gè)方面做了詳細(xì)的研究，最后針對(duì)廣州鐘村站的道岔電流數(shù)據(jù)，利用MATLAB軟件進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示，該智能系統(tǒng)具有強(qiáng)的泛化能力，即在環(huán)境復(fù)雜變化時(shí)仍具有極高的檢測(cè)效果，同時(shí)運(yùn)行時(shí)間為0.04 s，滿足實(shí)時(shí)性要求。

參考文獻(xiàn)

[1] 中華人民共和國(guó)鐵道部．鐵路行車事故案例選編[M]．北京：中國(guó)鐵道版社，1999．

[2] 邢玉龍，趙會(huì)兵，田健.道岔動(dòng)作電流曲線的特征提取方法及道岔故障診斷方法：中國(guó)，CN105260595B[P].2017-03-15.

[3] 王思明，雷燁.一種基于LS-SVM的道岔控制電路故障診斷[J].蘭州交通大學(xué)學(xué)報(bào)，2010，29(4)：1-5.

[4] 關(guān)瓊.基于FOA-LSSVM的高速鐵路道岔故障診斷[J].科技通報(bào)，2015，31(4)：230-232.

[5] 鐘志旺，唐濤，王峰.基于PLSA和SVM的道岔故障特征提取與診斷方法研究[J].鐵道學(xué)報(bào)，2018，40(7)：80-87.

[6] DIEGO J，PEDREGALA F P，GARCIA F S.RCM2 predictive maintenance of railway systems based on unobserved components models[J].Reliability Engineering and System Safety，2004，83(1)：103-110.

[7] GARCIA M F，SCHMID F，CONDE J.Wear assessment employing remote condition monitoring：a case study[J].Wear，2003，255(7)：1209-1220.

[8] KARL P.Principal component analysis[J].Chemometrics & Intelligent Laboratory Systems，1987，2(1)：37-52.

[9] CORTES C，VAPNIK V.Support-vector network[J].Machine Learning，1995，20：273-297.

[10] KE T，JING L，LV H，et al.Global and local learning from positive and unlabeled examples[J].Applied Intelligence，2018，48(8)：2373-2392.

[11] 鄧乃揚(yáng)，田英杰.支持向量機(jī)——理論、算法與拓展[M]．北京：科學(xué)出版社, 2009.

作者信息:

可婷1，葛雪純2，張立東1，呂慧1

(1.天津科技大學(xué) 理學(xué)院，天津300457；2.北京華鐵信息技術(shù)有限公司，北京100081)

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容