文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.181324
中文引用格式: 劉永梅,杜松懷,盛萬興. 基于AdaBoost算法的剩余電流分類方法[J].電子技術(shù)應(yīng)用,2018,44(12):147-150.
英文引用格式: Liu Yongmei,Du Songhuai,Sheng Wanxing. A residual current classification algorithm based on AdaBoost[J]. Application of Electronic Technique,2018,44(12):147-150.
0 引言
低壓電網(wǎng)中廣泛使用剩余電流保護(hù)裝置,用于預(yù)防火災(zāi),防止人身觸電傷亡事故。剩余電流保護(hù)裝置的動(dòng)作原理主要在于動(dòng)作整定值的設(shè)定,與是否是人體觸電電流,或是設(shè)備的啟動(dòng)電流無直接關(guān)系。因此保護(hù)裝置會(huì)發(fā)生拒動(dòng)、誤動(dòng),也間接造成了設(shè)備的投運(yùn)率低等問題。如何智能判定當(dāng)前剩余電流的種類是智能剩余電流保護(hù)裝置的亟待解決的一個(gè)問題。
當(dāng)前國內(nèi)外的剩余電流檢測方法主要包括神經(jīng)網(wǎng)絡(luò)檢測法、最小二乘支持向量機(jī)檢測法和基于自適應(yīng)算法的檢測法。文獻(xiàn)[1]-[5]將小波包變換、能量熵、量子遺傳等技術(shù)與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立了相關(guān)分類模型,為有效識別類型提供了理論支撐。文獻(xiàn)[6]采用最小二乘支持向量機(jī)可較為準(zhǔn)確地從總漏電電流中識別出生物體觸電電流。文獻(xiàn)[7]基于自適應(yīng)濾波原理,建立了自適應(yīng)觸電電流檢測模型,噪聲魯棒性好,能有效消除保護(hù)動(dòng)作死區(qū)。但文獻(xiàn)[1]-[4]的方法主要用于電力系統(tǒng)的故障識別,文獻(xiàn)[5]-[7]的方法主要用于觸電電流的識別。剩余電流保護(hù)有別于電力系統(tǒng)故障,同時(shí)會(huì)受到多樣負(fù)荷變化引起的漏電流變化的影響。
上述相關(guān)工作表明,針對剩余電流進(jìn)行分類具有一定的可行性。本文將在現(xiàn)有工作的基礎(chǔ)上,對相關(guān)的剩余電流特征等進(jìn)行構(gòu)建及提取,進(jìn)而達(dá)到對剩余電流類型的預(yù)測。
1 剩余電流試驗(yàn)與數(shù)據(jù)獲取
搭建生物體觸電物理實(shí)驗(yàn)平臺(tái)如圖1所示。實(shí)驗(yàn)平臺(tái)主要由實(shí)驗(yàn)電源、負(fù)載、用戶對地泄漏阻抗、線路對地分布阻抗、觸電支路、故障錄波器和電壓電流互感器組成。實(shí)驗(yàn)平臺(tái)的連接關(guān)系是采用實(shí)驗(yàn)電源串聯(lián)負(fù)載供電,在實(shí)驗(yàn)電源的電流出口處安裝電壓電流互感器,故障錄波器連接電壓電流互感器并讀取其中的觸電電壓電流數(shù)據(jù),觸電支路、線路對地分布阻抗、用戶對地泄漏阻抗的一端接在電壓電流互感器后面與負(fù)載中間,另一端接地。其中,采用三相電源作為實(shí)驗(yàn)電源,通過調(diào)壓器向負(fù)載直接供電;負(fù)載采用實(shí)驗(yàn)箱燈泡負(fù)載;以大電阻和電容的并聯(lián)來作為線路對地的絕緣阻抗;觸電支路是采用大電阻和生物體的串聯(lián)來實(shí)現(xiàn)的。
通過該觸電實(shí)驗(yàn)平臺(tái),可獲得植物觸電、動(dòng)物觸電、間接觸電等觸電類型的剩余電流數(shù)據(jù)。典型的一類觸電數(shù)據(jù)可視化如圖2所示。
從該觸電數(shù)據(jù),可以看出典型的觸電數(shù)據(jù)一個(gè)時(shí)域的具有一定周期性特征的波形,為了對該數(shù)據(jù)進(jìn)行分類及處理,亟待對該數(shù)據(jù)進(jìn)行特征提取。為此,本文通過構(gòu)造7種不同的觸電數(shù)據(jù)特征以進(jìn)行觸電數(shù)據(jù)的分類實(shí)驗(yàn)。
2 特征參數(shù)提取
如上一節(jié)分析,當(dāng)前的電流可根據(jù)信號的統(tǒng)計(jì)量計(jì)算原理[8-11]對剩余電流信號均值、標(biāo)準(zhǔn)差、方根幅值、均方根值、峰值、偏度、峰度7個(gè)典型時(shí)域特征量進(jìn)行計(jì)算,這幾個(gè)特征將用于代表原始數(shù)據(jù)從而進(jìn)行相關(guān)分類的操作。
(1)均值
為了表示信號波動(dòng)能量的整體水平,信號x(t)的離散表達(dá)式xi(i=1,2,…,N)均值可以表示為:
均值屬于有量綱特征參數(shù)。均值表示的是信號幅值的算術(shù)平均值,那么對應(yīng)地,絕對平均值則表示信號幅值絕對值的算術(shù)平均值,絕對平均值可以表示為:
(2)標(biāo)準(zhǔn)差
為了描述信號偏離中心趨勢μx的波動(dòng)強(qiáng)度,方差用來表示信號的波動(dòng)分量,標(biāo)準(zhǔn)差則為方差的正平方根值,屬于有量綱特征參數(shù)。對于有限平穩(wěn)信號x(i),其計(jì)算無偏標(biāo)準(zhǔn)差為:
(3)方根幅值
描述信號的波動(dòng)強(qiáng)度大小,屬于有量綱特征參數(shù)。其表達(dá)式為:
(4)均方根值
信號的均方根用來反映信號的振動(dòng)強(qiáng)度大小,也可以反映信號的能量大小。均方根值是相對于時(shí)間的平均,屬于有量綱特征參數(shù),它的表達(dá)式如式(5)所示:
同時(shí),信號的均方根值可以通過方差和均值求得:
(5)峰值
峰值是指信號的最大瞬時(shí)值,用來反映信號的強(qiáng)度大小,屬于有量綱特征參數(shù),表達(dá)式為:
(6)偏度
偏度用來衡量信號相對于其均值的對稱性,定義為:
偏度的值可以為正,可以為負(fù),甚至是無法定義。當(dāng)分布偏左時(shí),偏度為負(fù)值;當(dāng)分布偏右時(shí),偏度為正值;當(dāng)分布關(guān)于均值對稱時(shí),偏度為零。
(7)峰度
峰度可感知信號中的微小沖擊成分,可以描述分布形態(tài)的陡緩程度,其定義為:
正態(tài)分布的峰度為3,若峰度大于3表明有過度的峰度,峰度小于3則表明峰度不足。
3 基于AdaBoost算法的剩余電流類型識別
3.1 AdaBoost基本原理
AdaBoost是“Adaptive Boosting”(自適應(yīng)增強(qiáng))的縮寫,是一種迭代算法[17],在每一輪中加入一個(gè)新的弱分類器,直到達(dá)到某個(gè)預(yù)定的足夠小的錯(cuò)誤率或迭代次數(shù)。每個(gè)訓(xùn)練樣本都被賦予一個(gè)權(quán)重,表明它被某個(gè)分類器選入訓(xùn)練集的概率。如果某個(gè)樣本點(diǎn)已經(jīng)被準(zhǔn)確地分類,那么在構(gòu)造下一個(gè)訓(xùn)練集中,它被選中的概率就被降低;相反,如果某個(gè)樣本點(diǎn)沒有被準(zhǔn)確地分類,那么它的權(quán)重就得到提高。通過這樣的方式,AdaBoost方法能“聚焦于”那些較難分(更富信息)的樣本上。AdaBoost的自適應(yīng)性就體現(xiàn)在前一個(gè)弱分類器被錯(cuò)誤分類的樣本的權(quán)值在下次迭代時(shí)增大,而正確分類的樣本的權(quán)值會(huì)減小,并再次用來訓(xùn)練下一個(gè)弱分類器。通過分析,本文的剩余電流分類問題可映射到AdaBoost的模型。本文通過建立多個(gè)特征用于刻畫剩余電流的特點(diǎn),而后利用AdaBoost模型對剩余電流進(jìn)行求解。
3.2 面向剩余電流分類的AdaBoost 算法
給定訓(xùn)練數(shù)據(jù)集:(x1,y1),(x2,y2),…,(xN,yN),其中xi∈X,yi∈Y用于表示訓(xùn)練樣本的標(biāo)簽,i=1,2,…,N。其中xi代表本文第二部分的相關(guān)特征,yi代表相關(guān)分類的情況。最大迭代次數(shù)為T。具體的算法實(shí)施步驟如下所示。
(1)初始化訓(xùn)練數(shù)據(jù)的權(quán)值分布。每個(gè)訓(xùn)練樣本最開始是都被賦予相同的權(quán)值wi=1/N,訓(xùn)練樣本集的初始權(quán)值分布D1(i)為:
(2)從t=1,2,…,T迭代:
①選取一個(gè)當(dāng)前誤差率最小的弱分類器h作為第t個(gè)基本分類器Ht,并計(jì)算弱分類器ht:X→{-1,+1},該弱分類器在分布Dt上的誤差為:
在獲得相關(guān)的H之后,即可對相關(guān)的數(shù)據(jù)進(jìn)行訓(xùn)練及模型驗(yàn)證。
3.3 實(shí)驗(yàn)分析
實(shí)驗(yàn)數(shù)據(jù)有三類:動(dòng)物觸電數(shù)據(jù)85組、植物觸電數(shù)據(jù)75組、動(dòng)物間接觸電數(shù)據(jù)120組。每組數(shù)據(jù)有3 000個(gè)采樣點(diǎn),每100 μs采樣一次。得出樣本的7個(gè)特征參數(shù)后進(jìn)行測試。
當(dāng)訓(xùn)練集為數(shù)據(jù)集的75%,參數(shù)algorithm為SAMME時(shí),測試集的準(zhǔn)確率最高,為0.914,算法的準(zhǔn)確率、召回率等結(jié)果如表1所示。
由上表可知當(dāng)三種觸電數(shù)據(jù)混合時(shí),算法對動(dòng)物觸電數(shù)據(jù)的分類結(jié)果最好,對植物觸電數(shù)據(jù)的分類結(jié)果最差。
3.4 方法對比
常用的分類算法有SVM、決策樹、隨機(jī)森林、貝葉斯分類器、神經(jīng)網(wǎng)絡(luò)等,作為對比實(shí)驗(yàn),本次使用SVM、決策樹、隨機(jī)森林進(jìn)行測試。使用這三種算法在相同數(shù)據(jù)集上測試得到對應(yīng)的準(zhǔn)確率、召回率等結(jié)果如表2所示。
由表2可知,與AdaBoost算法相似,SVM、決策樹、隨機(jī)森林三種算法對動(dòng)物觸電數(shù)據(jù)的分類準(zhǔn)確率都很高,對植物觸電數(shù)據(jù)的分類準(zhǔn)確率相對較低。在當(dāng)前數(shù)據(jù)集效果下,AdaBoost的準(zhǔn)確率最高。
四種算法分類準(zhǔn)確率比較如圖3所示。由圖3可知,四種算法對動(dòng)物觸電數(shù)據(jù)分類的準(zhǔn)確率都比較高而且準(zhǔn)確率差別很小;在植物觸電數(shù)據(jù)分類的準(zhǔn)確率相對較低而且差別較大。其中AdaBoost對三種數(shù)據(jù)分類的準(zhǔn)確率都在80%以上;SVM對植物觸電的分類準(zhǔn)確率最低為50%,和隨機(jī)猜測的準(zhǔn)確率相近。四種算法中,AdaBoost對三種數(shù)據(jù)的分類準(zhǔn)確率都比較高,然后是隨機(jī)森林、決策樹。
4 結(jié)論
本文通過選取剩余電流中的多個(gè)特征作為訓(xùn)練特征,構(gòu)建了基于AdaBoost的剩余電流分類方法,并對比了隨機(jī)森林、SVM等主流的分類算法。實(shí)驗(yàn)表明,AdaBoost 對三種數(shù)據(jù)的分類效果較好,可以調(diào)整后用于實(shí)際觸電數(shù)據(jù)的分類,對未來的實(shí)際應(yīng)用有一定的借鑒價(jià)值。未來將對AdaBoost的參數(shù)調(diào)整等進(jìn)行研究,力爭達(dá)到更好的效果。
參考文獻(xiàn)
[1] 林圣,何正友,臧天磊,等.基于粗神經(jīng)網(wǎng)絡(luò)的輸電線路故障分類方法[J].中國電機(jī)工程學(xué)報(bào),2010,30(28):72-80.
[2] 李孝全,莊德慧,張強(qiáng).基于粗糙徑向基神經(jīng)網(wǎng)絡(luò)的電網(wǎng)故障診斷新模型[J].電力系統(tǒng)保護(hù)與控制,2009,37(18):20-24.
[3] 張舉,王興國,李志雷.小波包能量嫡神經(jīng)網(wǎng)絡(luò)在電力系統(tǒng)故障診斷中的應(yīng)用[J].電網(wǎng)技術(shù),2006,30(5):72-76.
[4] 李東敏,劉志剛,蘇玉香.基于多小波包和人工神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)故障類型識別[J].電力自動(dòng)化設(shè)備,2009,29(1):99-104.
[5] 王金麗,劉永梅,杜松懷,等.基于剩余電流固有模態(tài)能量特征的生物體觸電故障診斷模型[J].農(nóng)業(yè)工程學(xué)報(bào),2016,32(29):202-208.
[6] 韓曉慧,杜松懷,蘇娟,等.基于參數(shù)優(yōu)化的最小二乘支持向量機(jī)觸電電流檢測方法[J].農(nóng)業(yè)工程學(xué)報(bào),2014,30(23):238-245.
[7] 熊曉祎,肖先勇,趙恒.基于自適應(yīng)算法的觸電事故電流檢測[J].電力系統(tǒng)保護(hù)與控制,2017,45(4):139-144.
[8] 王濤,山拜·達(dá)拉拜,柳貴東.基于高階統(tǒng)計(jì)量的信號特征描述[J].通信技術(shù),2011,44(2):151-154.
[9] 何海平,計(jì)時(shí)鳴,張利.基于高階統(tǒng)計(jì)量的信號分析與處理[J].機(jī)電工程,2003,20(5):85-87.
[10] 俞卞章.數(shù)字信號處理(第2版)[M].西安:西北工業(yè)大學(xué)出版社,2002.
[11] 張瓊,楊俊安,夏建明.基于偏度的低空目標(biāo)聲信號盲抽取算法[J].數(shù)據(jù)采集與處理,2011,26(1):69-74.
[12] 杜松懷.電力系統(tǒng)接地技術(shù)[M].北京:中國電力出版社,2011.
[13] MITOLO M.Shock hazard in the presence of protective residual-current device[J].IEEE Transactions on Industry Applications,2010,46(4):1552-1557.
[14] Cheng Peng,Yan Han,F(xiàn)an Zhenqi.Design of a residual current circuit breaker IC with anti-interference technique[J].Analog Integr Circ Sig Process,2010,64:199-204.
[15] 李奎,陸儉國,岳大為,等.漏電信號的識別技術(shù)及其方法[J].低壓電器,2008(23):1-4.
[16] 蔡志遠(yuǎn),龐佳,陳廷輝.基于剩余電流和漏電阻抗的漏電保護(hù)方法的研究[J].電力系統(tǒng)保護(hù)與控制,2011,39(12):61-64.
[17] FREUND Y,SCHAPIRE R E.A decision-theoretic generalization of on-line learning and an application to boosting[J].CiteSeerX,1995.
作者信息:
劉永梅1,杜松懷1,盛萬興2
(1.中國農(nóng)業(yè)大學(xué) 信息與電氣工程學(xué)院,北京100083;2.中國電力科學(xué)研究院有限公司,北京100192)