??? 摘 要:介紹并比較了支持向量機分類器和最小二乘支持向量機分類器的算法,提出了基于支持向量機的二叉樹多分類變壓器故障診斷模型。將標準支持向量機(C-SVM)分類器和最小二乘支持向量機(LS-SVM)分類器分別用于變壓器故障診斷,通過網(wǎng)格搜索和交叉驗證法取得支持向量機的參數(shù),準確率較高。試驗結果表明,支持向量機和最小二乘支持向量機在變壓器故障診斷中具有很大的應用潛力。
??? 關鍵詞:支持向量機;分類器;最小二乘支持向量機;故障診斷
?
??? 電力變壓器在電力系統(tǒng)中的地位舉足輕重,是電力系統(tǒng)中最重要和最關鍵的電氣設備之一,其運行的安全可靠性直接關系到電力系統(tǒng)的安全與穩(wěn)定。
??? 油中溶解氣體分析(DGA)技術是目前對油浸變壓器進行故障診斷最方便、有效的手段之一,它能較準確、可靠地發(fā)現(xiàn)逐步發(fā)展的潛伏性故障。
??? SVM[1-2]是在統(tǒng)計學理論基礎上發(fā)展起來的一種新的學習方法,它能較好地解決小樣本、非線性、高緯數(shù)和局部極小等實際問題,已成為繼神經網(wǎng)絡研究之后機器學習領域的研究熱點,為了區(qū)別,將Vapnik提出的支持向量機稱為標準支持向量機(C-SVM)。最小二乘支持向量機LS-SVM(Least Square Support Vector Machines)是支持向量機的變形算法,LS-SVM采用二次損失函數(shù),將SVM中的二次規(guī)劃問題轉化為線性方程組求解,在保證精度的同時大大降低了計算復雜性,加快了求解速度。
??? 本文提出了基于支持向量機的二叉樹多分類變壓器故障診斷模型,通過網(wǎng)格搜索方法選擇確定支持向量機參數(shù)。將C-SVM分類器和LS-SVM分類器分別用于變壓器故障診斷模型,實驗表明,該模型具有良好的分類效果和推廣能力,C-SVM分類器和LS-SVM分類器都能達到較高的故障診斷率。
1 支持向量機與最小二乘支持向量機算法
1.1 C- SVM與LS-SVM分類器算法
??? 支持向量機的主要思想如下:首先選擇非線性變換
映射到特征空間,在此高維空間中構造最優(yōu)線性決策函數(shù)
在構造最優(yōu)決策函數(shù)時,利用結構風險最小化準則,利用原空間的核函數(shù)取代高維特征空間的點積運算,避免了復雜運算。
??? 支持向量機和最小二乘支持向量機[3-4]在利用結構風險原則的同時,在優(yōu)化目標中選取了不同的損失函數(shù)。
??? 對于支持向量機優(yōu)化目標與約束條件為:
??? 
式中,εi是松弛變量;C為懲罰參數(shù)。對于最小二乘支持向量機,優(yōu)化目標采用的平方項,故優(yōu)化問題為:
??? 
??? 應用拉格朗日方法求解上述優(yōu)化問題,支持向量機優(yōu)化問題轉化為下面的二次規(guī)劃:
??? 
??? 最小二乘支持向量機優(yōu)化問題轉化為求解線性方程
?????? (4)
1.2 核函數(shù)選擇
??? 由上面分析可知,C-SVM與LS-SVM分類器是由訓練集和核函數(shù)完全刻畫的,構造、選擇核函數(shù)是一個重要問題,選擇不同的核函數(shù)會產生不同的支持向量機算法。因徑向基核函數(shù)只有一個待定的參數(shù)ο,與其他和函數(shù)相比具有參數(shù)少的優(yōu)點,本文采用徑向基函數(shù)作為核函數(shù),即:
??? 
2 基于支持向量機的變壓器故障診斷
??? 本文將支持向量機分類器和最小二乘支持向量機分類器用于變壓器故障診斷中。
2.1 特征提取
??? 通過油色譜分析法得到油中溶解氣體類型和變壓器內部故障性質的對應關系,采用多種以油中溶解氣體為依據(jù)的判別故障方法。目前多采用H2、CH4、C2H6、C2H4、C2H2?5種氣體進行診斷,本文選取列舉出的5種氣體的含量作為輸入特征,利用SVM對這5種特征量進行訓練和診斷。
??? 診斷出變壓器常見的5種狀態(tài):變壓器的正常狀態(tài)、中低溫過熱、高溫過熱、高能放電、低能放電。
2.2 數(shù)據(jù)預處理
??? 為了避免輸入向量中各變量數(shù)量級相差過大影響訓練效果,支持向量機對數(shù)據(jù)樣本(訓練集和測試集)進行歸一化處理。
??? xmax和xmin分別代表樣本集合的最大值與最小值,xi為實際數(shù)據(jù),
??? 
??? 這樣使數(shù)據(jù)轉換到[0,1]區(qū)間。
2.3 變壓器故障診斷模型
??? 基于SVM的二叉樹多類算法是將所有類別分成兩個子類,再將兩個子類分別劃分成兩個次級子類,依次類推,直到所有的節(jié)點只含有一個類別為止,這樣,多分類問題就轉化為二分類問題,每個節(jié)點處采用SVM二值分類器作為分類函數(shù)。
??? 二叉樹的分類結構主要有兩種:一種是在每個內節(jié)點處,由一個類與剩下的類構造分割面;另一種是在內節(jié)點處,可以是多個類與多個類的分割。本文只考慮前一種情況,即每次分割只分割出一個類。基于支持向量機的二叉樹多分類變壓器故障診斷模型如圖1所示。
?

??? 在訓練小樣本的情況下,該模型可以由粗到細逐步將故障進行分類,使診斷不斷深入,逐步靠近故障的真實情況。根據(jù)變壓器故障的特點,采用4級SVM分類器對數(shù)據(jù)樣本進行訓練測試,最終判斷變壓器所處的狀態(tài)。
3 參數(shù)優(yōu)化
??? 在支持向量機算法參數(shù)的確定中,基于網(wǎng)格搜索和交叉驗證[5]的參數(shù)尋優(yōu)方法簡單實用,有效地解決了SVM參數(shù)設計的難題,增加了診斷模型的推廣性。網(wǎng)格搜索方法首先確定各個參數(shù)的范圍,然后對每個參數(shù)范圍按照一定規(guī)律插值,得出若干組參數(shù)組合。交叉驗證法的思想是:將訓練樣本M隨機分為大致相等的個互不相交的子集,即
共進行次訓練和測試,第i次迭代做法是:選擇Si作為測試集,其余子集的和為訓練集。算法根據(jù)訓練集合求出決策函數(shù)后,對測試集合Si進行測試,記錯誤分類的樣本點個數(shù)為li。k次迭代完成后, 得到了l1…lk,比較哪一組參數(shù)得到的交叉驗證精度高,精度高的參數(shù)就是所要選取的參數(shù)。
4 變壓器故障診斷實例分析
??? 本文針對采集到的240組故障電力變壓器油中氣體含量的歷史數(shù)據(jù)信息,先剔除一些數(shù)據(jù)不全以及測量結果明顯有誤的數(shù)據(jù)。最后得到228組故障明確的電力變壓器油中氣體數(shù)據(jù),其中2/3樣本用于訓練集合,1/3用于測試集合。
??? 將此數(shù)據(jù)對基于支持向量機的二叉樹多分類變壓器故障診斷效果進行了實例驗證。
??? 分別利用支持向量機分類器與最小二乘支持向量機分類器,選用相同的訓練樣本集和測試樣本集,通過網(wǎng)格搜索和交叉驗證的參數(shù)尋優(yōu)方法確定參數(shù),訓練和測試結果分別如表1和表2所示。
?

?

??? 為了更好地評價基于支持向量機的二叉樹多分類方法。本文也采用神經網(wǎng)絡對同樣的數(shù)據(jù)進行試驗對比,得到測試結果如表3所列。
?

??? 通過對基于C-SVM與LS-SVM的二叉樹多分類故障診斷模型的試驗驗證,并與其他模型比較,可得出如下結論:
??? (1)基于支持向量機的二叉樹多級分類故障診斷模型具有很高的正確率,大大降低了參數(shù)選擇的時間,使模型構造簡單。
??? (2)參數(shù)尋優(yōu)能提高SVM分類器模型的分類正確率,基于網(wǎng)格搜索和交叉驗證的參數(shù)尋優(yōu)方法為解決SVM分類器的實際應用提供了有效的途徑。從表1與表2可知,標準SVM具有較高的準確度,然而LS-SVM具有較快的收斂速度。
??? (3)基于支持向量機的二叉樹多級分類故障診斷模型訓練時間比神經網(wǎng)絡的訓練時間短,且精確度高。
??? 本文比較了標準支持向量機分類器和最小二乘支持向量機分類器,并將它們應用于二叉樹的多分類變壓器故障診斷中,使用網(wǎng)格搜索和交叉驗證的參數(shù)尋優(yōu)方法,取得了良好的分類效果,應用于故障診斷領域應當具有良好的前景。
參考文獻
[1]?Vapnik V N. The nature of statistical learning theory [M]. New York: Springer- Verlag ,1995.
[2]?張學工. 關于統(tǒng)計學習理論與支持向量機[J].自動化學報, 2000,26(1):32-42.
[3]?Burges C J C.A tutorial on support vector machines for pattern recognition [J]. Data Mining and Knowledge Siscovery,1998, 2 (2) :1-47.
[4]?閻威武,邵惠鶴.支持向量機和最小二乘支持向量機的比較及其應用研究[J].控制與決策,2003,18(3):358-360.
[5]?董明,孟源源,徐長響,等.基于支持向量機及油中溶解氣體分析的大型電力變壓器故障診斷模型研究 [J].中國電機工程學報, 2003, 23(7):88-92.
