文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.058
0 引言
隨著人們用電需求的不斷提升和社會的快速發(fā)展,對供電企業(yè)的供電服務(wù)質(zhì)量的要求越來越高。然而,目前大部分的電力企業(yè)在供電服務(wù)方面仍然存在許多不足,其中配網(wǎng)搶修作為影響用戶用電體驗的一項電力主營業(yè)務(wù),仍然停留在傳統(tǒng)的以用戶為主要發(fā)起人的被動搶修模式。如何提前發(fā)現(xiàn)電網(wǎng)系統(tǒng)薄弱環(huán)節(jié),提前精準預(yù)測配網(wǎng)搶修高危區(qū)域,采取相應(yīng)措施有效降低配網(wǎng)故障率,事前做好搶修準備,是電力企業(yè)急需解決的一個問題。
為加快電網(wǎng)發(fā)展、全力確保電力可靠供應(yīng),本文深入研究配網(wǎng)故障預(yù)測理論方法,利用大數(shù)據(jù)挖掘技術(shù),基于電力故障搶修歷史數(shù)據(jù),以特殊時期、天氣、溫度、設(shè)備老化情況、負荷率等作為擾動因數(shù),研究了一套基于具擾動特性的滾動基值法的配網(wǎng)搶修高危區(qū)域預(yù)測體系,并應(yīng)用于國網(wǎng)山東省電力公司,對某一區(qū)域未來3天及某一特定時期的配網(wǎng)搶修工單數(shù)量進行預(yù)測,實現(xiàn)對配網(wǎng)搶修的提前預(yù)測。根據(jù)預(yù)測結(jié)果指導(dǎo)優(yōu)化配網(wǎng)結(jié)構(gòu)和配網(wǎng)搶修工作的精準化管理,切實促進電網(wǎng)發(fā)展,提升供電服務(wù)質(zhì)量。
1 樣本數(shù)據(jù)預(yù)處理
從95598業(yè)務(wù)應(yīng)用系統(tǒng)、營銷業(yè)務(wù)應(yīng)用系統(tǒng)等電力業(yè)務(wù)應(yīng)用系統(tǒng)中獲取原始數(shù)據(jù),因原始數(shù)據(jù)存在數(shù)據(jù)缺失、數(shù)據(jù)不合規(guī)等問題,需要對數(shù)據(jù)做進一步的清洗,然后對數(shù)據(jù)進行分類與統(tǒng)計。
1.1 樣本數(shù)據(jù)部門范圍
樣本數(shù)據(jù)部門包括山東省17個市級供電公司、171個區(qū)縣級供電單位和394個工單數(shù)搶修部門。
1.2 樣本數(shù)據(jù)時間范圍
樣本數(shù)據(jù)時間范圍如表1所示。
因特殊時期搶修為活躍期,所以選取春節(jié)保電期間各部門的搶修單數(shù)量,時間范圍選取了3年的春節(jié)前后的2~3個月。
1.3 數(shù)據(jù)列名稱
原始數(shù)據(jù)中對項目研究有意義的列名稱有:統(tǒng)計周期、上級單位、供電單位、工單數(shù)原因、處理部門、工單數(shù)排除時間、是否退單。
1.4 樣本數(shù)量
(1)總樣本數(shù)量:根據(jù)設(shè)定的部門范圍和時間范圍,滿足條件的總樣本數(shù)量共計357 862條。
(2)壞樣本數(shù)量:將取值范圍異常、工單數(shù)原因為偶發(fā)事件的數(shù)據(jù)定義為壞樣本數(shù)據(jù),這部分數(shù)據(jù)不可預(yù)測,也不應(yīng)該包含在預(yù)測樣本中。
①是否退單字段值為審核不通過、退單、空白;
②工單數(shù)原因字段值為盜竊、計劃停限電、客戶誤報、鳥害等小動物、停限電、外部火災(zāi)、外部異物外力破壞、外力因素、小動物、車輛、樹線矛盾、樹枝搭掛、自然因素、空白;
③搶修總時長字段值在小于5 min或大于1 440 min的。
據(jù)統(tǒng)計,該部分數(shù)據(jù)記錄共計73 343條,應(yīng)該從樣本數(shù)據(jù)中剔除。
(3)有效樣本數(shù)量
有效樣本數(shù)量=總樣本數(shù)量-壞樣本數(shù)量=284 519條。
1.5 分部門樣本數(shù)量
(1)市級供電公司
山東省電網(wǎng)公司共設(shè)有17個市級供電公司,其有效樣本數(shù)據(jù)量如表2所示。
(2)區(qū)縣級供電公司
經(jīng)統(tǒng)計,全省共171個區(qū)縣級供電單位含有效工單數(shù)據(jù),由于篇幅限制,其數(shù)據(jù)的具體分布不在這里展示。
(3)處理部門
經(jīng)統(tǒng)計,全省共394個搶修部門含有效工單數(shù)據(jù),由于篇幅限制,其數(shù)據(jù)的具體分布不在這里展示。
2 數(shù)據(jù)分析及模型算法
2.1 數(shù)據(jù)分析
在研究數(shù)據(jù)分布及特點階段,嘗試了采用多種維度、多個方向的模型技術(shù)對數(shù)據(jù)進行分析,包括大數(shù)據(jù)模型等,結(jié)果顯示:部分模型由于模型本身限制不適用于該問題的解決,部分模型由于數(shù)據(jù)樣本不足限制了模型性能的發(fā)揮。
通過MATLAB軟件對各市級供電公司、區(qū)縣級供電單位以及搶修部門搶修工單進行的數(shù)據(jù)可視化分析,各單位的搶修工單數(shù)量總是在一段時間內(nèi)圍繞某一基準進行小范圍波動,并不時有少部分波動范圍較大的點出現(xiàn)。
選取2015年除夕前后各7天的數(shù)據(jù)進行分析,其中部分單位數(shù)據(jù)變化情況展示如下。
(1)市級供電公司舉例
濟南供電公司工單數(shù)量變化曲線圖如圖1所示,數(shù)據(jù)統(tǒng)計表如表3所示。
分析得出,有70%~80%的工單數(shù)量圍繞在平均工單數(shù)量上下波動,波動值在平均工單數(shù)的上下20%~30%之間,另有部分波動值超過了30%,引起這種極端波動的主要原因是天氣惡劣、設(shè)備老化、用戶原因。
2.2 預(yù)測模型分析
根據(jù)2.1小節(jié)的數(shù)據(jù)分析可以得出如下結(jié)論:
(1)搶修單數(shù)量在某一時間段內(nèi)通常會有一固定的均值;
(2)時間段不同,均值不同;
(3)通常情況下?lián)屝迒螖?shù)量都在圍繞這一均值上下波動;
(4)在有惡劣天氣擾動情況下,搶修工單數(shù)量值會有一個大的波動,產(chǎn)生一個極值;
(5)如果有設(shè)備老化問題、用戶管理等問題,在遇到惡劣天氣時,極值的幅度通常會更大。
由上述結(jié)論,可以用如下模型來預(yù)測某一天的工單數(shù)量:
其中,Wpre為某一天的工單數(shù)量的預(yù)測值;Wba為樣本空間內(nèi)剔除所有極值后的工單數(shù)量平均值;Wco為圍繞基值的隨機波動值;Qmax為樣本空間內(nèi)所有極值的最大值;Dco為擾動系數(shù),包括惡劣天氣、設(shè)備老化、用戶管理等問題引起的工單數(shù)變化。
上述模型被稱為具擾動特性的滾動基值法。擾動是指惡劣天氣、設(shè)備老化、用戶管理等擾動因素對預(yù)測結(jié)果有顯著的影響;滾動是指基于在一定時期內(nèi)設(shè)備的狀態(tài)及管理水平等不會出現(xiàn)大的變化情況下始終使用前N天數(shù)據(jù)作為樣本空間;基值是指在無擾動情況下?lián)屝薰蔚钠骄怠?/p>
2.3 算法分析
為便于工程計算,需要對具擾動特性的滾動基值法公式(式(1))、參數(shù)進行必要的說明和改進。
(1)基值Wba計算方法
① 預(yù)測日的前N天數(shù)據(jù)構(gòu)建樣本空間,N>10。
② 計算樣本空間內(nèi)工單數(shù)量平均值。
③ 定義工單數(shù)量超出平均值P%的數(shù)據(jù)為極值Q,統(tǒng)計出Q的個數(shù)T。
④ 從樣本空間中剔除這些極值數(shù)據(jù)Q,樣本空間的長度變?yōu)镹-T。
⑤ 向前增加T天數(shù)據(jù),補齊長度為N的樣本空間。
⑥ 返回步驟②繼續(xù),直至樣本空間內(nèi)不再有極值,此時的樣本空間稱為有效樣本空間。
⑦ 基值Wba等于有效樣本空間內(nèi)工單數(shù)的算術(shù)平均值。
(2)隨機波動值Wco計算方法
① 在有效樣本空間內(nèi)找出最大工單數(shù),與基值的差記為D。
② 定義S是在[-1,1]區(qū)間上的隨機數(shù)。
③ Wco=D×S。
(3)Qmax極值的最大值計算方法
計算基值Wba時剔除掉的所有極值中最大值。當沒有極值時取Wba×(1+P%)作為Qmax。
(4)Dco:擾動系數(shù)計算方法
①擾動因素分析
影響搶修工單數(shù)量變化的擾動因素很多,天氣、氣溫、設(shè)備老化、負荷率、用戶設(shè)備、用戶管理等都能引起工單數(shù)量的波動,有時波動幅度甚至很大。在這些擾動因素當中,天氣和氣溫的影響最為明顯,而且還會擴大其他擾動因素的作用,例如,惡劣天氣會導(dǎo)致負荷增加,而負荷增加又會讓設(shè)備老化的問題更為嚴重,綜上分析,這里只討論天氣和溫度對工單數(shù)量的影響。
根據(jù)歷史天氣預(yù)報數(shù)據(jù),單獨挑選出了惡劣天氣時的數(shù)據(jù),如表4~表6所示,表中的變化率是惡劣天氣當天的工單數(shù)量與基值的比值,這里只列出了部分單位的統(tǒng)計結(jié)果。
· 市級供電公司
· 區(qū)縣級供電單位
· 搶修部門
由表可見,天氣變化對工單數(shù)量有著直接的影響,工單數(shù)量的變化與天氣惡劣程度相對應(yīng),天氣越惡劣,工單數(shù)量越多。
② 擾動系數(shù)Dco的計算
定義H為天氣惡劣程度,惡劣程度是雨、雪、風(fēng)、氣溫的綜合考量,取值范圍為0~100,那么擾動系數(shù)Dco的計算公式為:
3 風(fēng)險預(yù)警等級劃分
國家電網(wǎng)電力安全事故等級劃分是將電網(wǎng)運行風(fēng)險預(yù)警分為4個等級:一級紅色預(yù)警、二級橙色預(yù)警、三級黃色預(yù)警和四級藍色預(yù)警。參照這一劃分原則,按照供電單位日搶修工單數(shù)量多少,對搶修工作所面臨的壓力進行風(fēng)險預(yù)警,也可分為4個等級,分別是一級紅色預(yù)警、二級橙色預(yù)警、三級黃色預(yù)警和四級藍色預(yù)警。預(yù)警等級劃分的定義可以考慮兩種方式:正態(tài)分布劃分和絕對值分布劃分。
3.1 正態(tài)分布劃分
正態(tài)分布是自然界、人類社會、心理和教育等領(lǐng)域連續(xù)隨機變量概率分布的一種,尤其是從管理學(xué)角度來看,正態(tài)分布的兩端小、中間多的規(guī)律滿足人們的心理預(yù)期。根據(jù)正態(tài)分布原理,假定一級預(yù)警占比例a%、二級預(yù)警占比例b%、三級預(yù)警占比例c%、四級預(yù)警占比例d%,則17個市級供電單位預(yù)警情況如表7所示,171個區(qū)縣級供電單位預(yù)警情況如表8所示,394個搶修部門預(yù)警情況如表9所示。
3.2 絕對值分布劃分
絕對值分布劃分是根據(jù)日搶修單數(shù)量的絕對值多少劃分預(yù)警等級。表10~表12分別為地市級供電單位、區(qū)縣級供電單位和搶修單位等級劃分方法,其中Y為日搶修工單數(shù)量,N11、N12、N13、N21、N22、N23、N31、N32、N33為各等級區(qū)間邊界值。
4 算法模型驗證
為驗證預(yù)測算法的準確性,選取2017年除夕前后(2016年11月27日至2017年2月27日)的有效數(shù)據(jù)進行驗證。
4.1 地市級供電單位
按正態(tài)分布劃分預(yù)警等級,取a=20,b=30,c=30,d=20,分別預(yù)測2017年1月1日、2017年1月10日、2017年1月27日(除夕)和2017年2月22日的搶修工單數(shù)量,表13中的正確率是各等級預(yù)測值與當日實際值的比較。
4.2 區(qū)縣級供電單位
對部分區(qū)縣級供電單位進行預(yù)測,選取了除夕特殊日類型和晴天、惡劣天氣兩種不同的天氣類型,由于不是全部區(qū)縣,因此不能劃分預(yù)警等級,通過準確率函數(shù)來進行驗證,其計算為:
預(yù)測結(jié)果如表14所示。
4.3 搶修單位
搶修單位的預(yù)測驗證采用與區(qū)縣級供電單位相同的方法,結(jié)果如表15所示。
5 結(jié)束語
本文利用大數(shù)據(jù)挖掘分析技術(shù)研究了一套具擾動特性的滾動基值法的配網(wǎng)搶修工單預(yù)測算法,該方法利用歷史數(shù)據(jù)、天氣數(shù)據(jù)、特定時期等特征因子,通過算法模型的不斷訓(xùn)練與完善,實現(xiàn)了對未來一天的搶修工單量的預(yù)測,準確率高達80%,對實際的電力故障搶修服務(wù)工作的開展起到了強有力的指導(dǎo)作用,是進一步提升電網(wǎng)企業(yè)供電服務(wù)質(zhì)量的催化劑。
參考文獻
[1] 邵峰晶, 于忠清, 王金龍,等. 數(shù)據(jù)挖掘原理與算法[M]. 北京: 中國水利水電出版社,2005.
[2] 趙志剛,張文杰,安宏宇,等. 配網(wǎng)主動搶修關(guān)鍵技術(shù)研究與應(yīng)用[J]. 科技創(chuàng)新與應(yīng)用,2017(5):177.
[3] 蔡金錠,鄢仁武. 基于小波分析與隨機森林算法的電力電子電路故障診斷[J].電力科學(xué)與技術(shù)學(xué)報,2011,26(2): 54-60.
[4] (美)P.M安德遜. 電力系統(tǒng)故障分析[M]. 王際強,胡冰清,任震,等,譯. 電力工業(yè)出版社,1980.
作者信息:
刁柏青1,姚 剛1,潘 筠1,孟祥君1,于善海2,史雙雙2,李 劍2
(1. 國網(wǎng)山東省電力公司運監(jiān)中心,山東 濟南 250001;
2. 山東魯能軟件技術(shù)有限公司,山東 濟南250001)