文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.173985
中文引用格式: 方芳,田世明,卜凡鵬,等. 一種自適應(yīng)選擇樣本的用電負(fù)荷預(yù)測(cè)方法[J].電子技術(shù)應(yīng)用,2017,43(11):18-21,26.
英文引用格式: Fang Fang,Tian Shiming,Bu Fanpeng,et al. An electric load forecasting method based on adaptive selection of samples[J].Application of Electronic Technique,2017,43(11):18-21,26.
0 引言
短期負(fù)荷預(yù)測(cè)是電力系統(tǒng)實(shí)現(xiàn)安全運(yùn)行與經(jīng)濟(jì)調(diào)度的前提與保障[1-3],及時(shí)準(zhǔn)確的預(yù)測(cè)能為電力網(wǎng)絡(luò)運(yùn)行各個(gè)環(huán)節(jié)的管理者及調(diào)度部門提供決策依據(jù),同時(shí)也是實(shí)時(shí)電價(jià)策略制定、電力市場(chǎng)規(guī)劃實(shí)施的基礎(chǔ)。短期負(fù)荷預(yù)測(cè),尤其是未來24小時(shí)的短期預(yù)測(cè),由于負(fù)荷波動(dòng)隨機(jī)性強(qiáng)、影響因素種類眾多、負(fù)荷周期性差異大[4],一直是負(fù)荷預(yù)測(cè)工作中的難點(diǎn)與重點(diǎn)。
影響未來負(fù)荷波動(dòng)狀況的因素眾多,除了氣溫、濕度、降雨量等氣象因素,經(jīng)濟(jì)產(chǎn)業(yè)波動(dòng)、重大節(jié)假日等也與其存在相關(guān)關(guān)系,如何在模型中考慮多種因素而又能消除因素間的多重共線性及樣本數(shù)不足的缺陷,成為研究的阻礙[5-6]。在機(jī)器學(xué)習(xí)領(lǐng)域,嶺回歸技術(shù)恰好對(duì)樣本數(shù)小于特征數(shù)、特征間存在多重共線性這一預(yù)測(cè)場(chǎng)景適用。文獻(xiàn)[7]將主成份分析與嶺回歸結(jié)合進(jìn)行了短期負(fù)荷分析,文獻(xiàn)[7-8]則結(jié)合偏最小二乘與嶺回歸建立了PLSR-RE預(yù)測(cè)模型進(jìn)行中長(zhǎng)期負(fù)荷預(yù)測(cè)。由于缺少特征相似樣本的提取,這些預(yù)測(cè)方法都沒有發(fā)掘出嶺回歸技術(shù)在小樣本多特征情形下相較普通最小二乘回歸的優(yōu)勢(shì)。
面對(duì)短期負(fù)荷預(yù)測(cè)在較短時(shí)期內(nèi)就存在較大非周期性差異的特點(diǎn),固定的預(yù)測(cè)模型即使使用了較多的歷史數(shù)據(jù)做訓(xùn)練,也很可能在預(yù)測(cè)數(shù)周后預(yù)測(cè)效果就大為下降。因此在24小時(shí)負(fù)荷預(yù)測(cè)中,一個(gè)改進(jìn)趨勢(shì)便是依據(jù)預(yù)測(cè)日的某些特征,自適應(yīng)選擇其適用的預(yù)測(cè)模型。自適應(yīng)的思想在人工智能領(lǐng)域應(yīng)用廣泛,自適應(yīng)系統(tǒng)可以從自身的挫折、對(duì)外部世界的觀察和經(jīng)歷中進(jìn)行學(xué)習(xí)[9-14]。當(dāng)條件發(fā)生變化時(shí),它能夠?qū)ψ陨碜龀鱿鄳?yīng)調(diào)整。本文將自適應(yīng)的思想結(jié)合嶺回歸預(yù)測(cè)技術(shù),建立了一套預(yù)測(cè)精度較好的24小時(shí)短期負(fù)荷預(yù)測(cè)模型,并結(jié)合某區(qū)實(shí)際數(shù)據(jù)分析模型的預(yù)測(cè)效果。
1 自適應(yīng)負(fù)荷預(yù)測(cè)原理
自適應(yīng)預(yù)測(cè)的目標(biāo)是針對(duì)不同的預(yù)測(cè)日,通過某種指標(biāo)自動(dòng)比較各種預(yù)測(cè)模型在對(duì)預(yù)測(cè)日進(jìn)行預(yù)測(cè)時(shí)的性能,一方面自適應(yīng)地選擇合適的預(yù)測(cè)方法,另外一方面,還要自適應(yīng)地進(jìn)行模型參數(shù)的尋優(yōu),以實(shí)現(xiàn)自動(dòng)地將具有最優(yōu)參數(shù)的最優(yōu)模型應(yīng)用于下一次預(yù)測(cè)。
通常評(píng)價(jià)預(yù)測(cè)模型的主要指標(biāo)是模型的預(yù)測(cè)精確度,而由于對(duì)待預(yù)測(cè)日的實(shí)際負(fù)荷未知,其實(shí)際預(yù)測(cè)精確度難以估計(jì)。因此在使用自適應(yīng)技術(shù)時(shí),可以考慮使用兩種自適應(yīng)模式:預(yù)測(cè)日特征自適應(yīng)及虛擬預(yù)測(cè)日自適應(yīng)。
預(yù)測(cè)日特征自適應(yīng),即通過預(yù)測(cè)日的特征,如氣象特征、節(jié)假日信息、人流密度等預(yù)報(bào)信息,在歷史日中選擇與預(yù)測(cè)日特征相近的相似日進(jìn)行模型自適應(yīng)訓(xùn)練與尋優(yōu),最終完成預(yù)測(cè)。其優(yōu)點(diǎn)是訓(xùn)練時(shí)間較短,缺點(diǎn)是特征相似日的自適應(yīng)模型可能對(duì)預(yù)測(cè)日精度較差。
虛擬預(yù)測(cè)日自適應(yīng),是首先通過預(yù)測(cè)日的特征,在歷史日中選擇與預(yù)測(cè)日最相近的虛擬預(yù)測(cè)日,通過對(duì)虛擬預(yù)測(cè)日預(yù)測(cè)精度不斷尋優(yōu),得到一個(gè)精度較高的模型用于實(shí)際預(yù)測(cè)日。該預(yù)測(cè)方法優(yōu)點(diǎn)是自適應(yīng)程度高,預(yù)測(cè)效果好,缺點(diǎn)是尋優(yōu)時(shí)間較長(zhǎng),對(duì)虛擬日的尋優(yōu)過程可能造成過擬合而在實(shí)際預(yù)測(cè)中性能下降。
2 嶺回歸與帶交叉驗(yàn)證的嶺回歸
嶺回歸是一種適用于共線性數(shù)據(jù)分析的有偏估計(jì)回歸方法,屬于一種改進(jìn)的最小二乘法。嶺回歸最為經(jīng)典的應(yīng)用場(chǎng)景是不考慮多重共線性,引入較多的影響因素來對(duì)模型進(jìn)行擬合,這一場(chǎng)景下時(shí)常會(huì)造成樣本的特征維度大于樣本的個(gè)數(shù),從而自變量矩陣是不滿秩的,在普通最小二乘法中需要對(duì)自變量自乘矩陣求逆,而該場(chǎng)景下該矩陣接近于奇異,對(duì)其求逆存在很大誤差,而嶺回歸則不會(huì)存在這一問題。
回歸分析中常用的最小二乘法是一種無偏估計(jì),對(duì)于一個(gè)適定問題,X通常是列滿秩的,回歸模型可以表述如下:
其中X為自變量矩陣,θ為回歸參數(shù)矩陣,y為因變量向量。
采用最小二乘法,定義的損失函數(shù)為殘差的平方和,表述如下:
為求取最小化損失,對(duì)上述問題求導(dǎo)后,可得到時(shí)殘差平方和最小化的參數(shù)矩陣:
當(dāng)X不是列滿秩時(shí),或者其某些列之間的線性相關(guān)性較大時(shí),XTX的行列式接近于0,即XTX接近于奇異,上述問題轉(zhuǎn)變?yōu)橐粋€(gè)不適定問題。此時(shí)對(duì)XTX求逆的誤差急劇增大,傳統(tǒng)的最小二乘法表現(xiàn)出非穩(wěn)定性和不可靠性。
為解決上述問題,在上述的損失函數(shù)中加入一個(gè)正則化項(xiàng),即變?yōu)椋?/p>
帶交叉驗(yàn)證的嶺回歸算法則是通過預(yù)先設(shè)定好α的不同取值(通常設(shè)定一個(gè)步長(zhǎng)與范圍,在一定區(qū)間內(nèi)等步長(zhǎng)取值作為α的取值集合),通過對(duì)樣本所有點(diǎn)隨機(jī)劃分訓(xùn)練點(diǎn)的測(cè)試點(diǎn),對(duì)每一個(gè)測(cè)試點(diǎn)遍歷α的取值集合做嶺回歸預(yù)測(cè),最終通過交叉驗(yàn)證選取使整體擬合誤差最小的α值作為最終的嶺回歸模型的α值。
3 模型輸入變量數(shù)值化
對(duì)于一天之后的短期負(fù)荷預(yù)測(cè),影響其負(fù)荷大小的相關(guān)因子主要是星期類型、月份、總體的時(shí)間趨勢(shì)、該日的氣象值、該日相對(duì)于前一日的氣象變化、前一日的負(fù)荷值。將以上因素?cái)?shù)值化表述如下:
星期類型:
其中wi,j表示第i個(gè)氣象類型(如溫度、濕度、氣壓等)在該日第j個(gè)時(shí)點(diǎn)的氣象值。
相對(duì)前一日氣象變化值:
其中wdi,j表示第i個(gè)氣象類型(如溫度、濕度、氣壓等)該日第j個(gè)時(shí)點(diǎn)的值與前一日第j個(gè)時(shí)點(diǎn)的值作差分得到的氣象變化量。
前一日負(fù)荷:
即44+8×m維,m為考慮的氣象因素種類數(shù),假設(shè)考慮4種天氣因素,則模型輸入為236維向量,而在3年的歷史數(shù)據(jù)中選擇的與預(yù)測(cè)日天氣類型相近的訓(xùn)練樣本顯然不會(huì)超過236個(gè),因此需要使用嶺回歸技術(shù)實(shí)現(xiàn)這一預(yù)測(cè)模型。
綜上,對(duì)預(yù)測(cè)日i第k個(gè)時(shí)點(diǎn)負(fù)荷的預(yù)測(cè)模型可寫為:
4 自適應(yīng)預(yù)測(cè)方法
依據(jù)預(yù)測(cè)模型的自適應(yīng)程度,分別建立了模式1至模式3三種預(yù)測(cè)模型。
4.1 模式1:訓(xùn)練所有樣本的RidgeCV回歸模型
該模式即將預(yù)測(cè)日之前所有歷史日的負(fù)荷及相關(guān)因素均用于模型的訓(xùn)練,其基本流程如圖1所示。
模式1的優(yōu)點(diǎn)是方法簡(jiǎn)單、實(shí)現(xiàn)容易,對(duì)每一個(gè)預(yù)測(cè)日只需要使用所用歷史數(shù)據(jù)訓(xùn)練好的一個(gè)模型,從而預(yù)測(cè)速度快。但由于缺乏對(duì)待預(yù)測(cè)日自身特點(diǎn)的針對(duì)性,預(yù)測(cè)效果容易受到整體訓(xùn)練樣本中無關(guān)樣本的干擾,因此可以考慮已經(jīng)不同預(yù)測(cè)日自身特點(diǎn)篩選用于訓(xùn)練的樣本,從而提高訓(xùn)練的效率與針對(duì)性,達(dá)到提高預(yù)測(cè)精度的目的。由此提出模式2的預(yù)測(cè)方法。
4.2 模式2:依據(jù)預(yù)測(cè)日天氣自適應(yīng)選擇最優(yōu)訓(xùn)練樣本訓(xùn)練模型
模式2考慮具體實(shí)現(xiàn)自適應(yīng)預(yù)測(cè)中的依據(jù)預(yù)測(cè)日特征自適應(yīng)方法。具有相同天氣類型與氣象變化情況的日期,其負(fù)荷與天氣因素、前日負(fù)荷變化情況也存在相似性,通過尋找對(duì)預(yù)測(cè)日有較高氣象相似度的歷史日作為訓(xùn)練樣本訓(xùn)練模型,能夠最大程度地排除無關(guān)樣本對(duì)建立預(yù)測(cè)模型的干擾,從而提高最終預(yù)測(cè)模型的準(zhǔn)確性與針對(duì)性。
模式2基本預(yù)測(cè)流程如圖2所示。其相比模式1增加了相關(guān)樣本篩選功能,排除了無關(guān)樣本對(duì)預(yù)測(cè)日的干擾,減少模型訓(xùn)練時(shí)間的同時(shí)提高最終預(yù)測(cè)精度。
4.3 模式3:最小化虛擬日預(yù)測(cè)誤差自適應(yīng)選擇權(quán)重篩選訓(xùn)練樣本的預(yù)測(cè)模型
模式3相比模式2,加入了虛擬預(yù)測(cè)日預(yù)測(cè)的概念,將虛擬預(yù)測(cè)日預(yù)測(cè)誤差極小化作為模型優(yōu)化的目標(biāo),通過優(yōu)化用于篩選的權(quán)重系數(shù)向量ω1、ω2,使得最終用于訓(xùn)練的樣本與預(yù)測(cè)日氣象狀況高度相關(guān),從而最終模型更適用于預(yù)測(cè)日,以提高對(duì)最終預(yù)測(cè)日的預(yù)測(cè)精度。
具體流程如圖3所示。
5 預(yù)測(cè)結(jié)果
通過實(shí)際使用模式2和模式3對(duì)某地區(qū)電網(wǎng)的實(shí)際負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測(cè),同時(shí)與短期負(fù)荷預(yù)測(cè)中精度較高的SVR預(yù)測(cè)方法進(jìn)行精度的比較,分析使用自適應(yīng)技術(shù)后模型的預(yù)測(cè)結(jié)果。
圖4為模式2、模式3與SVR測(cè)試結(jié)果,通過觀察可發(fā)現(xiàn),在對(duì)節(jié)假日與工作日交匯的日期及負(fù)荷變化大的日期的預(yù)測(cè)中,模式2與模式3的預(yù)測(cè)效果要好于支持向量回歸預(yù)測(cè),模式3相比模式2預(yù)測(cè)效果差別不大,但整體的預(yù)測(cè)誤差要小于模式2,其中模式2預(yù)測(cè)MAPE為1.024%,模式3預(yù)測(cè)MAPE為0.978%,SVR預(yù)測(cè)MAPE1.464%,模式2雖然誤差較模式3大,但對(duì)于氣象變化大的預(yù)測(cè)日效果更好,模式3則在負(fù)荷平穩(wěn)時(shí)段預(yù)測(cè)精度最高。
6 結(jié)論
在嶺回歸預(yù)測(cè)模型及自適應(yīng)思想的基礎(chǔ)上,本文提出了一種應(yīng)用虛擬預(yù)測(cè)日方法的自適應(yīng)嶺回歸預(yù)測(cè)模型,并依據(jù)自適應(yīng)程度提出了兩種預(yù)測(cè)模式。模型在實(shí)際運(yùn)用中體現(xiàn)了對(duì)不同類型預(yù)測(cè)日的針對(duì)性,相比常用的SVR預(yù)測(cè)模型精度更高,對(duì)負(fù)荷突變?nèi)盏倪m應(yīng)性更強(qiáng),總體預(yù)測(cè)效果更好。
參考文獻(xiàn)
[1] 康重慶,夏清,劉梅,等.電力系統(tǒng)負(fù)荷預(yù)測(cè)[M].北京:中國(guó)電力出版社,2007.
[2] 牛東曉,曹樹華,趙磊,等.電力負(fù)荷預(yù)測(cè)技術(shù)及其應(yīng)用[M].北京:中國(guó)電力出版社,2009.
[3] 劉晨暉.電力系統(tǒng)負(fù)荷預(yù)報(bào)理論與方法[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,1987.
[4] TAYLOR R C.An overview of the Hadoop/MapReduce/HBase framework and its current applications in bioinformatics[J].BMC Bioinformatics,2010,11(12):S1.
[5] DEAN J,GHEMAWAT S.MapReduce:simplified data processing on large clusters[J].Communications of the ACM,2008,51(1):107-113.
[6] ENE A,IM S,MOSELEY B.Fast clustering using Map-Reduce[C].Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining,ACM,2011:681-689.
[7] 楊卓.基于負(fù)荷混沌特性和最小二乘支持向量機(jī)的短期負(fù)荷預(yù)測(cè)[D].西安:西安理工大學(xué),2008.
[8] 何永秀,王躍錦,楊麗芳,等.基于最小二乘支持向量機(jī)的居民用電預(yù)測(cè)研究[J].電力需求側(cè)管理,2010,12(3):19-23.
[9] WONG P C,SHEN H W,JOHNSON C R,et al.The top 10 challenges in extreme-scale visual analytics[J].IEEE computer graphics and applications,2012,32(4):63.
[10] 顧丹珍,艾芊,陳陳,等.自適應(yīng)神經(jīng)網(wǎng)絡(luò)在負(fù)荷動(dòng)態(tài)建模中的應(yīng)用[J].中國(guó)電機(jī)工程學(xué)報(bào),2007,27(16):31-36.
[11] GUO H,MAO N,YUAN X.Wysiwyg(what you see is what you get)volume visualization[J].Visualization and Computer Graphics,IEEE Transactions on,2011,17(12):2106-2114.
[12] AHRENS J,BRISLAWN K,MARTIN K,et al.Large-scale data visualization using parallel data streaming[J].Computer Graphics and Applications,IEEE,2001,21(4):34-41.
[13] ROSS R B,PETERKA T,SHEN H W,et al.Visualization and parallel I/O at extreme scale[C].Journal of Physics:Conference Series IOP Publishing,2008.
[14] JAGADISH H V,OOI B C,TAN K L,et al.Distance:An adaptive B+-tree based indexing method for nearest neighbor search[J].ACM Transactions on Database Systems(TODS),2005,30(2):364-397.
作者信息:
方 芳1,田世明2,卜凡鵬2,蘇 運(yùn)3
(1.國(guó)網(wǎng)北京市電力公司昌平供電公司,北京102200;
2.中國(guó)電力科學(xué)研究院,北京100192;3.國(guó)網(wǎng)上海市電力公司,上海200437)