摘 要: 在對(duì)城市燃?xì)庳?fù)荷數(shù)據(jù)特性進(jìn)行分析的基礎(chǔ)上,提出了針對(duì)城市燃?xì)庳?fù)荷量短期預(yù)測(cè)的思想即分解-組合預(yù)測(cè)模型,同時(shí)提出了三種分解方法對(duì)分解-組合預(yù)測(cè)模型進(jìn)行了驗(yàn)證。首先在建模之前運(yùn)用數(shù)據(jù)挖掘的方法對(duì)原始數(shù)據(jù)集進(jìn)行了離群點(diǎn)挖掘與修正;其次,為了驗(yàn)證準(zhǔn)確性,將三種方法的預(yù)測(cè)結(jié)果與其他單一、組合模型預(yù)測(cè)結(jié)果進(jìn)行對(duì)比;最后為了驗(yàn)證該模型的有效性、適用性,對(duì)特殊日期、天氣和其另一組燃?xì)庳?fù)荷量數(shù)據(jù)集進(jìn)行了建模和預(yù)測(cè),通過(guò)對(duì)預(yù)測(cè)值和實(shí)際值的誤差分析,實(shí)驗(yàn)結(jié)果進(jìn)一步驗(yàn)證了分解-組合模型的適應(yīng)性和準(zhǔn)確性。
關(guān)鍵詞: 城市燃?xì)庳?fù)荷量;短期負(fù)荷預(yù)測(cè)方法;BP神經(jīng)網(wǎng)絡(luò);差分自回歸移動(dòng)平均模型;小波分頻;分解-組合模型
城市燃?xì)庳?fù)荷量的準(zhǔn)確預(yù)測(cè)對(duì)于智慧型城市智能化燃?xì)庀到y(tǒng)來(lái)說(shuō)具有重要的作用。傳統(tǒng)上,人們運(yùn)用統(tǒng)計(jì)的方法來(lái)進(jìn)行燃?xì)庳?fù)荷量的預(yù)測(cè)[1,2]。后來(lái)隨著更復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型的出現(xiàn),人們開始將其用于燃?xì)庳?fù)荷量的預(yù)測(cè)[3,4]。近年來(lái),研究者們綜合考慮各單一模型的優(yōu)缺點(diǎn),提出了眾多的組合預(yù)測(cè)模型,但是這些方法大多僅局限于特定的燃?xì)庳?fù)荷量數(shù)據(jù)集的預(yù)測(cè)或者僅適合于特殊情況下的燃?xì)庳?fù)荷的預(yù)測(cè)[5]。
本文在分析前人在短期燃?xì)忸A(yù)測(cè)中提出的算法和產(chǎn)生相應(yīng)誤差的原因,以及對(duì)城市燃?xì)庳?fù)荷量的數(shù)據(jù)特征進(jìn)行分析的基礎(chǔ)上,提出了針對(duì)城市燃?xì)庳?fù)荷量短期預(yù)測(cè)的思想即分解-組合預(yù)測(cè)模型,同時(shí)提出了三種分解方法對(duì)分解-組合預(yù)測(cè)模型進(jìn)行了驗(yàn)證。本文中采用的第一組數(shù)據(jù)樣本來(lái)自于上海市某地區(qū)2005年12月1日至2009年10月31日之間的1 431組數(shù)據(jù),前1 424組數(shù)據(jù)用于建模,后7組數(shù)據(jù)作為測(cè)試樣本。
1 分解-組合思想的提出
本文通過(guò)研究發(fā)現(xiàn)城市燃?xì)庳?fù)荷量序列具有三種主要特性:趨勢(shì)性、周期性和隨機(jī)性。根據(jù)這三種特性,本文提出了針對(duì)城市燃?xì)庳?fù)荷量短期預(yù)測(cè)的思想即分解-組合預(yù)測(cè)模型。具體建模過(guò)程為首先對(duì)原始城市燃?xì)庳?fù)荷量時(shí)間序列進(jìn)行離群點(diǎn)的挖掘與修正,然后對(duì)經(jīng)過(guò)離群點(diǎn)處理的序列進(jìn)行分解,目標(biāo)是按照燃?xì)庳?fù)荷量序列的特性來(lái)進(jìn)行分解,即分解為具有趨勢(shì)性的序列、具有周期性的序列和具有隨機(jī)性的序列;文中提出了三種分解方法即Eviews分解法、小波分頻法和公式分解法,序列分解后再運(yùn)用適合各個(gè)序列特性的算法進(jìn)行預(yù)測(cè);對(duì)趨勢(shì)性序列選取ARIMA進(jìn)行建模預(yù)測(cè),對(duì)周期性和隨機(jī)性序列運(yùn)用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行建模和預(yù)測(cè)。最后將各單一模型的預(yù)測(cè)結(jié)果進(jìn)行組合,得出模型的最終預(yù)測(cè)結(jié)果,同時(shí)將此結(jié)果與實(shí)際燃?xì)庳?fù)荷量進(jìn)行誤差對(duì)比分析。
2 離群點(diǎn)挖掘與修復(fù)
歷史數(shù)據(jù)的獲取中因?yàn)楦鞣N因素會(huì)造成原始數(shù)據(jù)的誤差。有些表現(xiàn)得相當(dāng)明顯,簡(jiǎn)單方法即可識(shí)別,有些則要采用數(shù)據(jù)挖掘方法才可識(shí)別[6,7]。本文的離群點(diǎn)定義:如果一個(gè)孤立點(diǎn)的絕對(duì)值大于它前后連續(xù)3個(gè)點(diǎn)的絕對(duì)值中位數(shù)的4倍就視為離群點(diǎn),即如果TS中的一個(gè)值如下:
通過(guò)統(tǒng)計(jì)分析軟件Eviews對(duì)其進(jìn)行處理,將燃?xì)庳?fù)荷量TS分解為3種TS:趨勢(shì)-循環(huán)序列TC、季節(jié)性因子SF和不規(guī)則要素TR,TR因是不確定因素再次忽略,如圖2、圖3所示。其中TC和SF屬于確定性成分,TR屬于不確定成分(故不做預(yù)測(cè))。
3.1 ARIMA概述與建模
3.1.1 ARIMA概述
ARIMA是一種可用于描述非平穩(wěn)序列的方法,它由自回歸AR(p)、差分I(d)和滑動(dòng)平均MA(q)三部分組成,p表示模型的自回歸階數(shù)、d表示非平穩(wěn)序列轉(zhuǎn)化成平穩(wěn)序列的差分階數(shù)、q表示模型移動(dòng)平均階數(shù)。以p、d、q為參數(shù)的ARIMA(p,d,q)模型為:
3.2 BP神經(jīng)網(wǎng)絡(luò)概述與建模
3.2.1 BP神經(jīng)網(wǎng)絡(luò)概述
BP神經(jīng)網(wǎng)絡(luò)是基于反向傳播算法的多層前向網(wǎng)絡(luò),包括輸入層、隱含層和輸出層,上下層之間實(shí)現(xiàn)全連接,而每層神經(jīng)元之間無(wú)連接。輸入信息從輸入層經(jīng)過(guò)隱含層傳向輸出層,如果在輸出層得不到期望輸出,則反向傳播,將誤差信號(hào)沿原來(lái)通路返回,通過(guò)學(xué)習(xí)來(lái)修改各層神經(jīng)元的權(quán)值,使誤差信號(hào)最小。
3.2.2 BP神經(jīng)網(wǎng)絡(luò)建模和預(yù)測(cè)
本文的神經(jīng)網(wǎng)絡(luò)的輸入神經(jīng)元采用了當(dāng)天的最高氣溫、最低氣溫、當(dāng)天的平均溫度、天氣情況,還有前三天的燃?xì)庳?fù)荷值,將當(dāng)天的燃?xì)庳?fù)荷值作為網(wǎng)絡(luò)的輸出。由樣本的構(gòu)造方法可知,輸入層神經(jīng)元的個(gè)數(shù)為7,輸出層神經(jīng)元的個(gè)數(shù)為1。本文采用試湊法最終確定隱含層神經(jīng)元數(shù)目為15。因此本文采用的神經(jīng)網(wǎng)絡(luò)模型為BP(7,15,1)。在BP神經(jīng)網(wǎng)絡(luò)的輸出層函數(shù)、隱含層函數(shù)以及訓(xùn)練函數(shù)分別選擇了線性-purelin函數(shù)、正切S型神經(jīng)元-tansig函數(shù)和trainlm函數(shù)。最終得到E=-0.0027。預(yù)測(cè)結(jié)果最后進(jìn)行反歸一化處理得到SF的預(yù)測(cè)值。
最終得到的a1的MAPE為0.776%,同樣的預(yù)測(cè)方法得到a2~a5的MAPE分別為0.784%、0.802%、0.821%、0.833%。
對(duì)上述分解得到的細(xì)節(jié)序列di本文采用BP神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行建模和預(yù)測(cè)。其方法和參數(shù)與3.2節(jié)相似。最終得到d1的MAPE為0.001 549%。用同樣的方法預(yù)測(cè)得到d2~d5的MAPE為0.001 77%、0.004 649%、0.000 929 4%、0.000 444 8%。
燃?xì)庳?fù)荷的逼近序列和細(xì)節(jié)序列的預(yù)測(cè)結(jié)果進(jìn)行合成即得到最后的預(yù)測(cè)結(jié)果。
5 公式分解法
5.1 對(duì)趨勢(shì)性的識(shí)別與處理
文中提出了一個(gè)通用的去趨勢(shì)方法:將序列分割成段,段的長(zhǎng)度等于季節(jié)性的長(zhǎng)度即12個(gè)月序列。在各段中每個(gè)歷史觀察值減去各段的歷史觀察值的均值。設(shè){m1,m2,…,mk}是一個(gè)序列的第K段,L是這個(gè)季度的長(zhǎng)度,去趨勢(shì)系列dti和原始序列xi關(guān)系如下:
采用和上述同樣的原理進(jìn)行建模和預(yù)測(cè)。最后為了突顯出分解-組合模型的有效性,將模型和其他幾種預(yù)測(cè)方法的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析,如圖7所示。
對(duì)比可以發(fā)現(xiàn),在總體上分解-組合模型中的小波分解效果最好。對(duì)于溫度和天氣突變以及節(jié)假日等特殊日期的日燃?xì)庳?fù)荷值進(jìn)行預(yù)測(cè)。采用小波分解組合方法進(jìn)行建模和預(yù)測(cè)與其他兩種方法預(yù)測(cè)的結(jié)果進(jìn)行對(duì)比分析,如表1和表2所示。其中MAPE、RESE分別為平均相對(duì)誤差和絕對(duì)值均方根誤差,值越小,預(yù)測(cè)效果越好。
從上述對(duì)比表中可以看出,三種方法中預(yù)測(cè)精度最好的是小波分解法,其次是BP神將網(wǎng)絡(luò),最后是基于信息熵的組合模型。
通過(guò)采用本文提出的分解-組合模型對(duì)城市燃?xì)庳?fù)荷量數(shù)據(jù)進(jìn)行短期的預(yù)測(cè)可以更加準(zhǔn)確有效地預(yù)測(cè)出城市燃?xì)舛唐谪?fù)荷量,從預(yù)測(cè)的燃?xì)庳?fù)荷量與實(shí)際的燃?xì)庳?fù)荷量的對(duì)比可以看出,本文采用方法的預(yù)測(cè)值基本可以滿足日常工程的實(shí)際需求,可以給調(diào)度決策以及調(diào)度員提供有利的參考和幫助。
參考文獻(xiàn)
[1] 竇東陽(yáng),趙英凱.利用ARIMA改進(jìn)HHT端點(diǎn)效應(yīng)的方法[J].震動(dòng)、測(cè)試與診斷,2010,30(3):42-45.
[2] 胡莘,程良倫.一種基于ARIMA的無(wú)線傳感器網(wǎng)絡(luò)鏈路質(zhì)量預(yù)測(cè)方法[J].計(jì)算機(jī)應(yīng)用與軟件,2012,29(6):46-50.
[3] 陳政,楊天奇.基于RBF神經(jīng)網(wǎng)絡(luò)的股票預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2012,29(6):108-111.
[4] 孫莉,翟永超.基于灰色BP神經(jīng)網(wǎng)絡(luò)的服裝面料規(guī)格參數(shù)預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2012,29(7):154-157.
[5] Li Yuhong,Chen Yue.Grey system theory based parallel combination forecast method and its application[A].IEEE International Conference on Grey Systems and Intelligent Services[C].Nanjing:IEEE Computer Society,2009.
[6] ADYA M,COLLOPY F,ARMSTRONG J S,et al.Automatic identification of time series features for rule-based forecasting[J].Int.J.Forecast,2010,17(2):143-157.
[7] Wei Zhongyan.Toward automatic time-series forec-asting using neural networks[J].IEEE Transactions on Neural Networks and Learning Systems,2012,23(7):1028-1039.