《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 測(cè)試測(cè)量 > 設(shè)計(jì)應(yīng)用 > 基于大數(shù)據(jù)平臺(tái)的電采暖用電量預(yù)測(cè)分析
基于大數(shù)據(jù)平臺(tái)的電采暖用電量預(yù)測(cè)分析
2018年電子技術(shù)應(yīng)用第11期
楊 爍,孫欽斐,朱 潔,陳 平
國網(wǎng)北京市電力公司電力科學(xué)研究院,北京100075
摘要: 基于大數(shù)據(jù)平臺(tái),通過實(shí)時(shí)采集每一用戶的傳感器大量的采暖數(shù)據(jù)、用戶行為數(shù)據(jù)以及天氣數(shù)據(jù)和房屋數(shù)據(jù),通過對(duì)數(shù)據(jù)的關(guān)聯(lián)分析、針對(duì)采暖用電量的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè),研究用戶的用電行為,進(jìn)而深入研究用戶端最佳的“煤改電”配套的節(jié)能環(huán)保方案。該研究對(duì)于降低用戶采暖成本以及完善配電網(wǎng)建設(shè)和用戶用電負(fù)荷配置提供數(shù)據(jù)支撐,在實(shí)際的“煤改電”工程中有顯著意義。
中圖分類號(hào): TP393
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.182725
中文引用格式: 楊爍,孫欽斐,朱潔,等. 基于大數(shù)據(jù)平臺(tái)的電采暖用電量預(yù)測(cè)分析[J].電子技術(shù)應(yīng)用,2018,44(11):61-63.
英文引用格式: Yang Shuo,Sun Qinfei,Zhu Jie,et al. Forecast and analysis of electric heating consumption based on big data platform[J]. Application of Electronic Technique,2018,44(11):61-63.
Forecast and analysis of electric heating consumption based on big data platform
Yang Shuo,Sun Qinfei,Zhu Jie,Chen Ping
State Grid Beijing Electric Power Research Institute,Beijing 100075,China
Abstract: This paper proposed a “coal-to-electricity” energy saving system,which collects a large amount of heating data, users′ behavior data, weather data and houses′ data of each user′s sensor in real time, and applies the BP(Back-Propagation Network) to analyze heating power consumption. The system could support data management and analysis easily, and could improve the distribution network construction and users′ configurations, which has significant positive significance in the “coal-to-electricity”project.
Key words : intelligent service platform;intelligent heating APP;real-time monitoring;Spark

0 引言

    近年來,研究人員對(duì)電力用戶分類、用電行為特征等進(jìn)行了一些研究。如,文獻(xiàn)[1]以傳統(tǒng)行業(yè)劃分為基礎(chǔ)提出基于聚類的用戶分類研究;文獻(xiàn)[2]進(jìn)一步將居民電力用戶類型作為研究對(duì)象,并通過云平臺(tái)和聚類算法K-Means相結(jié)合的方式,將居民用戶分為了5類并分析了各類用戶行為;文獻(xiàn)[3]-[6]從用電負(fù)荷的角度出發(fā),對(duì)行業(yè)或家庭用戶進(jìn)行分類,為公司決策提供更有針對(duì)性的參考依據(jù),例如有序用電、峰谷電量,具有一定的實(shí)際意義。研究人員進(jìn)一步討論形成的智能用電策略在有效提高用戶的用電效率,減少家庭能耗,實(shí)現(xiàn)經(jīng)濟(jì)用電的方面很有指導(dǎo)意義。在家庭用戶方面,文獻(xiàn)[7]建立了家庭用戶號(hào)、房屋面積、家庭成員數(shù)、每天用電量、峰谷電量、家用電器數(shù)等的數(shù)據(jù)維度模型,進(jìn)而利用大量家庭用戶用電數(shù)據(jù)進(jìn)行分析挖掘??紤]到用戶負(fù)荷除了受用戶自身作息習(xí)慣和經(jīng)濟(jì)收入等直接因素影響外,還與節(jié)氣、天氣、當(dāng)?shù)刈畹蜌鉁?、重要?jié)假日和地域?qū)傩缘拈g接因素密切相關(guān),文獻(xiàn)[8]-[10]分別考慮上述因素,實(shí)現(xiàn)對(duì)居民用電行為特性的差異化分析,為需求響應(yīng)提供了有效的數(shù)據(jù)支撐,例如峰時(shí)耗電率、負(fù)荷率、谷電系數(shù)、平段的用電量百分比等。

    本文基于大數(shù)據(jù)分析平臺(tái),通過BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法,研究各種因素對(duì)用戶采暖耗電量的影響,建立用戶的采暖用電量預(yù)測(cè)模型,并最終應(yīng)用在北京市“煤改電”工程智能服務(wù)平臺(tái)上。本文充分考慮該工程數(shù)據(jù)體量大,找出影響采暖用電量的關(guān)鍵因素。此研究對(duì)于降低用戶采暖成本以及完善配電網(wǎng)建設(shè)和用戶用電負(fù)荷配置提供數(shù)據(jù)支撐,具有積極意義。

1 智能服務(wù)平臺(tái)架構(gòu)設(shè)計(jì)

    本文中智能服務(wù)平臺(tái)總體架構(gòu)主要分為以下5個(gè)層次:基礎(chǔ)層、數(shù)據(jù)采集層、數(shù)據(jù)分析層、綜合應(yīng)用層、展現(xiàn)層以及統(tǒng)一信息庫,具體如圖1所示。

ck4-t1.gif

    平臺(tái)功能架構(gòu)如圖2所示。

ck4-t2.gif

    用戶通過智能采暖APP實(shí)時(shí)監(jiān)測(cè)家庭采暖設(shè)備、采集設(shè)備,對(duì)異常情況進(jìn)行告警,同時(shí)通過智能采暖APP智能操控采暖設(shè)備,并對(duì)采暖設(shè)備的量費(fèi)信息、補(bǔ)貼信息進(jìn)行便捷查詢,提升供電服務(wù)質(zhì)量。

    企業(yè)通過對(duì)“煤改電”工程的用戶信息、采暖設(shè)備運(yùn)行情況、室內(nèi)溫度、氣象信息等數(shù)據(jù)的采集、運(yùn)算和分析處理,了解用戶的采暖習(xí)慣偏好,提高用戶采暖用電數(shù)據(jù)預(yù)測(cè)的精準(zhǔn)度,同時(shí)結(jié)合區(qū)域負(fù)荷數(shù)據(jù),為完善配電網(wǎng)建設(shè)和用戶負(fù)荷配置提供數(shù)據(jù)支撐。

    值得指出的是,在平臺(tái)底層采用了基于Hadoop的HDFS數(shù)據(jù)存儲(chǔ)以及內(nèi)存計(jì)算引擎Spark的大數(shù)據(jù)技術(shù)。HDFS分布式存儲(chǔ)主要是供Hadoop應(yīng)用程序使用,滿足低成本、高容錯(cuò)、高吞吐等大數(shù)據(jù)處理需求特性。Spark具有構(gòu)架先進(jìn)、運(yùn)算高效、簡(jiǎn)單易用等優(yōu)點(diǎn),同時(shí)可與Hadoop無縫連接,提供整體解決方案。此外Spark在機(jī)器學(xué)習(xí)方面有著天然的優(yōu)勢(shì),在迭代處理計(jì)算方面比Hadoop快100倍,系統(tǒng)具有很好的可擴(kuò)展性。

    樣本數(shù)據(jù)采集通過安裝在選取的典型用戶家中的溫濕度傳感器、電流電壓傳感器,按15 min的間隔頻率進(jìn)行數(shù)據(jù)采集,整個(gè)采暖季采集到上1 000萬條設(shè)備監(jiān)控?cái)?shù)據(jù),結(jié)合氣象數(shù)據(jù)服務(wù)平臺(tái)提供的采暖季歷史氣象記錄數(shù)據(jù),通過ETL工具從采集廠商提供的前置數(shù)據(jù)庫讀取到基于大數(shù)據(jù)的智能服務(wù)平臺(tái)Hive數(shù)據(jù)倉庫中。

    NN模型訓(xùn)練及預(yù)測(cè)流程如圖3所示。主要預(yù)測(cè)分析步驟如下:

ck4-t3.gif

    (1)通過pySpark編寫數(shù)據(jù)清洗的Job任務(wù)程序,對(duì)采集到的異常、缺失、重復(fù)數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,并對(duì)每個(gè)時(shí)間段的耗電電量進(jìn)行統(tǒng)計(jì);

    (2)通過對(duì)收集的特征數(shù)據(jù)進(jìn)行相關(guān)性分析,去除相關(guān)性過低的特征數(shù)據(jù),最終保留相關(guān)性大于0.5的5個(gè)特征數(shù)據(jù);

    (3)對(duì)特征數(shù)據(jù)進(jìn)行規(guī)范化數(shù)據(jù)處理,并將數(shù)據(jù)集拆分為訓(xùn)練集和測(cè)試集兩組;

    (4)利用Spark引擎提供MLLib機(jī)器學(xué)習(xí)庫中的K-Means聚類算法對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行聚類模型分析;

    (5)利用Spark引擎提供MLLib機(jī)器學(xué)習(xí)庫中的線性回歸算法LinearRegression進(jìn)行線性回歸分析;

    (6)利用Spark引擎提供MLLib機(jī)器學(xué)習(xí)庫中的BP神經(jīng)網(wǎng)絡(luò)算法NNbp進(jìn)行模型訓(xùn)練和預(yù)測(cè)分析。

    通過該平臺(tái)能快速地對(duì)數(shù)據(jù)進(jìn)行處理和分析,從而提升數(shù)據(jù)分析和決策效率。

2 BP模型設(shè)計(jì)和配置

    本文采用BP網(wǎng)絡(luò)(Back-Propagation Network)進(jìn)行模型訓(xùn)練和預(yù)測(cè)分析。該BP網(wǎng)絡(luò)由輸入層、隱藏層和輸出層組成。本次研究選用m×k×n的3層BP網(wǎng)絡(luò)模型,網(wǎng)絡(luò)選用S型傳遞函數(shù)f(x)=1/(1+e-x),通過反傳誤差函數(shù)E=Σi(Ti+Oi)2/2(Ti為期望輸出,Oi為網(wǎng)絡(luò)的計(jì)算輸出),不斷調(diào)節(jié)網(wǎng)絡(luò)權(quán)值和閾值使誤差函數(shù)E達(dá)到極小。

    基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法,以“室外溫度、室外濕度、室內(nèi)溫度、用戶房屋面積、人口數(shù)”為自變量,反復(fù)調(diào)節(jié)模型參數(shù),建立預(yù)測(cè)模型。因此輸入層的節(jié)點(diǎn)數(shù)為5,輸出層的節(jié)點(diǎn)數(shù)為1。在網(wǎng)絡(luò)設(shè)計(jì)過程中, 確定隱層神經(jīng)元數(shù)量很重要。過多的隱層神經(jīng)元會(huì)加大網(wǎng)絡(luò)計(jì)算量,容易產(chǎn)生過度擬合問題; 太少的神經(jīng)元個(gè)數(shù)會(huì)影響網(wǎng)絡(luò)性能, 可能達(dá)不到預(yù)期效果。網(wǎng)絡(luò)中隱層神經(jīng)元的數(shù)量與實(shí)際問題的復(fù)雜性、期望誤差的設(shè)置以及輸入和輸出層的神經(jīng)元數(shù)直接相關(guān)。本次實(shí)驗(yàn)在選取隱層神經(jīng)元個(gè)數(shù)的問題上參照了以下的經(jīng)驗(yàn)公式:

    ck4-gs1.gif

其中,n為輸入層神經(jīng)元個(gè)數(shù),m為輸出層神經(jīng)元個(gè)數(shù),a為[1,10]之間的常數(shù)。

    根據(jù)經(jīng)驗(yàn)公式,神經(jīng)元個(gè)數(shù)計(jì)算可取值為4~13之間,在本次實(shí)驗(yàn)中選取隱層神經(jīng)元個(gè)數(shù)為6。Sigmoid可微函數(shù)和線性函數(shù)通常被BP神經(jīng)網(wǎng)絡(luò)采用作為網(wǎng)絡(luò)的激勵(lì)函數(shù)。由于網(wǎng)絡(luò)的輸出歸一到[-1,1]范圍內(nèi),因此預(yù)測(cè)模型選取S 型對(duì)數(shù)函數(shù)tansig作為輸出層神經(jīng)元的激勵(lì)函數(shù)。本次預(yù)測(cè)模型網(wǎng)絡(luò)迭代次數(shù)epochs選定為5 000,期望誤差goal為0.000 1,學(xué)習(xí)速率lr為0.01。

3 實(shí)驗(yàn)和結(jié)果分析

    本文對(duì)北京地區(qū)2017年~2018年實(shí)施了“煤改電”項(xiàng)目的用戶的實(shí)測(cè)數(shù)據(jù)進(jìn)行分析,所選數(shù)據(jù)集中包含:室外溫度、室外濕度、室內(nèi)溫度、用戶房屋面積、人口數(shù)及采暖耗電量。本文選取了實(shí)際使用電采暖大于40日的用戶數(shù)據(jù),對(duì)其進(jìn)行數(shù)據(jù)處理與清洗,預(yù)測(cè)采暖小時(shí)耗電量。對(duì)數(shù)據(jù)歸一化處理得到有效數(shù)據(jù)共24 150條。通過模型計(jì)算得到的用戶采暖耗電量,對(duì)16 180條訓(xùn)練數(shù)據(jù)的預(yù)測(cè)結(jié)果如圖4所示。

ck4-t4.gif

    圖4中列出了根據(jù)采集的特征數(shù)據(jù)計(jì)算得到的采暖負(fù)荷的真實(shí)值及預(yù)測(cè)值。根據(jù)相對(duì)誤差和平均誤差的計(jì)算公式,計(jì)算得到的訓(xùn)練集平均平方誤差為0.821 94。從圖中可以看出,實(shí)際數(shù)據(jù)曲線和預(yù)測(cè)數(shù)據(jù)具有一致性,在用戶實(shí)時(shí)負(fù)荷數(shù)據(jù)完備且真實(shí)的前提下,本研究所采用的預(yù)測(cè)模型能夠有效預(yù)測(cè)24小時(shí)用戶的用電量。隨著實(shí)際數(shù)據(jù)的積累和模型訓(xùn)練精度的提升,最終能夠?qū)崿F(xiàn)對(duì)實(shí)際用戶數(shù)據(jù)的預(yù)測(cè)。

4 結(jié)論

    本文建立了基于大數(shù)據(jù)分析的智能服務(wù)平臺(tái),并利用BP網(wǎng)絡(luò)對(duì)用戶用電量進(jìn)行實(shí)際建模和預(yù)測(cè),該預(yù)測(cè)結(jié)果和實(shí)際數(shù)據(jù)具有一致性。當(dāng)然,實(shí)際的預(yù)測(cè)準(zhǔn)確度不但與外界環(huán)境溫度相關(guān),而且與用戶家庭人口數(shù)、房間大小和使用偏好等特性相關(guān)。因此,針對(duì)當(dāng)前有效數(shù)據(jù)量的不足,能夠通過后續(xù)的數(shù)據(jù)補(bǔ)充,進(jìn)行針對(duì)性建模和預(yù)測(cè),從而進(jìn)一步提升模型的精度,讓系統(tǒng)發(fā)揮更大的價(jià)值。本文所建立的系統(tǒng)已經(jīng)應(yīng)用在北京“煤改電”工程中,對(duì)完善配電網(wǎng)建設(shè)和用戶用電負(fù)荷配置具有顯著價(jià)值。

參考文獻(xiàn)

[1] 馮曉蒲.基于實(shí)際負(fù)荷曲線的電力用戶分類技術(shù)研究[D].保定:華北電力大學(xué),2011.

[2] 張素香,劉建明,趙丙鎮(zhèn).基于云計(jì)算的居民用電行為分析模型研究[J].電網(wǎng)技術(shù),2013(6):65-69.

[3] 王炳鑫,侯巖,方紅旺.面向“削峰填谷”的電力客戶用電行為分析[J].電信科學(xué),2017,33(5):164-170.

[4] 張鐵峰,顧明迪.電力用戶負(fù)荷模式提取技術(shù)及應(yīng)用綜述[J].電網(wǎng)技術(shù),2016,40(3):804-811.

[5] 孫毅,劉迪,李彬,等.基于家庭用電負(fù)荷關(guān)聯(lián)度的實(shí)時(shí)優(yōu)化策略[J].電網(wǎng)技術(shù),2016,40(6):1825-1829.

[6] 孫毅,馮云,崔燦.基于動(dòng)態(tài)自適應(yīng)K均值聚類的電力用戶負(fù)荷編碼與行為分析[J].電力科學(xué)與技術(shù)學(xué)報(bào),2017,32(3):3-8.

[7] 趙莉,候興哲,胡君.基于改進(jìn)k-means算法的海量智能用電數(shù)據(jù)分析[J].電網(wǎng)技術(shù),2014(10):104-109.

[8] 李樂,辛江.北京農(nóng)村“煤改電”用戶負(fù)荷分析及供電策略[J].中國電力企業(yè)管理,2017(10):56-58.

[9] 劉旭,羅滇生,姚建剛.基于負(fù)荷分解和實(shí)時(shí)氣象因素的短期負(fù)荷預(yù)測(cè)[J].電網(wǎng)技術(shù),2009(12):98-104.

[10] 蘇適,李康平,嚴(yán)玉廷.基于密度空間聚類和引力搜索算法的居民負(fù)荷用電模式分類模型[J].電力自動(dòng)化設(shè)備,2018 (1):129-136.



作者信息:

楊  爍,孫欽斐,朱  潔,陳  平

(國網(wǎng)北京市電力公司電力科學(xué)研究院,北京100075)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。