《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于密度聚類的能耗數(shù)據(jù)采集網(wǎng)關(guān)設(shè)計(jì)
基于密度聚類的能耗數(shù)據(jù)采集網(wǎng)關(guān)設(shè)計(jì)
2018年電子技術(shù)應(yīng)用第6期
王 平,于祥春
重慶郵電大學(xué) 自動(dòng)化學(xué)院,重慶400065
摘要: 現(xiàn)有用電信息采集網(wǎng)絡(luò)集中器不具備對異常用電量進(jìn)行檢測功能,導(dǎo)致主站對異常用電行為分析與響應(yīng)滯后。設(shè)計(jì)一款具備異常檢測功能的用電信息采集網(wǎng)關(guān),將網(wǎng)關(guān)安裝在集中器側(cè)對集中器能耗數(shù)據(jù)進(jìn)行異常分析是應(yīng)對該問題的有效解決方案。根據(jù)用電信息采集網(wǎng)絡(luò)的特征和相關(guān)電網(wǎng)規(guī)約,網(wǎng)關(guān)通過構(gòu)造數(shù)據(jù)幀查詢主站地址池配置自身地址;基于密度聚類DBSCAN算法和決策樹C4.5算法對異常用電行為進(jìn)行判斷。實(shí)驗(yàn)結(jié)果表明,該網(wǎng)關(guān)能夠快速地對自身地址進(jìn)行配置并對能耗數(shù)據(jù)進(jìn)行異常分析。
中圖分類號(hào): TP391
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.174797
中文引用格式: 王平,于祥春. 基于密度聚類的能耗數(shù)據(jù)采集網(wǎng)關(guān)設(shè)計(jì)[J].電子技術(shù)應(yīng)用,2018,44(6):35-38,43.
英文引用格式: Wang Ping, Yu Xiangchun. Design of power information collection gateway based on density clustering[J]. Application of Electronic Technique,2018,44(6):35-38,43.
Design of power information collection gateway based on density clustering
Wang Ping,Yu Xiangchun
School of Automation,Chongqing University of Posts and Telecommunications,Chongqing 400065,China
Abstract: Existing power collection network concentrator doesn′t have ability to detect abnormal power load, which leads the main station of abnormal electricity behavior analysis and response lag. An information collection gateway with anomaly detection function is designed. Installing the gateway on the concentrator side to conduct anomaly analysis of the energy consumption data of the concentrator is an effective solution to the problem. According to the characteristics of the information collection network and the relevant grid regulations, the gateway constructs its own address by constructing the data frame to query the address pool from the master station. The abnormal electric behavior is judged based on the density clustering DBSCAN algorithm and the decision tree C4.5 algorithm. Test results show that the gateway can quickly configure its own address and conduct anomaly analysis of energy consumption data.
Key words : acquisition gateway;anomaly detection;energy consumption data;address configuration;DBSCAN algorithm

0 引言

    隨著網(wǎng)絡(luò)技術(shù)的進(jìn)步與發(fā)展,將無線抄表系統(tǒng)應(yīng)用于電力行業(yè)已然成為一種趨勢[1]。集中器作為用電信息采集系統(tǒng)中的重要節(jié)點(diǎn),是實(shí)現(xiàn)主站與采集節(jié)點(diǎn)的通信橋梁[2]。集中器作為中介轉(zhuǎn)發(fā)設(shè)備,缺乏對用電數(shù)據(jù)進(jìn)行分析的能力,導(dǎo)致主站對用電行為分析和響應(yīng)的滯后[3]。為了能夠在用戶側(cè)實(shí)現(xiàn)對能耗采集數(shù)據(jù)的分析與處理,采用該網(wǎng)關(guān)對集中器進(jìn)行接入管理,獲取各集中器的能耗數(shù)據(jù)并進(jìn)行分類存儲(chǔ)與分析,以解決主站對異常用電滯后的問題。

    目前,諸多學(xué)者針對用電信息采集系統(tǒng)及異常能耗數(shù)據(jù)分析提出了多種解決方案。文獻(xiàn)[3]通過構(gòu)造關(guān)聯(lián)規(guī)則,提出了一種基于密度聚類DBSCAN算法,用于識(shí)別離群點(diǎn)的用電模式。文獻(xiàn)[4]通過軟、硬件的協(xié)同配合,實(shí)現(xiàn)了集中器與控制終端和遠(yuǎn)程管理中心快速、可靠的通信。文獻(xiàn)[5]中的用電信息采集系統(tǒng)側(cè)重于需求管理和響應(yīng),分析了用戶用電行為。文獻(xiàn)[6]基于實(shí)時(shí)性方面的考慮,提出了一種層次化的異常事件檢測系統(tǒng)。以上研究對用電信息采集系統(tǒng)的發(fā)展做出了積極貢獻(xiàn)。

    為解決主站對用電數(shù)據(jù)分析滯后的問題,本文研究了網(wǎng)關(guān)接入用電信息采集系統(tǒng)時(shí)獲取地址的過程;網(wǎng)關(guān)接入用電信息采集網(wǎng)絡(luò)后,讀入集中器能耗數(shù)據(jù)并進(jìn)行分類存儲(chǔ),采用密度聚類DBSCAN算法[7-8]得出離群點(diǎn)集合,并通過決策樹C4.5算法[9-10]得出離群點(diǎn)數(shù)據(jù)對應(yīng)的用電行為。

1 網(wǎng)關(guān)獲取節(jié)點(diǎn)地址

    網(wǎng)關(guān)與主站通信在應(yīng)用層應(yīng)滿足376.1電網(wǎng)規(guī)約[11],該規(guī)約對數(shù)據(jù)域地址進(jìn)行規(guī)定,其地址由3部分組成:2 B行政區(qū)劃碼A1、2 B終端地址A2和1 B主站地址和組地址標(biāo)志A3。

    網(wǎng)關(guān)接入用電信息采集網(wǎng)絡(luò),獲取節(jié)點(diǎn)地址的流程如下:網(wǎng)關(guān)通過構(gòu)建數(shù)據(jù)幀,向主站發(fā)送地址查詢命令,獲取地址A,其由2 B的行政區(qū)劃碼A1和2 B的終端地址A2構(gòu)成,地址格式如圖1所示。

qrs2-t1.gif

    網(wǎng)關(guān)與主站進(jìn)行通信的過程中,主站根據(jù)網(wǎng)關(guān)節(jié)點(diǎn)地址構(gòu)建數(shù)據(jù)幀地址域,包括地址段A1、A2和A3。在單播情況下,A1、A2直接從目標(biāo)集中器地址A中獲取,A3為主站地址和組地址標(biāo)志。A3的D0位為終端組地址標(biāo)志,D0為0時(shí)表示終端地址A2為單地址;D0為1時(shí)表示終端地址A2為組地址;A3的D1~D7組成0~127個(gè)主站地址MSA,其中數(shù)據(jù)幀地址域格式如圖2所示。

qrs2-t2.gif

2 網(wǎng)關(guān)關(guān)鍵軟硬件設(shè)計(jì)

    網(wǎng)關(guān)基于ARM11和Linux操作系統(tǒng)[12]進(jìn)行設(shè)計(jì),采用輕量級的SQLite3數(shù)據(jù)庫對相關(guān)能耗數(shù)據(jù)及用戶信息進(jìn)行存儲(chǔ)。對用電信息采集數(shù)據(jù)進(jìn)行分析需要基于一定規(guī)模的歷史數(shù)據(jù),考慮到存儲(chǔ)容量、網(wǎng)關(guān)規(guī)格和成本等因素,采用SD卡進(jìn)行內(nèi)存擴(kuò)展。選取BOA服務(wù)器作為網(wǎng)關(guān)的Web服務(wù)器程序,在網(wǎng)關(guān)上實(shí)現(xiàn)簡單的網(wǎng)頁查看功能。

2.1 外擴(kuò)存儲(chǔ)模塊設(shè)計(jì)

    在網(wǎng)關(guān)上實(shí)現(xiàn)對用電信息采集數(shù)據(jù)的分析,需要基于一定的歷史數(shù)據(jù),網(wǎng)關(guān)需要存儲(chǔ)一定數(shù)量的數(shù)據(jù),而網(wǎng)關(guān)自身內(nèi)存有限,所以需要擴(kuò)大用電信息采集網(wǎng)關(guān)的存儲(chǔ)能力,SD卡與S3C6410中的SDIO0接口的原理圖如圖3所示。

qrs2-t3.gif

2.2 SQLite3數(shù)據(jù)庫的設(shè)計(jì)

    SQLite3是一個(gè)嵌入式數(shù)據(jù)庫,其存儲(chǔ)后端采用Btree實(shí)現(xiàn)。SQLite在硬盤上一個(gè)數(shù)據(jù)庫一個(gè)文件,每個(gè)數(shù)據(jù)庫文件頭部保存有這個(gè)數(shù)據(jù)庫的元信息,包括版本、大小、Btree根節(jié)點(diǎn)位置等。

    數(shù)據(jù)庫可以高效、安全、大批量地對數(shù)據(jù)進(jìn)行管理,將SQLite3數(shù)據(jù)庫移植到本網(wǎng)關(guān)中以實(shí)現(xiàn)對能耗數(shù)據(jù)的分析。根據(jù)用電異常量分析算法對數(shù)據(jù)類型的需求進(jìn)行存儲(chǔ),包括能耗類型、相對頻率、用戶類型、環(huán)境溫度等。

2.3 BOA服務(wù)器程序的設(shè)計(jì)

    本網(wǎng)關(guān)采用BOA服務(wù)器Web程序搭載后臺(tái)管理界面,前端界面采用AJAX技術(shù)與服務(wù)器中的CGI程序進(jìn)行交互,后臺(tái)管理網(wǎng)頁設(shè)計(jì)架構(gòu)如圖4所示。

qrs2-t4.gif

    用電信息采集網(wǎng)關(guān)Web網(wǎng)頁中的主要功能包括以下3個(gè)方面:

    (1)查詢能耗信息:通過曲線對能耗信息進(jìn)行顯示,可以查看用戶時(shí)、日、月的用電信息等情況。

    (2)查看網(wǎng)關(guān)狀態(tài):主要顯示當(dāng)前數(shù)據(jù)庫的可用空間、與服務(wù)器間的通信狀況及接入的集中器信息。

    (3)查看能耗數(shù)據(jù)分析:可查看歷史能耗信息及異常情況下的數(shù)據(jù)情況。

3 用電信息異常分析算法

3.1 密度聚類算法

    網(wǎng)關(guān)將集中器上傳的能耗數(shù)據(jù)進(jìn)行備份,以進(jìn)行及時(shí)分析。對用電時(shí)段進(jìn)行劃分,將工作日劃分為黑、白兩個(gè)時(shí)段,將周末劃分為早、中、晚3個(gè)時(shí)段,各時(shí)段的時(shí)間跨度可根據(jù)用戶類型及其生活作息習(xí)慣進(jìn)行調(diào)整。在相同日期類型和時(shí)間段內(nèi),人們的用電行為比較類似,用電數(shù)據(jù)具有較小的波動(dòng)性,采用密度聚類DBSCAN算法獲取異常用電數(shù)據(jù)。

qrs2-gs1-5.gif

3.2 異常量的獲取

    將不同日期類型和時(shí)間段的數(shù)據(jù)作為一個(gè)能耗數(shù)據(jù)單元,針對不同的數(shù)據(jù)單元采用不同的參數(shù)Eps和MinPts。參數(shù)的選擇效率直接決定了該網(wǎng)關(guān)的質(zhì)量,采用文獻(xiàn)[13]提出的根據(jù)KNN分布算法與數(shù)學(xué)統(tǒng)計(jì)分析使網(wǎng)關(guān)自行計(jì)算各個(gè)數(shù)據(jù)單元中參數(shù)Eps與MinPts的值。

qrs2-gs6.gif

3.3 異常量分析

    以一定周期對用電數(shù)據(jù)進(jìn)行采集,同時(shí)采集溫度、日期類型和用電狀態(tài)(是否有異常,是何種異常),并將采集的數(shù)據(jù)存放在data.db文件中。采用決策樹C4.5算法對歷史數(shù)據(jù)及對應(yīng)的用電行為進(jìn)行訓(xùn)練。調(diào)入通過DBSCAN算法獲取的各個(gè)數(shù)據(jù)單元的噪聲點(diǎn)集合qrs2-gs6-x1.gif根據(jù)決策樹C4.5算法得出各噪聲點(diǎn)所對應(yīng)的異常用電行為,并通過相應(yīng)的機(jī)制采取對應(yīng)的措施。然后根據(jù)實(shí)際調(diào)查驗(yàn)證通過決策樹C4.5算法得出的結(jié)論是否正確,如果不正確將實(shí)際用電行為替代判斷用電行為。

4 測試與分析

4.1 實(shí)驗(yàn)平臺(tái)的搭建

    搭建測試環(huán)境,所需設(shè)備與模塊如表1所示。

qrs2-b1.gif

    采用2個(gè)集中器分別與16個(gè)采集節(jié)點(diǎn)通過470 MHz構(gòu)建無線抄表網(wǎng)絡(luò),網(wǎng)關(guān)通過交換機(jī)與集中器和主站(筆記本電腦)相連,集中器通過交換機(jī)接入網(wǎng)關(guān)。一個(gè)集中器采集子網(wǎng)放置在距離網(wǎng)關(guān)較近的地方,另一個(gè)集中器采集子網(wǎng)放置在較遠(yuǎn)的地方,并且將兩個(gè)集中器采集子網(wǎng)設(shè)置為不同的通信信道,將一個(gè)子網(wǎng)內(nèi)節(jié)點(diǎn)的信道設(shè)置為9,另一個(gè)子網(wǎng)內(nèi)節(jié)點(diǎn)的信道設(shè)置為14,以防止采集節(jié)點(diǎn)之間的相互干擾。

4.2 網(wǎng)關(guān)獲取地址的驗(yàn)證

    網(wǎng)關(guān)上電后,向主站發(fā)送地址查詢主站的行政區(qū)劃碼A1和管理的網(wǎng)關(guān)數(shù)量配置自身地址,通過串口調(diào)試助手打印網(wǎng)關(guān)地址信息。打印結(jié)果為00000001,前兩個(gè)字節(jié)為行政區(qū)劃碼A1,與主站保持一致;由于在網(wǎng)關(guān)接入主站時(shí)主站僅有網(wǎng)關(guān)這一個(gè)節(jié)點(diǎn),因此終端地址A2為0001,其打印信息如圖5所示。

qrs2-t5.gif

4.3 異常分析模塊的驗(yàn)證

    將用電數(shù)據(jù)進(jìn)行分段,并歸一化至溫度為25 ℃的情況下,通過KNN分布算法和數(shù)據(jù)統(tǒng)計(jì)算法實(shí)現(xiàn)對參數(shù)Eps與MinPts的自行計(jì)算,提高了網(wǎng)關(guān)的運(yùn)行效率。

    根據(jù)不同日期類型和用戶的用電習(xí)慣將一天的用電數(shù)據(jù)進(jìn)行分段劃分,分別對工作日和周末的不同時(shí)間段的用電數(shù)據(jù)進(jìn)行聚類,并將節(jié)假日通過節(jié)假日因子歸并為周末進(jìn)行聚類,采用DBSCAN算法能夠準(zhǔn)確判斷新讀入的用電信息是否為噪聲點(diǎn)。通過決策樹C4.5算法對歷史數(shù)據(jù)分時(shí)段和日期類型進(jìn)行訓(xùn)練,能夠準(zhǔn)確判定噪聲點(diǎn)的異常用電行為。

    以工作日、周末和節(jié)假日對用電日期進(jìn)行歸類,并將節(jié)假日歸并為周末,使得在各自的用電類別中人們的用電習(xí)慣具有較高的相似性,采用決策樹C4.5算法可以得到更為準(zhǔn)確的結(jié)果。將周末和工作日的用電數(shù)據(jù)根據(jù)人們的用電習(xí)慣的不同分為不同的區(qū)間單元,使得在各個(gè)時(shí)段內(nèi)用電數(shù)據(jù)波動(dòng)幅度較小,提高了DBSCAN算法的準(zhǔn)確性。

5 結(jié)論

    本網(wǎng)關(guān)結(jié)合用電信息采集網(wǎng)絡(luò)特征,基于相關(guān)電網(wǎng)規(guī)約構(gòu)造數(shù)據(jù)查詢幀,配置網(wǎng)關(guān)自身地址,實(shí)現(xiàn)網(wǎng)關(guān)對集中器的接入管理。通過對外擴(kuò)存儲(chǔ)拓展程序、SQLite3數(shù)據(jù)庫程序、BOA服務(wù)器程序的設(shè)計(jì)和移植以及異常檢測單元塊的設(shè)計(jì),完成網(wǎng)關(guān)在數(shù)據(jù)存儲(chǔ)和異常檢測功能。本文所采用的查詢主站地址池方法可以高效地配置網(wǎng)關(guān)自身地址;網(wǎng)關(guān)采用SQLite3數(shù)據(jù)庫實(shí)現(xiàn)對能耗數(shù)據(jù)的有效存儲(chǔ),通過采用DBSCAN算法和決策樹C4.5算法實(shí)現(xiàn)對采集數(shù)據(jù)的異常用電行為的判斷,解決了主站對能耗數(shù)據(jù)分析滯后的問題。

參考文獻(xiàn)

[1] 孫宏斌,郭慶來,潘昭光.能源互聯(lián)網(wǎng):理念、架構(gòu)與前沿展望[J].電力系統(tǒng)自動(dòng)化,2015(19):1-8.

[2] 佟為明,張希棟,李中偉,等.基于橢圓曲線密碼的數(shù)據(jù)集中器通信報(bào)文混合密碼算法[J].電力系統(tǒng)自動(dòng)化,2014,38(4):86-91.

[3] 田力,向敏.基于密度聚類技術(shù)的電力系統(tǒng)用電量異常分析算法[J].電力系統(tǒng)自動(dòng)化,2017(5):64-70.

[4] 向敏,王時(shí)賀,趙星宇.一種基于電力載波通信的路燈控制系統(tǒng)集中器的設(shè)計(jì)[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,25(2):161-165.

[5] GELAZANSKAS L,GAMAGE K A A.Demand side management in smart grid:a review and proposals for future direction[J].Sustainable Cities & Society,2014,11(11):22-30.

[6] LEE S C,NEVATIA R.Hierarchical abnormal event detection by real time and semi-real time multi-tasking video surveillance system[J].Machine Vision & Applications,2014,25(1):133-143.

[7] 韓利釗,錢雪忠,羅靖,等.基于區(qū)域劃分的DBSCAN多密度聚類算法[J/OL].[2017-06-04].http://www.arocmag.com/article/02-2018-06-047.html.

[8] MALHOTRA A,BAJAJ K.A hybrid pattern based text mining approach for malware detection using DBScan[J].CSI Transactions on ICT,2016,4(2-4):141-149.

[9] 苗煜飛,張霄宏.決策樹C4.5算法的優(yōu)化與應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(13):255-258.

[10] MANTAS C J,ABELLAN J,CASTELLANO J G. Analysis of Credal-C4.5 for classification in noisy domains[J].Expert Systems with Applications,2016,61:314-326.

[11] Q/GDW 376.1-2013.電力用戶用電信息采集系統(tǒng)通信協(xié)議[S].北京:國家電網(wǎng)公司,2013.

[12] 劉煒,毛建鑫,梁磊,等.一種基于ARM的集中器的硬件實(shí)現(xiàn)[J].電子技術(shù)應(yīng)用,2014,40(1):86-89.

[13] 周治平,王杰鋒,朱書偉,等.一種改進(jìn)的自適應(yīng)快速AF-DBSCAN聚類算法[J].智能系統(tǒng)學(xué)報(bào),2016,11(1):93-98.



作者信息:

王  平,于祥春

(重慶郵電大學(xué) 自動(dòng)化學(xué)院,重慶400065)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。