文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.174797
中文引用格式: 王平,于祥春. 基于密度聚類的能耗數(shù)據(jù)采集網(wǎng)關(guān)設(shè)計(jì)[J].電子技術(shù)應(yīng)用,2018,44(6):35-38,43.
英文引用格式: Wang Ping, Yu Xiangchun. Design of power information collection gateway based on density clustering[J]. Application of Electronic Technique,2018,44(6):35-38,43.
0 引言
隨著網(wǎng)絡(luò)技術(shù)的進(jìn)步與發(fā)展,將無線抄表系統(tǒng)應(yīng)用于電力行業(yè)已然成為一種趨勢[1]。集中器作為用電信息采集系統(tǒng)中的重要節(jié)點(diǎn),是實(shí)現(xiàn)主站與采集節(jié)點(diǎn)的通信橋梁[2]。集中器作為中介轉(zhuǎn)發(fā)設(shè)備,缺乏對用電數(shù)據(jù)進(jìn)行分析的能力,導(dǎo)致主站對用電行為分析和響應(yīng)的滯后[3]。為了能夠在用戶側(cè)實(shí)現(xiàn)對能耗采集數(shù)據(jù)的分析與處理,采用該網(wǎng)關(guān)對集中器進(jìn)行接入管理,獲取各集中器的能耗數(shù)據(jù)并進(jìn)行分類存儲(chǔ)與分析,以解決主站對異常用電滯后的問題。
目前,諸多學(xué)者針對用電信息采集系統(tǒng)及異常能耗數(shù)據(jù)分析提出了多種解決方案。文獻(xiàn)[3]通過構(gòu)造關(guān)聯(lián)規(guī)則,提出了一種基于密度聚類DBSCAN算法,用于識(shí)別離群點(diǎn)的用電模式。文獻(xiàn)[4]通過軟、硬件的協(xié)同配合,實(shí)現(xiàn)了集中器與控制終端和遠(yuǎn)程管理中心快速、可靠的通信。文獻(xiàn)[5]中的用電信息采集系統(tǒng)側(cè)重于需求管理和響應(yīng),分析了用戶用電行為。文獻(xiàn)[6]基于實(shí)時(shí)性方面的考慮,提出了一種層次化的異常事件檢測系統(tǒng)。以上研究對用電信息采集系統(tǒng)的發(fā)展做出了積極貢獻(xiàn)。
為解決主站對用電數(shù)據(jù)分析滯后的問題,本文研究了網(wǎng)關(guān)接入用電信息采集系統(tǒng)時(shí)獲取地址的過程;網(wǎng)關(guān)接入用電信息采集網(wǎng)絡(luò)后,讀入集中器能耗數(shù)據(jù)并進(jìn)行分類存儲(chǔ),采用密度聚類DBSCAN算法[7-8]得出離群點(diǎn)集合,并通過決策樹C4.5算法[9-10]得出離群點(diǎn)數(shù)據(jù)對應(yīng)的用電行為。
1 網(wǎng)關(guān)獲取節(jié)點(diǎn)地址
網(wǎng)關(guān)與主站通信在應(yīng)用層應(yīng)滿足376.1電網(wǎng)規(guī)約[11],該規(guī)約對數(shù)據(jù)域地址進(jìn)行規(guī)定,其地址由3部分組成:2 B行政區(qū)劃碼A1、2 B終端地址A2和1 B主站地址和組地址標(biāo)志A3。
網(wǎng)關(guān)接入用電信息采集網(wǎng)絡(luò),獲取節(jié)點(diǎn)地址的流程如下:網(wǎng)關(guān)通過構(gòu)建數(shù)據(jù)幀,向主站發(fā)送地址查詢命令,獲取地址A,其由2 B的行政區(qū)劃碼A1和2 B的終端地址A2構(gòu)成,地址格式如圖1所示。
網(wǎng)關(guān)與主站進(jìn)行通信的過程中,主站根據(jù)網(wǎng)關(guān)節(jié)點(diǎn)地址構(gòu)建數(shù)據(jù)幀地址域,包括地址段A1、A2和A3。在單播情況下,A1、A2直接從目標(biāo)集中器地址A中獲取,A3為主站地址和組地址標(biāo)志。A3的D0位為終端組地址標(biāo)志,D0為0時(shí)表示終端地址A2為單地址;D0為1時(shí)表示終端地址A2為組地址;A3的D1~D7組成0~127個(gè)主站地址MSA,其中數(shù)據(jù)幀地址域格式如圖2所示。
2 網(wǎng)關(guān)關(guān)鍵軟硬件設(shè)計(jì)
網(wǎng)關(guān)基于ARM11和Linux操作系統(tǒng)[12]進(jìn)行設(shè)計(jì),采用輕量級的SQLite3數(shù)據(jù)庫對相關(guān)能耗數(shù)據(jù)及用戶信息進(jìn)行存儲(chǔ)。對用電信息采集數(shù)據(jù)進(jìn)行分析需要基于一定規(guī)模的歷史數(shù)據(jù),考慮到存儲(chǔ)容量、網(wǎng)關(guān)規(guī)格和成本等因素,采用SD卡進(jìn)行內(nèi)存擴(kuò)展。選取BOA服務(wù)器作為網(wǎng)關(guān)的Web服務(wù)器程序,在網(wǎng)關(guān)上實(shí)現(xiàn)簡單的網(wǎng)頁查看功能。
2.1 外擴(kuò)存儲(chǔ)模塊設(shè)計(jì)
在網(wǎng)關(guān)上實(shí)現(xiàn)對用電信息采集數(shù)據(jù)的分析,需要基于一定的歷史數(shù)據(jù),網(wǎng)關(guān)需要存儲(chǔ)一定數(shù)量的數(shù)據(jù),而網(wǎng)關(guān)自身內(nèi)存有限,所以需要擴(kuò)大用電信息采集網(wǎng)關(guān)的存儲(chǔ)能力,SD卡與S3C6410中的SDIO0接口的原理圖如圖3所示。
2.2 SQLite3數(shù)據(jù)庫的設(shè)計(jì)
SQLite3是一個(gè)嵌入式數(shù)據(jù)庫,其存儲(chǔ)后端采用Btree實(shí)現(xiàn)。SQLite在硬盤上一個(gè)數(shù)據(jù)庫一個(gè)文件,每個(gè)數(shù)據(jù)庫文件頭部保存有這個(gè)數(shù)據(jù)庫的元信息,包括版本、大小、Btree根節(jié)點(diǎn)位置等。
數(shù)據(jù)庫可以高效、安全、大批量地對數(shù)據(jù)進(jìn)行管理,將SQLite3數(shù)據(jù)庫移植到本網(wǎng)關(guān)中以實(shí)現(xiàn)對能耗數(shù)據(jù)的分析。根據(jù)用電異常量分析算法對數(shù)據(jù)類型的需求進(jìn)行存儲(chǔ),包括能耗類型、相對頻率、用戶類型、環(huán)境溫度等。
2.3 BOA服務(wù)器程序的設(shè)計(jì)
本網(wǎng)關(guān)采用BOA服務(wù)器Web程序搭載后臺(tái)管理界面,前端界面采用AJAX技術(shù)與服務(wù)器中的CGI程序進(jìn)行交互,后臺(tái)管理網(wǎng)頁設(shè)計(jì)架構(gòu)如圖4所示。
用電信息采集網(wǎng)關(guān)Web網(wǎng)頁中的主要功能包括以下3個(gè)方面:
(1)查詢能耗信息:通過曲線對能耗信息進(jìn)行顯示,可以查看用戶時(shí)、日、月的用電信息等情況。
(2)查看網(wǎng)關(guān)狀態(tài):主要顯示當(dāng)前數(shù)據(jù)庫的可用空間、與服務(wù)器間的通信狀況及接入的集中器信息。
(3)查看能耗數(shù)據(jù)分析:可查看歷史能耗信息及異常情況下的數(shù)據(jù)情況。
3 用電信息異常分析算法
3.1 密度聚類算法
網(wǎng)關(guān)將集中器上傳的能耗數(shù)據(jù)進(jìn)行備份,以進(jìn)行及時(shí)分析。對用電時(shí)段進(jìn)行劃分,將工作日劃分為黑、白兩個(gè)時(shí)段,將周末劃分為早、中、晚3個(gè)時(shí)段,各時(shí)段的時(shí)間跨度可根據(jù)用戶類型及其生活作息習(xí)慣進(jìn)行調(diào)整。在相同日期類型和時(shí)間段內(nèi),人們的用電行為比較類似,用電數(shù)據(jù)具有較小的波動(dòng)性,采用密度聚類DBSCAN算法獲取異常用電數(shù)據(jù)。
3.2 異常量的獲取
將不同日期類型和時(shí)間段的數(shù)據(jù)作為一個(gè)能耗數(shù)據(jù)單元,針對不同的數(shù)據(jù)單元采用不同的參數(shù)Eps和MinPts。參數(shù)的選擇效率直接決定了該網(wǎng)關(guān)的質(zhì)量,采用文獻(xiàn)[13]提出的根據(jù)KNN分布算法與數(shù)學(xué)統(tǒng)計(jì)分析使網(wǎng)關(guān)自行計(jì)算各個(gè)數(shù)據(jù)單元中參數(shù)Eps與MinPts的值。
3.3 異常量分析
以一定周期對用電數(shù)據(jù)進(jìn)行采集,同時(shí)采集溫度、日期類型和用電狀態(tài)(是否有異常,是何種異常),并將采集的數(shù)據(jù)存放在data.db文件中。采用決策樹C4.5算法對歷史數(shù)據(jù)及對應(yīng)的用電行為進(jìn)行訓(xùn)練。調(diào)入通過DBSCAN算法獲取的各個(gè)數(shù)據(jù)單元的噪聲點(diǎn)集合根據(jù)決策樹C4.5算法得出各噪聲點(diǎn)所對應(yīng)的異常用電行為,并通過相應(yīng)的機(jī)制采取對應(yīng)的措施。然后根據(jù)實(shí)際調(diào)查驗(yàn)證通過決策樹C4.5算法得出的結(jié)論是否正確,如果不正確將實(shí)際用電行為替代判斷用電行為。
4 測試與分析
4.1 實(shí)驗(yàn)平臺(tái)的搭建
搭建測試環(huán)境,所需設(shè)備與模塊如表1所示。
采用2個(gè)集中器分別與16個(gè)采集節(jié)點(diǎn)通過470 MHz構(gòu)建無線抄表網(wǎng)絡(luò),網(wǎng)關(guān)通過交換機(jī)與集中器和主站(筆記本電腦)相連,集中器通過交換機(jī)接入網(wǎng)關(guān)。一個(gè)集中器采集子網(wǎng)放置在距離網(wǎng)關(guān)較近的地方,另一個(gè)集中器采集子網(wǎng)放置在較遠(yuǎn)的地方,并且將兩個(gè)集中器采集子網(wǎng)設(shè)置為不同的通信信道,將一個(gè)子網(wǎng)內(nèi)節(jié)點(diǎn)的信道設(shè)置為9,另一個(gè)子網(wǎng)內(nèi)節(jié)點(diǎn)的信道設(shè)置為14,以防止采集節(jié)點(diǎn)之間的相互干擾。
4.2 網(wǎng)關(guān)獲取地址的驗(yàn)證
網(wǎng)關(guān)上電后,向主站發(fā)送地址查詢主站的行政區(qū)劃碼A1和管理的網(wǎng)關(guān)數(shù)量配置自身地址,通過串口調(diào)試助手打印網(wǎng)關(guān)地址信息。打印結(jié)果為00000001,前兩個(gè)字節(jié)為行政區(qū)劃碼A1,與主站保持一致;由于在網(wǎng)關(guān)接入主站時(shí)主站僅有網(wǎng)關(guān)這一個(gè)節(jié)點(diǎn),因此終端地址A2為0001,其打印信息如圖5所示。
4.3 異常分析模塊的驗(yàn)證
將用電數(shù)據(jù)進(jìn)行分段,并歸一化至溫度為25 ℃的情況下,通過KNN分布算法和數(shù)據(jù)統(tǒng)計(jì)算法實(shí)現(xiàn)對參數(shù)Eps與MinPts的自行計(jì)算,提高了網(wǎng)關(guān)的運(yùn)行效率。
根據(jù)不同日期類型和用戶的用電習(xí)慣將一天的用電數(shù)據(jù)進(jìn)行分段劃分,分別對工作日和周末的不同時(shí)間段的用電數(shù)據(jù)進(jìn)行聚類,并將節(jié)假日通過節(jié)假日因子歸并為周末進(jìn)行聚類,采用DBSCAN算法能夠準(zhǔn)確判斷新讀入的用電信息是否為噪聲點(diǎn)。通過決策樹C4.5算法對歷史數(shù)據(jù)分時(shí)段和日期類型進(jìn)行訓(xùn)練,能夠準(zhǔn)確判定噪聲點(diǎn)的異常用電行為。
以工作日、周末和節(jié)假日對用電日期進(jìn)行歸類,并將節(jié)假日歸并為周末,使得在各自的用電類別中人們的用電習(xí)慣具有較高的相似性,采用決策樹C4.5算法可以得到更為準(zhǔn)確的結(jié)果。將周末和工作日的用電數(shù)據(jù)根據(jù)人們的用電習(xí)慣的不同分為不同的區(qū)間單元,使得在各個(gè)時(shí)段內(nèi)用電數(shù)據(jù)波動(dòng)幅度較小,提高了DBSCAN算法的準(zhǔn)確性。
5 結(jié)論
本網(wǎng)關(guān)結(jié)合用電信息采集網(wǎng)絡(luò)特征,基于相關(guān)電網(wǎng)規(guī)約構(gòu)造數(shù)據(jù)查詢幀,配置網(wǎng)關(guān)自身地址,實(shí)現(xiàn)網(wǎng)關(guān)對集中器的接入管理。通過對外擴(kuò)存儲(chǔ)拓展程序、SQLite3數(shù)據(jù)庫程序、BOA服務(wù)器程序的設(shè)計(jì)和移植以及異常檢測單元塊的設(shè)計(jì),完成網(wǎng)關(guān)在數(shù)據(jù)存儲(chǔ)和異常檢測功能。本文所采用的查詢主站地址池方法可以高效地配置網(wǎng)關(guān)自身地址;網(wǎng)關(guān)采用SQLite3數(shù)據(jù)庫實(shí)現(xiàn)對能耗數(shù)據(jù)的有效存儲(chǔ),通過采用DBSCAN算法和決策樹C4.5算法實(shí)現(xiàn)對采集數(shù)據(jù)的異常用電行為的判斷,解決了主站對能耗數(shù)據(jù)分析滯后的問題。
參考文獻(xiàn)
[1] 孫宏斌,郭慶來,潘昭光.能源互聯(lián)網(wǎng):理念、架構(gòu)與前沿展望[J].電力系統(tǒng)自動(dòng)化,2015(19):1-8.
[2] 佟為明,張希棟,李中偉,等.基于橢圓曲線密碼的數(shù)據(jù)集中器通信報(bào)文混合密碼算法[J].電力系統(tǒng)自動(dòng)化,2014,38(4):86-91.
[3] 田力,向敏.基于密度聚類技術(shù)的電力系統(tǒng)用電量異常分析算法[J].電力系統(tǒng)自動(dòng)化,2017(5):64-70.
[4] 向敏,王時(shí)賀,趙星宇.一種基于電力載波通信的路燈控制系統(tǒng)集中器的設(shè)計(jì)[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,25(2):161-165.
[5] GELAZANSKAS L,GAMAGE K A A.Demand side management in smart grid:a review and proposals for future direction[J].Sustainable Cities & Society,2014,11(11):22-30.
[6] LEE S C,NEVATIA R.Hierarchical abnormal event detection by real time and semi-real time multi-tasking video surveillance system[J].Machine Vision & Applications,2014,25(1):133-143.
[7] 韓利釗,錢雪忠,羅靖,等.基于區(qū)域劃分的DBSCAN多密度聚類算法[J/OL].[2017-06-04].http://www.arocmag.com/article/02-2018-06-047.html.
[8] MALHOTRA A,BAJAJ K.A hybrid pattern based text mining approach for malware detection using DBScan[J].CSI Transactions on ICT,2016,4(2-4):141-149.
[9] 苗煜飛,張霄宏.決策樹C4.5算法的優(yōu)化與應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(13):255-258.
[10] MANTAS C J,ABELLAN J,CASTELLANO J G. Analysis of Credal-C4.5 for classification in noisy domains[J].Expert Systems with Applications,2016,61:314-326.
[11] Q/GDW 376.1-2013.電力用戶用電信息采集系統(tǒng)通信協(xié)議[S].北京:國家電網(wǎng)公司,2013.
[12] 劉煒,毛建鑫,梁磊,等.一種基于ARM的集中器的硬件實(shí)現(xiàn)[J].電子技術(shù)應(yīng)用,2014,40(1):86-89.
[13] 周治平,王杰鋒,朱書偉,等.一種改進(jìn)的自適應(yīng)快速AF-DBSCAN聚類算法[J].智能系統(tǒng)學(xué)報(bào),2016,11(1):93-98.
作者信息:
王 平,于祥春
(重慶郵電大學(xué) 自動(dòng)化學(xué)院,重慶400065)