《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 设计应用 > 基于改进Stacking集成分类算法的用户用电信息异常识别
基于改进Stacking集成分类算法的用户用电信息异常识别
2023年电子技术应用第8期
闫相伟,宋国壮,刘怡豪
(重庆邮电大学 通信与信息工程学院,重庆 400065)
摘要: 随着电力用户信息采集系统的发展,更丰富的用户用电信息被用于用户用电信息异常的识别。基于FDI攻击进行虚假数据注入,构造用户用电信息异常数据集,并提出了一种基于召回率的改进Stacking集成分类算法。该算法采用K-近邻算法(k-Nearest Neighbors,KNN)、随机森林模型(Random Forests,RF)、支持向量机(Support Vector Machine,SVM)以及梯度决策树(Gradient Boosting Decision Tree,GBDT)作为Stacking结构的基分类模型;采用逻辑回归(Logistic Regression,LR)作为Stacking结构的元分类模型。并基于召回率为基分类模型的输出结果进行权值赋值,从而作为元分类模型的输入数据集。通过实验验证,所提的基于召回率的改进Stacking集成分类算法相比于传统Stacking集成分类算法拥有更高效的分类性能。
中圖分類號:TP3-0 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.223699
中文引用格式: 閆相偉,宋國壯,劉怡豪. 基于改進(jìn)Stacking集成分類算法的用戶用電信息異常識別[J]. 電子技術(shù)應(yīng)用,2023,49(8):13-18.
英文引用格式: Yan Xiangwei,Song Guozhuang,Liu Yihao. Abnormal identification of user electricity consumption information based on improved stacking integrated classification algorithm[J]. Application of Electronic Technique,2023,49(8):13-18.
Abnormal identification of user electricity consumption information based on improved stacking integrated classification algorithm
Yan Xiangwei,Song Guozhuang,Liu Yihao
(School of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China)
Abstract: With the development of power user information collection system, richer user electricity consumption information is used for the identification of user electricity consumption information anomalies. In this paper, a false data injection based on the FDI attack is performed to construct a dataset of user electricity consumption information anomalies, and an improved stacking integrated classification algorithm based on recall is proposed. K-nearest neighbors algorithm (KNN), random forest model (RF), support vector machine (SVM) and gradient decision tree (GBDT) are used as the scheme of base classification model of the stacking structure. Logistic regression (LR) is used as a meta-classification model of the stacking structure. The output of the basic classification model is weighted based on the recall rate, which is used as the input data set of the meta-classification model. The proposed improved stacking classification algorithm based on recall is shown to be more efficient than the traditional stacking classification algorithm.
Key words : user electricity consumption information;anomaly identification;improved stacking integrated classification algorithm;FDI

0 引言

近年來,隨著電力用戶信息采集系統(tǒng)的發(fā)展和普及,積累了大量高價(jià)值的用戶用電數(shù)據(jù)[1-2]。針對因?yàn)橹悄茈姳硪蜃匀徊豢煽沽?dǎo)致的損壞、用戶惡意篡改或通信網(wǎng)絡(luò)受到攻擊而導(dǎo)致的用戶用電信息異常,建立高效的異常識別模型,減少人力排查工作量,降低經(jīng)濟(jì)損失,被愈發(fā)重視[3]。

在現(xiàn)有的基于機(jī)器學(xué)習(xí)的用電信息異常檢測中,多數(shù)學(xué)者傾向于通過提取樣本的特征,利用機(jī)器學(xué)習(xí)模型挖掘出特征與標(biāo)簽之間隱藏的規(guī)律[4]。文獻(xiàn)[5]提出了DT與SVM的組合模型,將DT的輸出用來訓(xùn)練SVM分類器,達(dá)到了比較理想的結(jié)果。為了突破單一機(jī)器學(xué)習(xí)模型分類性能上限低的情況,文獻(xiàn)[6]提出了基于ISSA-RF的集成學(xué)習(xí)方法,有效提高了異常檢測的準(zhǔn)確性。文獻(xiàn)[7]基于Stacking集成學(xué)習(xí)策略,按時(shí)間多維度拆解用戶日用電量指標(biāo),驗(yàn)證了所提模型的有效性。

基于Stacking集成分類算法,文中提出用電信息異常檢測框架。以異常產(chǎn)生原因緊密相關(guān)的電氣指標(biāo)為基礎(chǔ),通過6種FDI攻擊方式生成異常數(shù)據(jù)集并提取特征,通過實(shí)驗(yàn)驗(yàn)證了Stacking集成分類算法效果高于單個(gè)基分類器。并且提出了一種基于召回率的改進(jìn)Stacking集成分類算法,通過實(shí)驗(yàn)證明了其有效提升了傳統(tǒng)Stacking集成分類算法的分類性能。



本文詳細(xì)內(nèi)容請下載:http://ihrv.cn/resource/share/2000005496




作者信息:

閆相偉,宋國壯,劉怡豪

(重慶郵電大學(xué) 通信與信息工程學(xué)院,重慶 400065)

微信圖片_20210517164139.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容