《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于Canopy-Kmeans算法的電力企業(yè)流量數據分析研究
基于Canopy-Kmeans算法的電力企業(yè)流量數據分析研究
信息技術與網絡安全 1期
黃冠杰
(對外經濟貿易大學 統(tǒng)計學院,北京100105)
摘要: 針對電力企業(yè)關鍵信息基礎設施大量業(yè)務數據易遭受網絡攻擊的現象,基于各業(yè)務信息系統(tǒng)下已有的網絡安全設備,通過輔助設備采集流量數據,采用Canopy-Kmeans算法進行數據分析研究。首先通過實驗證明了Canopy-Kmeans算法在處理流量數據時,相比傳統(tǒng)K-means算法,具有更好的聚類效果,準確率提高約11%;然后以采集到的電力關鍵業(yè)務系統(tǒng)的流量數據為基礎,基于Canopy-Kmeans算法進行挖掘分析實驗,完成相同類型流量數據的聚類,分析出攻擊流量與業(yè)務流量的特征項,排除部分誤報信息,合理開展網絡安全防護工作。
中圖分類號: TP391.1
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.01.003
引用格式: 黃冠杰. 基于Canopy-Kmeans算法的電力企業(yè)流量數據分析研究[J].信息技術與網絡安全,2022,41(1):18-22.
Research on electric power enterprise flow data analysis based on Canopy-Kmeans algorithm
Huang Guanjie
(School of Statistics,University of International Business and Economics,Beijing 100105,China)
Abstract: Aiming at the phenomenon that a large number of business data of the key information infrastructure of electric power enterprises are vulnerable to network attacks, based on the existing network security equipment under each business information system, the flow data is collected through auxiliary equipment, and Canopy-Kmeans algorithm is used for data analysis and research. Firstly, through experiments, it is proved that the Canopy-Kmeans algorithm has a better clustering effect than the traditional K-means algorithm when processing flow data, and the accuracy rate is increased by about 11%. Then, the collected flow data of the power key business system is used,mining and analysis experiments are conducted based on the Canopy-Kmeans algorithm to complete the clustering of the same type of traffic data, analyze the characteristic items of attack traffic and business traffic, eliminate some misreporting information, and carry out network security protection work reasonably.
Key words : electricity;flow collection;Canopy-Kmeans;clustering;flow data analysis

0 引言

隨著信息化與工業(yè)化的深度融合,各式各樣的信息系統(tǒng)得到了廣泛應用,信息安全問題不斷涌現,關于信息網絡的攻防戰(zhàn)也愈演愈烈。近幾年,國際上不法組織頻繁攻擊電力企業(yè),層出不窮的網絡攻擊可能會導致系統(tǒng)出現故障,造成網絡癱瘓,嚴重時造成大范圍較長時間的電網故障,產生巨大影響和危害。電力系統(tǒng)作為現代社會的關鍵信息基礎設施之一,其產生的大量業(yè)務數據及操作數據,也就自然成為了網絡攻擊的重點目標[1]。建立健全的電力數據分析體系,助力電力企業(yè)識別異常流量,保障電力數據安全迫在眉睫。

目前已有部分企業(yè)和專家針對電力數據的網絡安全進行了研究,高翔[2]等人采用灰色關聯分析和支持向量機算法對電力信息系統(tǒng)網絡安全進行態(tài)勢評估;李群[3]等人提出一種基于“聚類+分類”的惡意攻擊檢測方法,對流量預處理結果進行聚類,基于CART決策樹對攻擊簇實現分類;高鵬[4]等人采用國產密碼、量子密鑰分發(fā)和區(qū)塊鏈技術對電力終端和數據進行保護;劉川[5]等人基于云計算平臺和SDN技術搭建了一體化電力數據安全防護框架,用于身份認證、攻擊防范、入侵檢測。

但目前大部分電力企業(yè)對于收集到的流量數據的挖掘和綜合分析明顯還不夠。若要合理地進行數據分析并分類治理,首先要做到電力企業(yè)流量數據的充分采集,通過對采集到的數據進行ETL(Extract-Transform-Load,抽取-轉換-加載)、挖掘和分析[6-7],最終將分析結果應用于實際安全運維中,做到精準治理。本文以某電力企業(yè)的實際運行環(huán)境為例,首先簡述本文所需的流量數據的數據來源及采集方式,得到其各業(yè)務系統(tǒng)下已有的網絡安全設備中的流量數據,然后分別利用傳統(tǒng)K-means算法與Canopy-Kmeans算法進行流量數據聚類分析,挖掘出攻擊流量與業(yè)務流量的特征項,并排除部分誤報信息。本研究對合理開展網絡安全防護工作具有指導意義。


本文詳細內容請下載:http://ihrv.cn/resource/share/2000003931




作者信息:

黃冠杰

(對外經濟貿易大學 統(tǒng)計學院,北京100105)


此內容為AET網站原創(chuàng),未經授權禁止轉載。