文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.01.003
引用格式: 黃冠杰. 基于Canopy-Kmeans算法的電力企業(yè)流量數據分析研究[J].信息技術與網絡安全,2022,41(1):18-22.
0 引言
隨著信息化與工業(yè)化的深度融合,各式各樣的信息系統(tǒng)得到了廣泛應用,信息安全問題不斷涌現,關于信息網絡的攻防戰(zhàn)也愈演愈烈。近幾年,國際上不法組織頻繁攻擊電力企業(yè),層出不窮的網絡攻擊可能會導致系統(tǒng)出現故障,造成網絡癱瘓,嚴重時造成大范圍較長時間的電網故障,產生巨大影響和危害。電力系統(tǒng)作為現代社會的關鍵信息基礎設施之一,其產生的大量業(yè)務數據及操作數據,也就自然成為了網絡攻擊的重點目標[1]。建立健全的電力數據分析體系,助力電力企業(yè)識別異常流量,保障電力數據安全迫在眉睫。
目前已有部分企業(yè)和專家針對電力數據的網絡安全進行了研究,高翔[2]等人采用灰色關聯分析和支持向量機算法對電力信息系統(tǒng)網絡安全進行態(tài)勢評估;李群[3]等人提出一種基于“聚類+分類”的惡意攻擊檢測方法,對流量預處理結果進行聚類,基于CART決策樹對攻擊簇實現分類;高鵬[4]等人采用國產密碼、量子密鑰分發(fā)和區(qū)塊鏈技術對電力終端和數據進行保護;劉川[5]等人基于云計算平臺和SDN技術搭建了一體化電力數據安全防護框架,用于身份認證、攻擊防范、入侵檢測。
但目前大部分電力企業(yè)對于收集到的流量數據的挖掘和綜合分析明顯還不夠。若要合理地進行數據分析并分類治理,首先要做到電力企業(yè)流量數據的充分采集,通過對采集到的數據進行ETL(Extract-Transform-Load,抽取-轉換-加載)、挖掘和分析[6-7],最終將分析結果應用于實際安全運維中,做到精準治理。本文以某電力企業(yè)的實際運行環(huán)境為例,首先簡述本文所需的流量數據的數據來源及采集方式,得到其各業(yè)務系統(tǒng)下已有的網絡安全設備中的流量數據,然后分別利用傳統(tǒng)K-means算法與Canopy-Kmeans算法進行流量數據聚類分析,挖掘出攻擊流量與業(yè)務流量的特征項,并排除部分誤報信息。本研究對合理開展網絡安全防護工作具有指導意義。
本文詳細內容請下載:http://ihrv.cn/resource/share/2000003931。
作者信息:
黃冠杰
(對外經濟貿易大學 統(tǒng)計學院,北京100105)