周明升1,2,韓冬梅1
?。?. 上海財經(jīng)大學 信息管理與工程學院,上海 200433; 2. 上海外高橋保稅區(qū)聯(lián)合發(fā)展有限公司,上海 200131)
摘要:傳統(tǒng)網(wǎng)絡(luò)攻擊檢測方法中,通常使用混沌系統(tǒng)結(jié)合高斯混合模型實現(xiàn)同步控制檢測,當待檢測的攻擊信號具有高斯線性特征時,這種方法的檢測效果理想。隨著網(wǎng)絡(luò)攻擊信號向著非線性隨機序列方向發(fā)展,傳統(tǒng)檢測模型無法實現(xiàn)有效的攻擊檢測。提出一種基于Rossle混沌模型的平均互信息特征潛質(zhì)挖掘算法,并根據(jù)挖掘的互信息這種非線性特征解,實現(xiàn)對具有非線性隨機特性的網(wǎng)絡(luò)攻擊信號有效檢測。根據(jù)Rossle混沌系統(tǒng)基礎(chǔ)模型,采用最小均方誤差準則,設(shè)計一個能去除多個已知干擾頻率成分的自適應(yīng)級聯(lián)陷波器,實現(xiàn)對攻擊信號的濾波預(yù)處理,提取待檢測網(wǎng)絡(luò)數(shù)據(jù)流的Rossle混沌非線性互信息特征,實現(xiàn)對網(wǎng)絡(luò)攻擊信號的特征挖掘和檢測。仿真實驗表明,采用該算法進行網(wǎng)絡(luò)攻擊檢測,檢測性能明顯提高,檢測概率達到97.8%,展示了算法優(yōu)越的檢測性能和網(wǎng)絡(luò)安全防御價值。
關(guān)鍵詞:混沌;互信息特征;攻擊檢測;數(shù)據(jù)挖掘
0引言
隨著計算機網(wǎng)絡(luò)技術(shù)的發(fā)展和普及,Internet成為人類交流和生產(chǎn)生活的主要工具,各種信息通過網(wǎng)絡(luò)傳輸和共享,給人們帶來便利的同時也帶來網(wǎng)絡(luò)安全難題[1],如何有效檢測攻擊成為研究熱點。傳統(tǒng)攻擊檢測通常是基于知識的行為異常檢測:建立攻擊模式數(shù)據(jù)庫進行檢測,當檢測到的信號或用戶行為與數(shù)據(jù)庫記載的具有匹配相關(guān)性時,則認為是攻擊的,否則認為是合法的。這種方法的優(yōu)點是易于實現(xiàn)和準確率高[2],缺點是開放性不強,不能檢測數(shù)據(jù)庫之外類別的新的攻擊信息,其有效性嚴重依賴于專家特征數(shù)據(jù)庫的更新,現(xiàn)實中這種更新往往是滯后的 [3]。在傳統(tǒng)網(wǎng)絡(luò)攻擊檢測方法中,使用混沌系統(tǒng)結(jié)合高斯混合模型實現(xiàn)同步控制檢測,隨著網(wǎng)絡(luò)攻擊信號向著非線性隨機序列方向發(fā)展,傳統(tǒng)檢測模型無法實現(xiàn)有效攻擊檢測[45]。
針對上述問題,本文提出一種基于Rossle混沌模型的互信息特征潛質(zhì)挖掘算法,仿真實驗驗證了該檢測算法在隱蔽網(wǎng)絡(luò)攻擊檢測中的優(yōu)越檢測性能,能在很低的信噪比下實現(xiàn)對微弱攻擊信號的快速準確檢測,保證網(wǎng)絡(luò)安全。
1Rossle網(wǎng)絡(luò)攻擊信號混沌系統(tǒng)模型
1.1混沌模型構(gòu)建
在傳統(tǒng)網(wǎng)絡(luò)攻擊信號檢測領(lǐng)域,假設(shè)信號的時間序列是線性或高斯性的[6],這種假設(shè)有利于信號處理工作的開展,但現(xiàn)實中網(wǎng)絡(luò)攻擊信號的時間序列都或多或少具有一定的非線性特征,學者們通過非線性時間序列和混沌分析方法[710],有效地發(fā)現(xiàn)采集信號的本質(zhì)特征。有學者針對某類攻擊設(shè)計預(yù)防方法[11]。本文從主動檢測出發(fā),采用非線性時間序列分析進行信號檢測,構(gòu)建Rossle網(wǎng)絡(luò)攻擊信號混沌系統(tǒng)模型。Rossle混沌系統(tǒng)是一個三維連續(xù)的典型自治系統(tǒng),其數(shù)學模型表達式為:
上述Rossle混沌系統(tǒng)中,取參數(shù)σ=30,r=28,b=2.5,采用四階RungeKutta法解方程式,迭代10 000次。對混沌序列的研究,首先需要進行相空間重構(gòu),采用C-C算法得到相空間重構(gòu)的最佳延遲時間和最小嵌入維數(shù),實現(xiàn)對網(wǎng)絡(luò)狀態(tài)特征集在混沌系統(tǒng)中的相空間重構(gòu),假設(shè)給定的一個二進制網(wǎng)絡(luò)入侵狀態(tài)特征向量集合表示為:
F={f1,f2,…,fn}(2)
把上述網(wǎng)絡(luò)入侵特征狀態(tài)向量嵌入Rossle混沌系統(tǒng)中,構(gòu)建網(wǎng)絡(luò)入侵特征目標函數(shù),表示為:
θ1(k+1)=θ1(k)-μRe[y(k)φ*(k)](3)
上式中,θ1(k)表示初始狀態(tài)向量,θ1(k+1)表示二次迭代網(wǎng)絡(luò)狀態(tài)向量,μ為相空間混沌序列重構(gòu)收縮系數(shù)。
通過目標函數(shù)構(gòu)建,得到在Rossle混沌系統(tǒng)中的采用C-C算法得到的時延參數(shù)變化曲線如圖1所示,得到最佳時延參數(shù)為20,這為進一步構(gòu)建網(wǎng)絡(luò)狀態(tài)特征空間奠定了數(shù)據(jù)基礎(chǔ)。
1.2網(wǎng)絡(luò)攻擊信號的濾波預(yù)處理
在Rossle混沌系統(tǒng)基礎(chǔ)模型基礎(chǔ)上,采用最小均方誤差準則,設(shè)計一個能去除多個已知干擾頻率成分的自適應(yīng)級聯(lián)陷波器,實現(xiàn)對攻擊信號的濾波預(yù)處理,算法實現(xiàn)描述如下。
在Rossle混沌系統(tǒng)中,介入網(wǎng)絡(luò)攻擊信號,攻擊模型為一個非線性時間序列,表示為:
上式是對網(wǎng)絡(luò)攻擊非線性信號進行一階自回歸模型分析的結(jié)果,得到級聯(lián)濾波傳輸函數(shù)為:
φ(z)=F(z)F(z-1)σ2n(5)
采用最小均方誤差準則,輸入的網(wǎng)絡(luò)攻擊信號n(k)的實部nr(k)和虛部ni(k)分別為獨立的白噪聲,且均值均為零,方差為σ2n,在保證均方誤差收斂概率最小的前提下,網(wǎng)絡(luò)攻擊信號的攻擊過程進行Rossle混沌系統(tǒng)參數(shù)迭代的平均長度需要滿足:
ReE[n1(k)n*2(k)]=0(6)
基于上述最小均方誤差準則,設(shè)計一個能去除多個已知干擾頻率成份的自適應(yīng)級聯(lián)陷波器,設(shè)計框圖如圖2所示。
在Rossle混沌系統(tǒng)模型下,引入簡化的梯度算法,得到網(wǎng)絡(luò)攻擊模型輸出響應(yīng)函數(shù)的收斂曲線如圖3所示。
2攻擊檢測算法
2.1平均互信息特征挖掘算法的引入
在上述模型構(gòu)建和信號預(yù)處理基礎(chǔ)上,提取攻擊信號的Rossle混沌系統(tǒng)模型下的平均互信息攻擊特征,實現(xiàn)信號檢測,算法實現(xiàn)描述如下。
使用高斯混合模型對合法的網(wǎng)絡(luò)數(shù)據(jù)進行建模,得到3個估計參量。對監(jiān)測到的數(shù)據(jù)參量進行估計,以觀測是否為網(wǎng)絡(luò)攻擊,截取一段時間的數(shù)據(jù)進行研究分析。如果沒有攻擊信號,則Rossle混沌系統(tǒng)可以準確計算出高斯混合模型的參數(shù)值。若含有偽裝攻擊數(shù)據(jù),估計出的參數(shù)與正常估計得到的參數(shù)會有較大差異。均值特征向量μ能明顯反應(yīng)出高偽裝攻擊數(shù)據(jù)的特征,選擇μ作為特征量,為同步控制量引入混沌系統(tǒng)中進行攻擊特征檢測。
設(shè)Z=(U,V)是由監(jiān)測到的網(wǎng)絡(luò)信息數(shù)據(jù)U和未監(jiān)測到的數(shù)據(jù)V組成的集合。Z被稱為完整數(shù)據(jù),U被稱為不完整數(shù)據(jù),Z的聯(lián)合概率密度函數(shù)定義為:p(U,V|Θ),其中Θ為被估計的參量集合,通過求解不完整數(shù)據(jù)的對數(shù)似然函數(shù)L(Θ|U)的最大值來得到Θ的最大似然估計。
模型1:網(wǎng)絡(luò)攻擊表現(xiàn)為連續(xù)隨機
p(U,V|Θ)L(Θ|U)=logp(U|Θ)
=∫Vlogp(U,V|Θ)dV(7)
通過E步和M步迭代,得到最大完整數(shù)據(jù)的平均互信息函數(shù)Lc(Θ|Z)的期望值,實現(xiàn)對缺失數(shù)據(jù)的對數(shù)似然函數(shù)L(Θ|Z)的最大化,其中:
Lc(Θ|Z)=logp(U,V|Θ)(8)
在迭代計算中,第t次迭代計算后Θ得到的估計值計為Θ(t),在t+1次迭代中,使用E步迭代計算得到完整數(shù)據(jù)的平均互信息函數(shù)的期望值為:
Q(Θ|Θ(t))=E{Lc(Θ|Z)|U;Θ(t)}(9)
經(jīng)過M步迭代,采用多個網(wǎng)絡(luò)攻擊模型自適應(yīng)級聯(lián)陷波器,去除已知干擾頻率成分,最后通過最大化函數(shù)來獲得新的Θ(t+1)。
模型2:網(wǎng)絡(luò)攻擊表現(xiàn)為離散隨機
假設(shè)網(wǎng)絡(luò)攻擊行為的分布函數(shù)為[δ1,δ2,…,δN],為離散函數(shù),其中,δi=p(V=i)。由于
δk=G(V=k|Ui)(10)
其中Ui表示由第k個多維的正態(tài)分布得到的概率。經(jīng)過第t次的迭代后,δk變成了δik(t):
δik(t)=G(V=k|Ui,Θ(t))(11)
第t+1次估計,求解網(wǎng)絡(luò)攻擊模型Rossle混沌系統(tǒng)的全局平均互信息特征向量,迭代求解過程為:
上式中,Ui為網(wǎng)絡(luò)特征子集,μk為慣性權(quán)重,δik(t)為混沌相空間空間維數(shù),N為迭代步數(shù)。通過上述迭代,實現(xiàn)對平均互信息特征潛質(zhì)挖掘。
2.2基于平均互信息特征挖掘算法的攻擊檢測算法
通過連續(xù)型和離散型網(wǎng)絡(luò)攻擊行為的平均互信息特征計算,實現(xiàn)對基于Rossle混沌模型的非線性網(wǎng)絡(luò)攻擊混沌特征挖掘,根據(jù)挖掘的互信息這種非線性特征解,實現(xiàn)對具有非線性隨機特性的網(wǎng)絡(luò)攻擊信號有效檢測,過程如下。
采用一個二階級聯(lián)陷波器從復(fù)雜的網(wǎng)絡(luò)背景環(huán)境中提取一組網(wǎng)絡(luò)信號,根據(jù)Rossle混沌系統(tǒng)基礎(chǔ)模型,采用最小均方誤差準則設(shè)計一個能去除多個已知干擾頻率成分的自適應(yīng)級聯(lián)陷波器,進行預(yù)處理,得到輸出信號結(jié)果為:
其中,n(k)為背景合法網(wǎng)絡(luò)信號的干擾,Ai為級聯(lián)系數(shù),設(shè)定其門限值為αFA,它可以根據(jù)網(wǎng)絡(luò)數(shù)據(jù)和信息流的實際情況確定。信息數(shù)據(jù)信號經(jīng)過上述方法得到混沌平均互信息特征,經(jīng)過混沌同步處理得到輸出的數(shù)據(jù)信號與門限αFA進行比較。
如果:
則判決為監(jiān)測信號為攻擊信號;否則,為合法信號。從而實現(xiàn)對網(wǎng)絡(luò)信號攻擊檢測。
3仿真結(jié)果與分析
為了驗證本文提出的網(wǎng)絡(luò)攻擊檢測算法的有效性,采用實際網(wǎng)絡(luò)信號采集和仿真測試的方法進行實驗,采用MATLAB進行編程實現(xiàn),網(wǎng)絡(luò)信號采集于KDD Cup2012網(wǎng)絡(luò)病毒數(shù)據(jù)庫,網(wǎng)絡(luò)攻擊類型為DoS攻擊、Probe攻擊和ipsweep,每類包括50個樣本,每個樣本有4個屬性,設(shè)置檢測起點和檢測終點,對計算機系統(tǒng)進行持續(xù)攻擊,采集信號特征。
在不同特征子集和網(wǎng)絡(luò)攻擊樣本下,采用Rossle混沌模型進行攻擊特征建模,實現(xiàn)對非線性隨機特性網(wǎng)絡(luò)攻擊信號的有效檢測。采集到的某組樣本原始數(shù)據(jù)序列如圖4所示。
采用最小均方誤差準則設(shè)計自適應(yīng)級聯(lián)陷波器對信號進行預(yù)處理,得到濾波輸出結(jié)果如圖5所示。
通過提取待檢測網(wǎng)絡(luò)數(shù)據(jù)流的Rossle混沌非線性互信息特征,實現(xiàn)對網(wǎng)絡(luò)攻擊信號的特征挖掘和檢測,檢測到的攻擊信號頻譜圖如圖6所示。通過對實驗采集的多組攻擊樣本進行蒙特卡洛實驗,得到檢測概率為97.8%,展示出算法優(yōu)越的檢測性能,該算法能準確有效地定位檢測攻擊信號。
為了進一步驗證本文算法的優(yōu)越性,針對3類攻擊類型數(shù)據(jù)集,隨機抽取10個數(shù)據(jù)進行攻擊準確度檢測,檢測準確率結(jié)果如圖7所示。
本文算法在選擇合適的平均互信息特征和適應(yīng)度函數(shù)后,能夠準確地對網(wǎng)絡(luò)攻擊信號進行檢測,檢測準確率高達95%以上,比傳統(tǒng)系統(tǒng)準確率提高35%左右,滿足了網(wǎng)絡(luò)安全要求,應(yīng)用價值廣闊。
4結(jié)論
為有效實現(xiàn)網(wǎng)絡(luò)攻擊信號的檢測,本文提出一種基于Rossle混沌模型的平均互信息特征潛質(zhì)挖掘算法,根據(jù)挖掘的互信息這種非線性特征解,實現(xiàn)對具有非線性隨機特性的網(wǎng)絡(luò)攻擊信號的有效檢測。采用最小均方誤差準則,設(shè)計一個能去除多個已知干擾頻率成分的自適應(yīng)級聯(lián)陷波器,實現(xiàn)對攻擊信號的濾波預(yù)處理,提取待檢測網(wǎng)絡(luò)數(shù)據(jù)流的Rossle混沌非線性互信息特征,構(gòu)建判斷規(guī)則,實現(xiàn)對網(wǎng)絡(luò)攻擊信號的特征挖掘和檢測。仿真實驗表明,該算法的檢測性能明顯提高,檢測概率達到97.8%,準確率較傳統(tǒng)算法也有明顯優(yōu)勢。
參考文獻
[1] 蔣蕓,陳娜等. 基于Bagging的概率神經(jīng)網(wǎng)絡(luò)集成分類算法[J].計算機科學,2013,40(5):242246.
?。?] Ye Qing, Huang Yanlei. Nonuniform distribution intrusion detection research and simulation of the model[J]. Bulletin of Science and Technology, 2013, 29(8): 169171.
?。?] Luo Liming, Zhou Zhen. IPV6 based network security intrusion detection technology research[J]. Bulletin of Science and Technology, 2012, 28(4): 114115, 140.
?。?] Deng Bing, Tao Ran, Ping Dianfa, et al. Movingtargetdetection algorithm with compensation for Doppler migration based on FRFT[J]. Acta Armamentarii, 2009, 30(10), 13031309.
?。?] 赫然,王永吉,王青,等.一種改進的自適應(yīng)逃逸微粒群算法及實驗分析[J].軟件學報,2005,16(12):20362044.
[6] 劉在英,楊平,張麗曉. 基于膚色模型和高斯分布的多人臉檢測方法[J].計算機與現(xiàn)代化,2013(10):3034.
?。?] Cheng Dongnian, Wang Binqiang, Wang Baojin. Preliminary study on the connotation of flexibility in dynamically reconfigurable networks[J]. Journals of Communications, 2012, 33(8): 214222.
?。?] Ou Shifeng, Gao Ying, Zhao Xiaohui. Adaptive combination algorithm and its modified scheme for blind source separation[J]. Journal of Electronic & Information Technology, 2011, 33(5): 12431247.
?。?] Chen Huilin, Xia Daoxun. Applied research on data mining based on CART decision tree algorithm[J]. Coal Technology, 2011, 30(10): 164166.
?。?0] 武妍,徐敏.一種改進的粒子群優(yōu)化算法[J].計算機工程與應(yīng)用,2006,42(33):4043.
[11] 張祖蓮,王命全,李景林,等.一種自定義動態(tài)密鑰預(yù)防DDoS攻擊的算法[J].微型機與應(yīng)用,2013,32(20):7779.