文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2016.07.026
中文引用格式: 朱靈蕾,姚遠程,姜軍,等. Hurst指數(shù)估計法中的修正方法研究[J].電子技術應用,2016,42(7):103-106,110.
英文引用格式: Zhu Linglei,Yao Yuancheng,Jiang Jun,et al. Research of the correction methods in Hurst estimations[J].Application of Electronic Technique,2016,42(7):103-106,110.
0 引言
越來越多的研究人員致力于網絡流量特征的研究,現(xiàn)有的網絡流量中都能檢測到自相似特性。赫斯特指數(shù)(Hurst index,H指數(shù))是描述自相似特性的唯一特征參數(shù),它能刻畫網絡業(yè)務量突發(fā)的劇烈程度,影響網絡業(yè)務量建模的準確度。
赫斯特指數(shù)估計方法的研究開始于國外,起初學者大多數(shù)集中在對R/S法(Rescaled Range,R/S)的研究上,后來提出了一些新的H指數(shù)估計方法和應用。MARCIN M提出了基于p-variation的估計方法[1],這種方法可以估計單分形布朗運動的H指數(shù)。BLYTHE D A J[2]將H指數(shù)的估計方法運用到腦電圖的分析當中,演示了信號噪聲比例在H指數(shù)估計中的影響。國內的學者也對H指數(shù)的估計方法進行了大量的研究和應用。張廣興[3]將H指數(shù)估計方法運用于多尺度下的IP網絡流量特征分析與研究。徐凌[4]提出了一種基于Haar小波的Hurst參數(shù)估計方法,比傳統(tǒng)估計方法的精度有所提高。目前比較常用的自相似業(yè)務量估計方法有R/S分析法、聚類方差法、周期圖法、Whittle法[5]、小波分析法。其中Whittle法需要在已知序列的譜密度形式的情況下才能對序列進行準確估計,而真實網絡業(yè)務量的譜密度形式往往是未知的,所以本文只對其他4種方法進行研究。
1 自相似過程及其數(shù)學特性
1.1 自相似過程的定義
1.2 自相似過程的特征
赫斯特效應:Hurst參數(shù)是自相似過程的唯一參數(shù),當H=0.5表明時間序列是隨機的,0.5<H<1表明時間序列具有自相似性,網絡業(yè)務量的H值一般在0.75附近。
1.3 分形高斯噪聲模型
分形高斯噪聲[9](Fractal Gaussian Noise,F(xiàn)GN)是目前最為廣泛使用的一種自相似模型。FGN序列的自相關函數(shù)為:
2 Hurst指數(shù)估計法及修正辦法
2.1 R/S估計法
2.1.1 原理
對于具有自相似性的序列X有:
2.1.2 R/S修正辦法
在實際應用中m值的設定關系到算法的運算時間和算法的精度。圖1是m值的個數(shù)與估計方法運算一次所需要的時間關系,自相似業(yè)務量長度為216。
從圖1可以看出,m的個數(shù)的增加帶來了運算時間大幅增加,因此m值的個數(shù)應該固定,即m的個數(shù)不隨自相似業(yè)務量序列的長度的增加而增加。同時仿真結果表明R/S法的估計精度不受m的取值個數(shù)影響,實驗數(shù)據(jù)見表1??梢酝ㄟ^適當減少m值的個數(shù)提高運算速度。本文的仿真都是在自相似業(yè)務量序列長度為216,Hurst參數(shù)取0.6、0.7、0.8、0.9這4個值的情況下仿真出來的結果。相對誤差是分別對設定的4個Hurst參數(shù)估計后求得的值求平均的結果。
表2是m的最小值與算法的相對誤差關系,表2的仿真數(shù)據(jù)可以看出隨著m的最小取值的增加估計法的相對誤差降低了2.42%,說明可以通過提高m的最小值的取值來提高R/S法的估計精度,N是自相似業(yè)務量序列長度。
表3是m的最大值與估計法的相對誤差之間的關系,最小值取lgN3,從表3可以看出m值的最大取值偏大時R/S法的估計相對誤差較小。
綜上所述,對于R/S法的修正辦法有:(1)m值的個數(shù)固定,避免因自相似業(yè)務量序列的增加帶來的運算量的大幅增加;(2)增大m值的最小取值可以使R/S估計法的相對誤差減少2.32%;(3)增大m的最大取值,這種方式也可以提高估計法的精度。
2.2 聚類方差法
2.2.1 原理
繪制對數(shù)坐標系下Vn與m的曲線,H=1+a/n,a為斜率,從而可以計算Hurst參數(shù)的值。當n=1時對應算法為絕對值法,當n=2時對應算法為方差時間法。
2.2.2 聚類方差修正辦法
同R/S法一樣,聚類方差法中m值的選取也可以直接影響估計精度和運算速度。圖2是m值的個數(shù)與估計方法運算一次所需要的時間之間的關系。
從圖2可以看出隨著m的個數(shù)的增加,運算一次估計法所需的時間也大幅增加,所以m值的個數(shù)應該固定。表4中等間隔取值就是m在最大值和最小值之間等間隔地取值,不等間隔的取值就是在最小值與最大值之間呈對數(shù)取值。表4的仿真結果表明m以不等間距的方式來取值比等間距取值的精度高。從表4也可以看出當m的個數(shù)在40左右時精度較高。
表5是在m的最小值取不同值時得到的估計誤差,N表示自相似業(yè)務量序列的長度。從表5可以看出隨著m的最小值的增大,估計法的精度逐漸下降。
表6是在m的最小值取10的情況下討論最大值對精度的影響,從表6可以看出m值的最大取值偏小時聚類方差法的估計精度高,即m的最大值的選擇應該適當偏小,當取N/500時精度最高。
綜上所述,對于聚類方差法的修正辦法有:(1)m取值的個數(shù)固定,避免序列的增加帶來運算量的大幅增加;(2)m值不等間隔選取,可以使相對誤差降低3個百分比;(3)降低m值的最小取值和最大取值,可以使相對誤差降低8個百分比。
2.3 周期圖法
2.3.1 原理
周期圖法[10]是一種信號功率譜密度估計方法。對于觀測到的時間序列X={X(k),k=1,2,3,…,N},其周期圖由下式定義為:
2.3.2 周期圖法修正辦法
選擇原點附近的點來擬合曲線對周期圖法是很重要的,選擇過多的點I(λ)與|λ|1-2H失去了正比關系,選擇的點過少會影響精度。從表7中可以看出,選擇靠近原點15%左右的點進行擬合得到的估計精度是最高的。
因此可以總結出對周期圖法的修正辦法:適當選擇靠近原點15%的點進行曲線擬合,這種情況下周期圖法的估計誤差最小,精度最高。
2.4 小波法
2.4.1 原理
給定一時間序列X={X(i),i=1,2,3,…,N},對其進行二進制小波變換可以得到信號的近似系數(shù)dx(j,k)[11]。
若X(i)為二階平穩(wěn)過程,則:
其中 C(H,Ψ)是依賴H和Ψ的常數(shù),j是尺度系數(shù)。從式(12)可以得出在對數(shù)坐標系下擬合一曲線,H=(1+a)/2,a是曲線的斜率。
2.4.2 小波法修正辦法
影響小波估計法精度的因素有兩點:(1)小波基的選擇;(2)尺度的選擇。表8對比了4種小波基在H指數(shù)估計當中對精度的影響。Harr小波就是Daubechies小波中階數(shù)為1的情況。
從表8中可以看出,小波基和尺度j的選擇會影響小波估計法的精度,采用Harr小波基進行小波估計在尺度j=5時小波估計的相對誤差最低為0.25%。
因此,可以總結出兩點小波估計法的修正辦法:(1)選擇Harr和Biorthogonal小波基;(2)選合適的尺度,j=5左右情況下估計法的相對誤差最小。
3 結論
本文針對目前廣泛使用的4種自相似業(yè)務量估計方法提出了詳細的修正的辦法。通過設置不同的Hurst參數(shù)以及長度為216的業(yè)務量序列來測試修正前后估計方法的精度,結果表明采用修正辦法可以降低各個估計方法的相對誤差,提高估計方法的估計精度,其中R/S法的相對誤差降低到1.43%,聚類方差法的相對誤差降低到1.30%,周期圖法和小波估計法的相對誤差降低了一個數(shù)量級,小波估計法的相對誤差降低到了0.25%。
下一步的工作:(1)研究這些方法的抗噪性能,改進估計方法,提高魯棒性;(2)將估計方法采用硬件實現(xiàn),用于對網絡流量的實時檢測。
參考文獻
[1] MARCIN M,JAKUB K,JUSTYNA W.Estimation and testing of the Hurst parameter using p-variation[J].Journal of Physics A:Mathematical and Theoretical,2013,46(32):2589-2593.
[2] BLYTHE D A J,HAUFE S,M?譈LLER K R,et al.The effect of linear mixing in the EEG on Hurst exponent estimation[J].Elsevier,2014,99(1):377-387.
[3] 張廣興.多尺度下的IP網絡流量特征分析與研究[D].長沙:湖南大學,2011.
[4] 徐凌,劉嘉焜,李亮.自相似網絡流量Hurst指數(shù)估計算方法[J].科學技術與工程,2013,13(20):5848-5854.
[5] 宋春鳳.通信網絡流量的自相似研究[D].長春:吉林大學,2015.
[6] 李稚春.網絡時延的自相似性研究[J].物聯(lián)網技術,2015,38(4):38-40.
[7] KOROLKO M,SAHINOGLU Z,NIKOVSKI D.Modeling and forecasting self-similar power load due to EV fast chargers[J].IEEE Smart Grid,2015,12(9):508-519.
[8] YOON I,JEON J,PAIK J.Multi-frame example-based super-resolution using locally directional self-similarity[J].Consumer Electronics,2015,12(2);2-4.
[9] DELIGNIERES D.Correlation properties of (Discrete) fractional Gaussian noise and fractional brownian motion[J].Mathematical Problems Engineering,2015,10(8):1-3.
[10] 趙彥仲,吳立文.Hurst指數(shù)估計方法的比較和研究[J].計算機工程與應用,2014,50(16):1-3.
[11] 趙彤洲,李德華,吳量,等.基于多尺度小波分析的長程相關性研究[J].華中科技大學學報,2015,43(10):487-488.