《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應(yīng)用 > 基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測方法
基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測方法
2020年電子技術(shù)應(yīng)用第3期
荊 通1,丁文銳1,2,劉春輝2
1.北京航空航天大學(xué) 電子信息工程學(xué)院,北京100191;2.北京航空航天大學(xué) 無人系統(tǒng)研究院,北京100191
摘要: 無線電頻譜占用預(yù)測是認知無線電研究中的關(guān)鍵技術(shù),針對傳統(tǒng)頻譜占用預(yù)測方法中只能進行單步長預(yù)測,多步長預(yù)測效果下降明顯的問題,借鑒Apriori算法中查找頻繁項集的思想,提出一種基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測方法。在數(shù)據(jù)采集方面,利用本單位研制的電磁頻譜檢測系統(tǒng)對調(diào)頻FM廣播業(yè)務(wù)頻段(88~108 MHz)進行連續(xù)48小時的頻譜監(jiān)測,選取占用度滿足頻譜占用預(yù)測的需要的部分數(shù)據(jù)進行預(yù)測分析。實驗表明,該方法在FM廣播業(yè)務(wù)頻段得到了較好的效果,多步長預(yù)測準確率達到70%以上。此外,還對算法中的重要參數(shù)進行了簡要分析,指出了參數(shù)對輸出結(jié)果準確度的影響。
中圖分類號: TN911.72
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.191010
中文引用格式: 荊通,丁文銳,劉春輝. 基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測方法[J].電子技術(shù)應(yīng)用,2020,46(3):80-85.
英文引用格式: Jing Tong,Ding Wenrui,Liu Chunhui. Multi-step spectrum occupancy prediction method based on association rule mining[J]. Application of Electronic Technique,2020,46(3):80-85.
Multi-step spectrum occupancy prediction method based on association rule mining
Jing Tong1,Ding Wenrui1,2,Liu Chunhui2
1.School of Electronic Information Engineering,Beihang University,Beijing 100191,China; 2.Unmanned System Research Institute,Beihang University,Beijing 100191,China
Abstract: Radio spectrum occupancy prediction is a key technology in cognitive radio research. In the traditional method, only single step size prediction can be performed, and the effect of multi-step size prediction is significantly reduced. Referring to the idea of searching frequent item sets in Apriori algorithm,a multi-step spectrum occupation prediction method based on association rule mining is proposed. In terms of data acquisition, the electromagnetic spectrum detection system developed by the unit is used to monitor the frequency spectrum of FM broadcasting service(88~108 MHz) for 48 hours continuously, and some data whose occupancy meets the demand of spectrum occupancy prediction are selected for prediction and analysis. The experimental results show that the proposed method is effective in FM broadcasting frequency band, and the prediction accuracy of multi-step length is more than 70%. This paper also briefly analyzes the important parameters of the algorithm and points out the influence of the parameters on the accuracy of the output results.
Key words : cognitive radio;spectrum monitoring;spectrum prediction;frequent pattern;association rule mining

0 引言

    認知無線電技術(shù)提高了系統(tǒng)的頻譜利用率,然而在傳統(tǒng)頻譜感知中,認知用戶對所有頻帶進行感知會造成大量的能量損耗和處理時延,因此如何準確預(yù)測空間頻譜占用情況,即頻譜預(yù)測技術(shù),受到研究人員的廣泛研究。頻譜預(yù)測技術(shù)能夠為認知用戶提供更好的頻譜接入條件,減少認知用戶和主用戶之間產(chǎn)生的數(shù)據(jù)傳輸沖突,避免對主用戶通信造成干擾,降低響應(yīng)時延,增加網(wǎng)絡(luò)的吞吐量[1]。頻譜預(yù)測過程一般包含3個步驟:(1)數(shù)據(jù)采集,實際頻譜采集或建立仿真頻譜模型生成;(2)數(shù)據(jù)預(yù)處理,有效數(shù)據(jù)選取、信號與噪聲的分離;(3)頻譜預(yù)測,設(shè)計頻譜預(yù)測方法進行預(yù)測。

    設(shè)計有效的頻譜預(yù)測方法需考慮預(yù)測機制與預(yù)測方法兩方面:預(yù)測機制大多是采用時隙通信模式,將每個時隙的頻譜占用或空閑情況定義為一個二元時間序列,通過分析歷史數(shù)據(jù)獲取頻譜使用規(guī)律,進而預(yù)測未來頻譜占用狀態(tài)[2];頻譜預(yù)測方法主要有基于隱馬爾可夫(Hidden Markov Model,HMM)的方法[3]、基于自回歸移動平均模型(Autoregressive Integrated Moving Average,ARIMA)的方法[4]、基于神經(jīng)網(wǎng)絡(luò)的方法[5]、基于關(guān)聯(lián)規(guī)則挖掘的方法等[6]?;陉P(guān)聯(lián)規(guī)則挖掘的方法在頻譜預(yù)測中性能表現(xiàn)較好,這類方法又包括基于部分周期模式挖掘的方法[6]、基于貝葉斯的方法[7]、應(yīng)用統(tǒng)計學(xué)習(xí)的方法[8]以及最大子模式命中[9]等。

    在實際頻譜預(yù)測應(yīng)用中,往往不僅需要預(yù)測下一個時隙的頻譜占用情況,而且需要預(yù)測多個時隙一分鐘甚至一小時的頻譜占用情況,進而統(tǒng)計分析信道的可用性,避免頻繁切換信道?,F(xiàn)有方法只能保證下一個時隙的一步預(yù)測效果較為理想,而多時隙多步預(yù)測存在效果下降較快的問題。針對這一問題,本文借鑒Apriori算法中查找頻繁項集的思想,提出基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測方法,通過采集真實數(shù)據(jù)對所提出方法進行實驗驗證。

1 頻譜占用度

1.1 頻譜占用度預(yù)測用數(shù)據(jù)選取

    信道頻譜占用度可以體現(xiàn)頻譜的活躍程度,信道頻譜活躍程度對驗證方法的可行性十分關(guān)鍵。若信道頻譜占用度極低(0%~5%),數(shù)據(jù)處理后生成的信道狀態(tài)信息(Channel State Information,CSI)序列將近似為全0序列;若信道頻譜占用度極高(95%~100%),生成的CSI序列將近似為全1序列,對這些信道進行CSI序列預(yù)測得到的結(jié)果極為可觀,正確率可達到90%以上,丟失率接近0。但這兩種極端情況都將使得CSI信道活躍度降低,即0/1狀態(tài)的轉(zhuǎn)換頻率變低,此時頻譜占用預(yù)測也將失去意義。故本文選取頻譜占用度35%~94%的信道進行預(yù)測分析。信道占用度計算方法如式(1)所示:

    tx2-gs1.gif

其中,F(xiàn)co表示信道占用度,Tf表示信道占用時間,T表示信道測量時間。

1.2 頻譜占用度閾值選取

    頻譜占用狀態(tài)只有兩種:占用和空閑。通常,信道頻譜強度高于某門限,則認為信道處于被占用狀態(tài),用“1”表示;相反,認為信道處于空閑狀態(tài),用“0”表示,轉(zhuǎn)換原理如式(2)所示:

     tx2-gs2.gif

其中,cs表示信道狀態(tài),PC表示信道電平值,PO表示預(yù)設(shè)門限值。該過程中如果預(yù)設(shè)門限值設(shè)置較小,則某些噪聲信號將被誤認為是有用信號;若門限設(shè)置較高,則會遺漏有用信號,因此頻譜占用度閾值的選取是數(shù)據(jù)預(yù)處理過程較為關(guān)鍵的步驟。

    本文采用動態(tài)門限分割[10]的方法確定頻譜占用度門限,方法流程如圖1所示。

tx2-t1.gif

    動態(tài)門限分割方法涉及兩個參數(shù),一個是用于信噪分離的判別值,另一個是噪聲曲線平滑處理的次數(shù)。在《超短波頻段占用度測試技術(shù)規(guī)范》中,建議門限電平設(shè)置為各頻段內(nèi)當?shù)亟邮諜C平均功率電平或電壓指示以上5 dB。在無線電監(jiān)測工作中,一般把超過噪聲電平3 dB~5 dB的頻點視為信號?;谝陨蟽牲c,本文采用5 dB作為信噪分離的判別值,平滑處理次數(shù)取60,動態(tài)門限如圖2所示。

tx2-t2.gif

    圖2(a)信道編號為3,統(tǒng)計電平值較低,多數(shù)集中在-76.45 dBm左右,且處于動態(tài)判決門限以下,被認定為噪聲信道;圖2(b)信道編號為61,統(tǒng)計電平值較高,多數(shù)集中在-67.45 dBm左右,且處于動態(tài)判決門限以上,被認定為信號信道。

    各個信道的幅度-頻率信號被動態(tài)門限分割之后就形成了CSI矩陣,如圖3所示(圖中黑色實心方塊表示當前CSI=1,空白處則表示CSI=0)。

tx2-t3.gif

2 算法原理

2.1 時間序列關(guān)聯(lián)規(guī)則挖掘算法

    Apriori算法[6]是關(guān)聯(lián)規(guī)則挖掘算法中經(jīng)典的算法,多用于非時序項集。算法一般分為兩部,一是生成頻繁模式,二是根據(jù)頻繁模式生成關(guān)聯(lián)規(guī)則。而使用該算法處理時間序列數(shù)據(jù)時,必須對序列進行模式劃分。對序列進行模式劃分時,每次取一部分數(shù)據(jù)進行時間序列關(guān)聯(lián)規(guī)則計算,然后向后滑動一個窗口,產(chǎn)生一個新的事務(wù),再次計算時間序列關(guān)聯(lián)規(guī)則。保持每個事務(wù)窗口一致,這樣可以使當前事務(wù)區(qū)別于上一個事務(wù),同時又不會漏掉可能產(chǎn)生的時間序列特征組合,如圖4所示。

tx2-t4.gif

    時間序列關(guān)聯(lián)規(guī)則挖掘過程中有兩個重要判決條件:(1)當模式出現(xiàn)次數(shù)N大于最小支持度時,生成頻繁模式;(2)頻繁模式轉(zhuǎn)移率P大于最小置信度時,生成關(guān)聯(lián)規(guī)則,如圖5所示。

tx2-t5.gif

2.2 基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測算法

    本節(jié)將使用上文方法生成的關(guān)聯(lián)規(guī)則進行多步長頻譜占用預(yù)測。

    本文算法涉及概念和符號見表1。

tx2-b1.gif

    輸入:原始幅度頻率數(shù)據(jù)(File_level)。

    輸出:預(yù)測的準確率以及丟失率。

    (1)將原始幅度頻率數(shù)據(jù)通過動態(tài)門限分割、信道分割,生成由0和1組成的CSI序列。

    (2)當生成的CSI序列長度大于跨度L時,檢測序列中異常值的情況,進行基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測。

    (3)對預(yù)測結(jié)果與實際監(jiān)測結(jié)果進行對比,統(tǒng)計預(yù)測準確率和丟失率。

    算法中輸入的原始數(shù)據(jù)為401×n的矩陣(File_level),n為采集數(shù)據(jù)的時隙數(shù)(本文時隙間隔為1 s),通過動態(tài)門限分割以及信道編號(1~401)的選擇,形成單一信道的CSI序列。頻繁項跨度(FrQ_length)限定了頻繁子序列長度的最大值,取值范圍可設(shè)為1~n之中的任意整數(shù)值,當其設(shè)為1時,算法可近似于兩狀態(tài)馬爾可夫過程;當其設(shè)置為接近n時,頻繁項數(shù)量太少,算法失效,故本文取10%n。最小支持度(Min_sup)與最小置信度(Min_conf)體現(xiàn)了頻繁項的頻繁程度以及規(guī)則的可靠性。最小預(yù)測長度(Min_span)的設(shè)定可以減少頻繁子序列生成規(guī)則的數(shù)量,提升算法效率和精度。

    關(guān)聯(lián)規(guī)則是頻譜占用預(yù)測的主要依據(jù)。項集統(tǒng)計數(shù)大于Min_sup即為頻繁項,若頻繁項A統(tǒng)計數(shù)為a、頻繁項B統(tǒng)計數(shù)為b,則轉(zhuǎn)移率Pab=a/b,當Pab大于Min_conf時產(chǎn)生強關(guān)聯(lián)規(guī)則,即當前序列為A時,預(yù)測結(jié)果為B的概率為Pab。

    圖6為多步長頻譜占用預(yù)測算法流程。

tx2-t6.gif

    在多步長預(yù)測過程中,算法沒有在規(guī)則中找到適合的規(guī)則,則記為一次丟失,輸出“-1”,即異常值,異常值的出現(xiàn)會影響下一次的預(yù)測,所以要進行異常值替換,每個異常值“-1”都會分兩次替換成“0”或“1”,例如序列[1 0 -1 0]會替換成[1 0 0 0]和[1 0 1 0],由這兩個序列查找關(guān)聯(lián)規(guī)則中置信度最高的規(guī)則進行預(yù)測或者繼續(xù)丟失,即如果有m個異常值,則要進行2m次替換,最終由替換后的序列置信度最高值進行預(yù)測或者繼續(xù)丟失。若Pred_length>1,即多步長,步長遞增過程如圖7所示,圖中標注下劃線并加粗的字符為預(yù)測序列值,算法使用預(yù)測結(jié)果更新CSI序列,直至完成多步長預(yù)測算法。

tx2-t7.gif

    若當前序列滿足預(yù)測條件,記預(yù)測次數(shù)(Predict)加1;若預(yù)測結(jié)果與下一時隙狀態(tài)序列相同,記預(yù)測正確次數(shù)(Correct)加1;若最終沒有找到滿足預(yù)測條件的關(guān)聯(lián)規(guī)則,記丟失次數(shù)(Loss)加1,丟失率記為Loss_Rate,公式如下:

     tx2-gs3-6.gif

3 實驗及分析

3.1 數(shù)據(jù)采集與預(yù)處理

    本文中的頻譜監(jiān)測數(shù)據(jù)來自北京航空航天大學(xué)學(xué)院路校區(qū)連續(xù)約48 h(2018年12月22日16時22分~2018年12月24日16時25分)頻段為88 MHz~108 MHz,即調(diào)頻FM廣播業(yè)務(wù)頻段進行監(jiān)測,監(jiān)測設(shè)備包括是德公司E4407b頻譜分析儀、PC以及SAS-521F-2接收天線,表2列出了監(jiān)測參數(shù)。

tx2-b2.gif

    頻譜儀每次掃描空間頻譜獲得400個頻譜采樣點,在監(jiān)測時間內(nèi)每一秒形成一個“場強-頻率”對應(yīng)關(guān)系的文本數(shù)據(jù)文件,因此每小時產(chǎn)生3 600個數(shù)據(jù)集。

    數(shù)據(jù)的選取對預(yù)測模型的學(xué)習(xí)效果有著極為重要的影響,合適的數(shù)據(jù)能夠為提高預(yù)測模型的正確率提供良好的支持。正常情況下,頻譜的短期變化趨勢是連續(xù)的,而長期變化具有明顯的周期性,周期性具體體現(xiàn)在日、星期、年周期性以及節(jié)假日特性。為了提高信道頻譜占用預(yù)測精度,在數(shù)據(jù)選擇時應(yīng)考慮這一周期性特點。故本文采用第一天100時隙作為訓(xùn)練集,第二天相同時間的100時隙作為測試集。

    圖8為對所采集到的頻譜數(shù)據(jù)進行“場強-頻率-時間”三維可視化處理結(jié)果。

tx2-t8.gif

3.2 主要參數(shù)分析

3.2.1 多步長對預(yù)測結(jié)果的影響

    圖9和圖10分別展示了13號和86號信道中預(yù)測步長對預(yù)測結(jié)果的影響。

tx2-t9.gif

tx2-t10.gif

    通過信道13和信道86的10步預(yù)測結(jié)果可見,隨著預(yù)測步長的增加,預(yù)測丟失率逐漸減少,雖然預(yù)測正確率也隨步長增加呈下降趨勢,但下降趨勢較緩,總預(yù)測正確率由于丟失率的逐漸減少,隨預(yù)測步長的增加呈略微上升的趨勢??梢娫撍惴ㄔ诙嗖介L預(yù)測中有效減少丟失率的同時,保持了較高的預(yù)測正確率。

3.2.2 信道占用度對預(yù)測結(jié)果的影響

    本實驗中選取了占用度由35%到94%依次升高的6個信道。圖11展示了預(yù)測步長為1和10的結(jié)果。 

tx2-t11.gif

    從圖11中可以看出,總體上信道占用預(yù)測正確率保持較高的水準,其丟失率沒有隨著占用度的變化有正相關(guān)或者負相關(guān)的規(guī)律。由此可見總體上算法體現(xiàn)出了良好的性能,信道占用度的變化對預(yù)測結(jié)果的影響不大。

3.2.3 規(guī)則置信度對預(yù)測結(jié)果的影響

    圖12(a)和圖12(b)分別展示了3個信道在最小置信度為0.7、0.8和0.9時的正確率和丟失率。

tx2-t12.gif

    從圖12中可以看出,隨著最小置信度由0.7升高至0.9,丟失率由15%左右升高至40%左右??梢?,最小置信度的設(shè)置對丟失率影響很大,這是由于隨著最小置信度的升高,可用的關(guān)聯(lián)規(guī)則逐漸減少,即信道信息的可預(yù)測性降低。預(yù)測正確率隨最小置信度的提高緩慢升高,而預(yù)測丟失率則隨最小置信度的提高急劇升高,因此,設(shè)置適合的最小置信度對CSI序列的可預(yù)測性至關(guān)重要。

4 結(jié)論

    本文提出類Apriori算法的頻繁模式關(guān)聯(lián)規(guī)則挖掘算法,實現(xiàn)對信道占用狀態(tài)的多步長預(yù)測。實驗表明,該算法在實際頻譜預(yù)測中相比隱馬爾科夫模型和神經(jīng)網(wǎng)絡(luò)模型等預(yù)測方法,不需要任何先驗知識,可根據(jù)歷史數(shù)據(jù)進行快速預(yù)測,達到了較好的預(yù)測效果。 

參考文獻

[1] 劉鎮(zhèn)鳴,龔曉峰.認知無線電中頻譜預(yù)測方法[J].兵工自動化,2017,36(9):86-89.

[2] 尹斯星.認知無線電中基于海量頻譜監(jiān)測數(shù)據(jù)挖掘的動態(tài)頻譜接入策略研究[D].北京:北京郵電大學(xué),2010.

[3] 張凱,齊麗娜.一種基于隱馬爾可夫模型的自適應(yīng)聯(lián)合頻譜預(yù)測方法[J].南京郵電大學(xué)學(xué)報(自然科學(xué)版),2015,35(1):79-83. 

[4] 段洪濤,曾繁聲,李景春.一種預(yù)測頻段占用度的時間序列分析方法[J].無線電工程,2011,41(7):17-20,64.

[5] 楊健,趙杭生,陳曦.遺傳算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)頻譜預(yù)測模型訓(xùn)練[J].解放軍理工大學(xué)學(xué)報(自然科學(xué)版),2016,17(6):505-511.

[6] 滿方微,石榮,何彬彬.基于關(guān)聯(lián)規(guī)則挖掘的無線電頻譜占用預(yù)測[J].電訊技術(shù),2016,56(11):1183-1188.

[7] HUANG P,LIU C,YANG X,et al.Wireless spectrum occupancy prediction based on partial periodic pattern mining[J].IEEE Transactions on Parallel and Distributed Systems,2014,25(7):1925-1934.

[8] JACOB J,JOSE B R,MATHEW J.Spectrum prediction in cognitive radio networks: a bayesian approach[C].2014 Eighth International Conference on Next Generation Mobile Apps,Services and Technologies,Oxford,2014:203-208.

[9] MAN F,SHI R,HE B.The data mining in wireless spectrum monitoring application[C].2017 IEEE 2nd International Conference on Big Data Analysis(ICBDA),Beijing,2017:223-227.

[10] 丁浩,沈文靜.基于動態(tài)門限電平的短波段頻譜占用度測量[C].2011全國無線及移動通信學(xué)術(shù)大會論文集,2011:408-411.



作者信息:

荊  通1,丁文銳1,2,劉春輝2

(1.北京航空航天大學(xué) 電子信息工程學(xué)院,北京100191;2.北京航空航天大學(xué) 無人系統(tǒng)研究院,北京100191)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。