文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.191010
中文引用格式: 荊通,丁文銳,劉春輝. 基于關聯規(guī)則挖掘的多步長頻譜占用預測方法[J].電子技術應用,2020,46(3):80-85.
英文引用格式: Jing Tong,Ding Wenrui,Liu Chunhui. Multi-step spectrum occupancy prediction method based on association rule mining[J]. Application of Electronic Technique,2020,46(3):80-85.
0 引言
認知無線電技術提高了系統(tǒng)的頻譜利用率,然而在傳統(tǒng)頻譜感知中,認知用戶對所有頻帶進行感知會造成大量的能量損耗和處理時延,因此如何準確預測空間頻譜占用情況,即頻譜預測技術,受到研究人員的廣泛研究。頻譜預測技術能夠為認知用戶提供更好的頻譜接入條件,減少認知用戶和主用戶之間產生的數據傳輸沖突,避免對主用戶通信造成干擾,降低響應時延,增加網絡的吞吐量[1]。頻譜預測過程一般包含3個步驟:(1)數據采集,實際頻譜采集或建立仿真頻譜模型生成;(2)數據預處理,有效數據選取、信號與噪聲的分離;(3)頻譜預測,設計頻譜預測方法進行預測。
設計有效的頻譜預測方法需考慮預測機制與預測方法兩方面:預測機制大多是采用時隙通信模式,將每個時隙的頻譜占用或空閑情況定義為一個二元時間序列,通過分析歷史數據獲取頻譜使用規(guī)律,進而預測未來頻譜占用狀態(tài)[2];頻譜預測方法主要有基于隱馬爾可夫(Hidden Markov Model,HMM)的方法[3]、基于自回歸移動平均模型(Autoregressive Integrated Moving Average,ARIMA)的方法[4]、基于神經網絡的方法[5]、基于關聯規(guī)則挖掘的方法等[6]?;陉P聯規(guī)則挖掘的方法在頻譜預測中性能表現較好,這類方法又包括基于部分周期模式挖掘的方法[6]、基于貝葉斯的方法[7]、應用統(tǒng)計學習的方法[8]以及最大子模式命中[9]等。
在實際頻譜預測應用中,往往不僅需要預測下一個時隙的頻譜占用情況,而且需要預測多個時隙一分鐘甚至一小時的頻譜占用情況,進而統(tǒng)計分析信道的可用性,避免頻繁切換信道。現有方法只能保證下一個時隙的一步預測效果較為理想,而多時隙多步預測存在效果下降較快的問題。針對這一問題,本文借鑒Apriori算法中查找頻繁項集的思想,提出基于關聯規(guī)則挖掘的多步長頻譜占用預測方法,通過采集真實數據對所提出方法進行實驗驗證。
1 頻譜占用度
1.1 頻譜占用度預測用數據選取
信道頻譜占用度可以體現頻譜的活躍程度,信道頻譜活躍程度對驗證方法的可行性十分關鍵。若信道頻譜占用度極低(0%~5%),數據處理后生成的信道狀態(tài)信息(Channel State Information,CSI)序列將近似為全0序列;若信道頻譜占用度極高(95%~100%),生成的CSI序列將近似為全1序列,對這些信道進行CSI序列預測得到的結果極為可觀,正確率可達到90%以上,丟失率接近0。但這兩種極端情況都將使得CSI信道活躍度降低,即0/1狀態(tài)的轉換頻率變低,此時頻譜占用預測也將失去意義。故本文選取頻譜占用度35%~94%的信道進行預測分析。信道占用度計算方法如式(1)所示:
其中,Fco表示信道占用度,Tf表示信道占用時間,T表示信道測量時間。
1.2 頻譜占用度閾值選取
頻譜占用狀態(tài)只有兩種:占用和空閑。通常,信道頻譜強度高于某門限,則認為信道處于被占用狀態(tài),用“1”表示;相反,認為信道處于空閑狀態(tài),用“0”表示,轉換原理如式(2)所示:
其中,cs表示信道狀態(tài),PC表示信道電平值,PO表示預設門限值。該過程中如果預設門限值設置較小,則某些噪聲信號將被誤認為是有用信號;若門限設置較高,則會遺漏有用信號,因此頻譜占用度閾值的選取是數據預處理過程較為關鍵的步驟。
本文采用動態(tài)門限分割[10]的方法確定頻譜占用度門限,方法流程如圖1所示。
動態(tài)門限分割方法涉及兩個參數,一個是用于信噪分離的判別值,另一個是噪聲曲線平滑處理的次數。在《超短波頻段占用度測試技術規(guī)范》中,建議門限電平設置為各頻段內當地接收機平均功率電平或電壓指示以上5 dB。在無線電監(jiān)測工作中,一般把超過噪聲電平3 dB~5 dB的頻點視為信號。基于以上兩點,本文采用5 dB作為信噪分離的判別值,平滑處理次數取60,動態(tài)門限如圖2所示。
圖2(a)信道編號為3,統(tǒng)計電平值較低,多數集中在-76.45 dBm左右,且處于動態(tài)判決門限以下,被認定為噪聲信道;圖2(b)信道編號為61,統(tǒng)計電平值較高,多數集中在-67.45 dBm左右,且處于動態(tài)判決門限以上,被認定為信號信道。
各個信道的幅度-頻率信號被動態(tài)門限分割之后就形成了CSI矩陣,如圖3所示(圖中黑色實心方塊表示當前CSI=1,空白處則表示CSI=0)。
2 算法原理
2.1 時間序列關聯規(guī)則挖掘算法
Apriori算法[6]是關聯規(guī)則挖掘算法中經典的算法,多用于非時序項集。算法一般分為兩部,一是生成頻繁模式,二是根據頻繁模式生成關聯規(guī)則。而使用該算法處理時間序列數據時,必須對序列進行模式劃分。對序列進行模式劃分時,每次取一部分數據進行時間序列關聯規(guī)則計算,然后向后滑動一個窗口,產生一個新的事務,再次計算時間序列關聯規(guī)則。保持每個事務窗口一致,這樣可以使當前事務區(qū)別于上一個事務,同時又不會漏掉可能產生的時間序列特征組合,如圖4所示。
時間序列關聯規(guī)則挖掘過程中有兩個重要判決條件:(1)當模式出現次數N大于最小支持度時,生成頻繁模式;(2)頻繁模式轉移率P大于最小置信度時,生成關聯規(guī)則,如圖5所示。
2.2 基于關聯規(guī)則挖掘的多步長頻譜占用預測算法
本節(jié)將使用上文方法生成的關聯規(guī)則進行多步長頻譜占用預測。
本文算法涉及概念和符號見表1。
輸入:原始幅度頻率數據(File_level)。
輸出:預測的準確率以及丟失率。
(1)將原始幅度頻率數據通過動態(tài)門限分割、信道分割,生成由0和1組成的CSI序列。
(2)當生成的CSI序列長度大于跨度L時,檢測序列中異常值的情況,進行基于關聯規(guī)則挖掘的多步長頻譜占用預測。
(3)對預測結果與實際監(jiān)測結果進行對比,統(tǒng)計預測準確率和丟失率。
算法中輸入的原始數據為401×n的矩陣(File_level),n為采集數據的時隙數(本文時隙間隔為1 s),通過動態(tài)門限分割以及信道編號(1~401)的選擇,形成單一信道的CSI序列。頻繁項跨度(FrQ_length)限定了頻繁子序列長度的最大值,取值范圍可設為1~n之中的任意整數值,當其設為1時,算法可近似于兩狀態(tài)馬爾可夫過程;當其設置為接近n時,頻繁項數量太少,算法失效,故本文取10%n。最小支持度(Min_sup)與最小置信度(Min_conf)體現了頻繁項的頻繁程度以及規(guī)則的可靠性。最小預測長度(Min_span)的設定可以減少頻繁子序列生成規(guī)則的數量,提升算法效率和精度。
關聯規(guī)則是頻譜占用預測的主要依據。項集統(tǒng)計數大于Min_sup即為頻繁項,若頻繁項A統(tǒng)計數為a、頻繁項B統(tǒng)計數為b,則轉移率Pab=a/b,當Pab大于Min_conf時產生強關聯規(guī)則,即當前序列為A時,預測結果為B的概率為Pab。
圖6為多步長頻譜占用預測算法流程。
在多步長預測過程中,算法沒有在規(guī)則中找到適合的規(guī)則,則記為一次丟失,輸出“-1”,即異常值,異常值的出現會影響下一次的預測,所以要進行異常值替換,每個異常值“-1”都會分兩次替換成“0”或“1”,例如序列[1 0 -1 0]會替換成[1 0 0 0]和[1 0 1 0],由這兩個序列查找關聯規(guī)則中置信度最高的規(guī)則進行預測或者繼續(xù)丟失,即如果有m個異常值,則要進行2m次替換,最終由替換后的序列置信度最高值進行預測或者繼續(xù)丟失。若Pred_length>1,即多步長,步長遞增過程如圖7所示,圖中標注下劃線并加粗的字符為預測序列值,算法使用預測結果更新CSI序列,直至完成多步長預測算法。
若當前序列滿足預測條件,記預測次數(Predict)加1;若預測結果與下一時隙狀態(tài)序列相同,記預測正確次數(Correct)加1;若最終沒有找到滿足預測條件的關聯規(guī)則,記丟失次數(Loss)加1,丟失率記為Loss_Rate,公式如下:
3 實驗及分析
3.1 數據采集與預處理
本文中的頻譜監(jiān)測數據來自北京航空航天大學學院路校區(qū)連續(xù)約48 h(2018年12月22日16時22分~2018年12月24日16時25分)頻段為88 MHz~108 MHz,即調頻FM廣播業(yè)務頻段進行監(jiān)測,監(jiān)測設備包括是德公司E4407b頻譜分析儀、PC以及SAS-521F-2接收天線,表2列出了監(jiān)測參數。
頻譜儀每次掃描空間頻譜獲得400個頻譜采樣點,在監(jiān)測時間內每一秒形成一個“場強-頻率”對應關系的文本數據文件,因此每小時產生3 600個數據集。
數據的選取對預測模型的學習效果有著極為重要的影響,合適的數據能夠為提高預測模型的正確率提供良好的支持。正常情況下,頻譜的短期變化趨勢是連續(xù)的,而長期變化具有明顯的周期性,周期性具體體現在日、星期、年周期性以及節(jié)假日特性。為了提高信道頻譜占用預測精度,在數據選擇時應考慮這一周期性特點。故本文采用第一天100時隙作為訓練集,第二天相同時間的100時隙作為測試集。
圖8為對所采集到的頻譜數據進行“場強-頻率-時間”三維可視化處理結果。
3.2 主要參數分析
3.2.1 多步長對預測結果的影響
圖9和圖10分別展示了13號和86號信道中預測步長對預測結果的影響。
通過信道13和信道86的10步預測結果可見,隨著預測步長的增加,預測丟失率逐漸減少,雖然預測正確率也隨步長增加呈下降趨勢,但下降趨勢較緩,總預測正確率由于丟失率的逐漸減少,隨預測步長的增加呈略微上升的趨勢??梢娫撍惴ㄔ诙嗖介L預測中有效減少丟失率的同時,保持了較高的預測正確率。
3.2.2 信道占用度對預測結果的影響
本實驗中選取了占用度由35%到94%依次升高的6個信道。圖11展示了預測步長為1和10的結果。
從圖11中可以看出,總體上信道占用預測正確率保持較高的水準,其丟失率沒有隨著占用度的變化有正相關或者負相關的規(guī)律。由此可見總體上算法體現出了良好的性能,信道占用度的變化對預測結果的影響不大。
3.2.3 規(guī)則置信度對預測結果的影響
圖12(a)和圖12(b)分別展示了3個信道在最小置信度為0.7、0.8和0.9時的正確率和丟失率。
從圖12中可以看出,隨著最小置信度由0.7升高至0.9,丟失率由15%左右升高至40%左右??梢?,最小置信度的設置對丟失率影響很大,這是由于隨著最小置信度的升高,可用的關聯規(guī)則逐漸減少,即信道信息的可預測性降低。預測正確率隨最小置信度的提高緩慢升高,而預測丟失率則隨最小置信度的提高急劇升高,因此,設置適合的最小置信度對CSI序列的可預測性至關重要。
4 結論
本文提出類Apriori算法的頻繁模式關聯規(guī)則挖掘算法,實現對信道占用狀態(tài)的多步長預測。實驗表明,該算法在實際頻譜預測中相比隱馬爾科夫模型和神經網絡模型等預測方法,不需要任何先驗知識,可根據歷史數據進行快速預測,達到了較好的預測效果。
參考文獻
[1] 劉鎮(zhèn)鳴,龔曉峰.認知無線電中頻譜預測方法[J].兵工自動化,2017,36(9):86-89.
[2] 尹斯星.認知無線電中基于海量頻譜監(jiān)測數據挖掘的動態(tài)頻譜接入策略研究[D].北京:北京郵電大學,2010.
[3] 張凱,齊麗娜.一種基于隱馬爾可夫模型的自適應聯合頻譜預測方法[J].南京郵電大學學報(自然科學版),2015,35(1):79-83.
[4] 段洪濤,曾繁聲,李景春.一種預測頻段占用度的時間序列分析方法[J].無線電工程,2011,41(7):17-20,64.
[5] 楊健,趙杭生,陳曦.遺傳算法優(yōu)化的神經網絡頻譜預測模型訓練[J].解放軍理工大學學報(自然科學版),2016,17(6):505-511.
[6] 滿方微,石榮,何彬彬.基于關聯規(guī)則挖掘的無線電頻譜占用預測[J].電訊技術,2016,56(11):1183-1188.
[7] HUANG P,LIU C,YANG X,et al.Wireless spectrum occupancy prediction based on partial periodic pattern mining[J].IEEE Transactions on Parallel and Distributed Systems,2014,25(7):1925-1934.
[8] JACOB J,JOSE B R,MATHEW J.Spectrum prediction in cognitive radio networks: a bayesian approach[C].2014 Eighth International Conference on Next Generation Mobile Apps,Services and Technologies,Oxford,2014:203-208.
[9] MAN F,SHI R,HE B.The data mining in wireless spectrum monitoring application[C].2017 IEEE 2nd International Conference on Big Data Analysis(ICBDA),Beijing,2017:223-227.
[10] 丁浩,沈文靜.基于動態(tài)門限電平的短波段頻譜占用度測量[C].2011全國無線及移動通信學術大會論文集,2011:408-411.
作者信息:
荊 通1,丁文銳1,2,劉春輝2
(1.北京航空航天大學 電子信息工程學院,北京100191;2.北京航空航天大學 無人系統(tǒng)研究院,北京100191)