文獻(xiàn)標(biāo)識碼: A
文章編號: 0258-7998(2011)12-0076-04
基于案例推理CBR(Case-Based Reasoning)借鑒人類處理問題的方式,運(yùn)用以前積累的知識和經(jīng)驗(yàn)直接解決問題。由于CBR具備自主學(xué)習(xí)功能,不要求決策主體掌握豐富領(lǐng)域知識或精確的數(shù)學(xué)模型,僅僅通過簡單的案例記憶就能實(shí)現(xiàn)出色的增量學(xué)習(xí)和自我提升,因而引起相關(guān)專家和學(xué)者的關(guān)注,逐漸成為人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)。
認(rèn)知無線電技術(shù)作為無線通信領(lǐng)域與人工智能領(lǐng)域相結(jié)合的產(chǎn)物[1],近年來受到極大關(guān)注。認(rèn)知決策引擎是認(rèn)知無線電CR(Cognitive Radio)實(shí)現(xiàn)其智能的核心功能模塊,決策引擎以CR觀察到的外界無線環(huán)境、CR自身狀態(tài)和用戶需求信息為輸入,對目標(biāo)和情境進(jìn)行分析,根據(jù)已有知識進(jìn)行推理、決策,輸出達(dá)到用戶需求的優(yōu)化配置,同時(shí)能夠?qū)W習(xí)不同配置在新環(huán)境下的效用,從而豐富系統(tǒng)知識,以適應(yīng)環(huán)境和需求的變化[2]。
當(dāng)認(rèn)知無線電可以通過觀察獲得需要的所有環(huán)境知識(表示為c),且用戶需求u與環(huán)境c和配置d之間的定量關(guān)系u=f(c,d)已知時(shí),將認(rèn)知決策的過程建模為一個(gè)優(yōu)化問題[3],即在給定的環(huán)境c下,尋找最優(yōu)配置決策d,使性能u最大(或?qū)ふ夷硞€(gè)配置決策d,使性能u得到滿足)的情況。參考文獻(xiàn)[4]使用遺傳算法對CR中多目標(biāo)優(yōu)化問題進(jìn)行了研究,參考文獻(xiàn)[5]將粒子群優(yōu)化算法應(yīng)用在認(rèn)知引擎的決策問題中,參考文獻(xiàn)[6]考慮遺傳算法中參數(shù)敏感度對不同目標(biāo)的影響,進(jìn)一步提升了優(yōu)化效率。然而,在實(shí)際應(yīng)用中,CR可直接觀測得到的環(huán)境參數(shù)有限(比如信道統(tǒng)計(jì)特性等無法直接觀測得到),且系統(tǒng)可能面臨各種不同的傳播環(huán)境、動(dòng)態(tài)接入不同頻段的信道,輸入c和u與輸出d的關(guān)系很復(fù)雜,函數(shù)f無法事先確知。此時(shí),認(rèn)知無線電需要通過不斷地學(xué)習(xí)來理解并適應(yīng)環(huán)境。目前,針對環(huán)境部分可觀測、精確函數(shù)f未知下的認(rèn)知決策系統(tǒng)研究才剛起步,參考文獻(xiàn)[3]簡單舉例說明了學(xué)習(xí)在解決這類問題當(dāng)中的關(guān)鍵作用,但尚未有相關(guān)系統(tǒng)的研究成果出現(xiàn)。
本文針對這類問題,研究基于案例的推理決策問題,提出基于案例庫的認(rèn)知決策引擎。文中所提決策框架具有自學(xué)習(xí)、多狀態(tài)多目標(biāo)通用性強(qiáng)、快速收斂等特點(diǎn)。
1 CBR簡介
基于案例的推理模仿人類的思維方式,直接援引以前積累的經(jīng)驗(yàn)和知識解決現(xiàn)在的問題,同時(shí)將當(dāng)前問題及解決結(jié)果補(bǔ)充為新知識,從而實(shí)現(xiàn)自主學(xué)習(xí)和增量學(xué)習(xí)。
通常,CBR系統(tǒng)的運(yùn)作過程可以概括為“4Rs”(如圖1所示):
(1)檢索(Retrieve):分析當(dāng)前面臨的新問題,定義新問題的特征或?qū)傩?,在案例庫中尋找對解決當(dāng)前問題有最大潛在啟發(fā)價(jià)值的舊案例;
(2)重用(Reuse):以相似案例為基礎(chǔ),通過自適應(yīng)的調(diào)整,構(gòu)造新問題的解決策略;
(3)修訂(Revise):執(zhí)行并驗(yàn)證當(dāng)前策略;
(4)存儲(Retain):將有參考價(jià)值的經(jīng)驗(yàn)案例存儲到案例庫中。
其中,檢索和重用屬于推理階段,修訂和存儲屬于學(xué)習(xí)階段,學(xué)習(xí)的過程將以往的決策經(jīng)驗(yàn)以案例的形式進(jìn)行積累,使系統(tǒng)知識不斷豐富,以提高未來推理的效能,從而在面對新問題時(shí)能夠做出更好的決策。
2 基于CBR與模擬退火的自學(xué)習(xí)認(rèn)知決策算法
認(rèn)知引擎的輸入變量包括用戶的目標(biāo)需求、觀測到的無線環(huán)境變量以及CR自身狀態(tài),三者共同影響認(rèn)知引擎的配置決策。為了使CR通信案例庫具有廣泛的可借鑒性,為不同目標(biāo)、不同狀態(tài)的CR決策提供參考,構(gòu)建如表1所示案例庫。其中條件屬性包括觀測的無線環(huán)境特征和自身狀態(tài)(如當(dāng)前信道是否空閑、最大發(fā)射功率、可選的調(diào)制編碼方式等),用于描述問題發(fā)生的場景或情境。決策屬性為CR所作的一些反應(yīng),包括信道、發(fā)射功率、調(diào)制方式、編碼方式、數(shù)據(jù)包長等配置參數(shù)。結(jié)果為在不同條件屬性下,相應(yīng)配置所帶來的不同目標(biāo)的實(shí)際性能,如誤比特率、吞吐量、頻譜效率、存活時(shí)間等。
出,算法具有快速收斂性(決策100次左右,算法已經(jīng)能夠獲取可觀的性能),且退火系數(shù)越小,溫度下降越快,收斂也越快,但過快收斂的代價(jià)是性能次優(yōu);而反之,過大的退火系數(shù)能夠帶來更優(yōu)的吞吐量,然而收斂速度相對較慢。在接下來的仿真中,取λ=0.5。
為驗(yàn)證本算法對于不同通信目標(biāo)的廣泛通用性,考慮兩種典型通信目標(biāo)。目標(biāo)1:最大化系統(tǒng)吞吐量;目標(biāo)2:在保證系統(tǒng)吞吐量大于4 Mb/s前提下,最大化頻譜能效。仿真結(jié)果如圖3所示。對于通信目標(biāo)1,隨著案例經(jīng)驗(yàn)的累積,其學(xué)到的知識也日益豐富,因而系統(tǒng)吞吐量性能越來越好(如圖3左上所示),但其頻譜效能并未得到提高(圖3左下)。對于通信目標(biāo)2,在配置決策滿足吞吐量的目標(biāo)要求下(圖3右上),系統(tǒng)的頻譜效能隨著決策的進(jìn)行逐漸提高(圖3右下)。仿真結(jié)果表明本算法可以滿足不同的目標(biāo)需求。
圖4為功率參數(shù)調(diào)整曲線。如圖,當(dāng)通信目標(biāo)為最大化用戶吞吐量時(shí),盡管系統(tǒng)不知道功率越大則吞吐量越大的這種先驗(yàn)知識,但是通過不斷學(xué)習(xí),系統(tǒng)不斷調(diào)整其發(fā)射功率,使其逼近于最大發(fā)射功率23 dBm。另一方面,對于最大化頻譜能效的用戶而言,功率將被調(diào)整到一個(gè)適合的大小。
圖5和圖6分別統(tǒng)計(jì)了兩種目標(biāo)下,不同信道和不同調(diào)制方式被應(yīng)用的概率。針對通信目標(biāo)1,CR首選信道5并采用16QAM的調(diào)制方式(5信道帶寬大且傳播損耗相對較小),而針對目標(biāo)2,CR首選信道傳播損耗最小的信道6,并應(yīng)用調(diào)制階數(shù)最高的64QAM調(diào)制方式。
本文針對認(rèn)知無線電中環(huán)境部分可觀測,信道統(tǒng)計(jì)信息先驗(yàn)未知,且系統(tǒng)的目標(biāo)、環(huán)境與配置間的關(guān)系不明確,需要通過學(xué)習(xí)進(jìn)行配置決策的問題,提出了一種基于案例推理和模擬退火思想的認(rèn)知決策引擎算法,理論分析和仿真結(jié)果表明,該算法具有增量自學(xué)習(xí)、多目標(biāo)適用性、快速收斂等優(yōu)點(diǎn)。案例庫有廣泛借鑒性,可實(shí)現(xiàn)在不同節(jié)點(diǎn)間相互學(xué)習(xí)的功能,下一步可研究關(guān)于多節(jié)點(diǎn)合作的學(xué)習(xí)引擎的實(shí)現(xiàn)方法,如何應(yīng)用數(shù)據(jù)挖掘的方法從案例庫中提取出有用知識的問題也有待進(jìn)一步研究。
參考文獻(xiàn)
[1] MITOLA J. Cognitive radio-making software radios more personal[J]. IEEE Personal Communications, 1999,6(4):13-18.
[2] 汪李峰,魏勝群.認(rèn)知引擎技術(shù)[J].中興通信技術(shù),2009,15(04):05-09.
[3] CLANCY C,HECKER J,et al.Application of machine learning to cognitive radio networks[J].IEEE Wireless Communications, 2007,14(4):47-52.
[4] RIESER C J. Biologically inspired cognitive radio engine model utilizing distributed genetic algorithms for secure and robust wireless communications and networking[D]. Blacksburg,VA,USA:Virginia Polytechnic Institute and State University, 2004.
[5] 趙知?jiǎng)?,徐世宇,鄭仕?等.基于二進(jìn)制粒子群算法的認(rèn)知無線電決策引擎[J].物理學(xué)報(bào), 2009,58(7):5118-5125.
[6] NEWMAN T R, EVANS J B. Parameter sensitivity in cognitive radio adaptation engines[C]. New Frontiers in Dynamic Spectrum Access Networks, DySPAN 2008, 3st IEEE International Symposium on, Chicago, IL(2008-01-05.