0引言
盲源信號(hào)分離(Blind Source Separation,BSS)是指從觀測(cè)到的多源混合信號(hào)中分離并恢復(fù)出相對(duì)獨(dú)立的源信號(hào)過程。因?yàn)閷?duì)源信號(hào)及混合過程知之甚少,無法直接觀測(cè)得到混合信號(hào)中的有用信息,只有通過盲信號(hào)處理手段將它們從混合信號(hào)中分離出來,才能實(shí)現(xiàn)對(duì)所需信號(hào)的提取。由于該技術(shù)具有在相對(duì)寬松的條件實(shí)現(xiàn)有用信號(hào)的恢復(fù)等能力,使之在信號(hào)處理領(lǐng)域受到越來越多的關(guān)注,并已廣泛應(yīng)用于通信、語音處理、地震勘探、生物醫(yī)學(xué)、圖像處理、雷達(dá)以及經(jīng)濟(jì)數(shù)據(jù)分析等領(lǐng)域。
通常的盲源分離算法都不具備對(duì)未知信號(hào)源個(gè)數(shù)進(jìn)行估計(jì)的能力,只能在假設(shè)信號(hào)源的個(gè)數(shù)已經(jīng)事先確定的前提下才能進(jìn)行計(jì)算。因此在處理過程中源數(shù)目估計(jì)對(duì)盲分離技術(shù)的發(fā)展具有重要意義,也是目前必須予以解決的問題。目前有關(guān)通信偵查中盲分離源數(shù)目估計(jì)的專門研究尚不多見,本文研究優(yōu)化了一種基于累積量算法的源數(shù)估計(jì)算法,可在無先驗(yàn)知識(shí)的情況下估計(jì)出欠定條件下信號(hào)源個(gè)數(shù)。
1信號(hào)模型和問題描述
盲源信號(hào)分離理論中,混合過程分為線性瞬時(shí)混合模型與卷積混合模型兩類。對(duì)源信號(hào)統(tǒng)計(jì)性質(zhì)的要求還與所采用的盲分離算法有關(guān)。本文著重討論線性混合盲信號(hào)分離問題情況下信號(hào)源數(shù)目估計(jì)。
存在n個(gè)來自信號(hào)源的統(tǒng)計(jì)獨(dú)立n維的信號(hào)矢量s1(t),s2(t),…,sn(t),通過m×n的混合矩陣A,線性瞬時(shí)混合后得到的m個(gè)觀測(cè)信號(hào)x1(t),x2(t),…,xm(t)。
信號(hào)模型為:
式中:aij是混合矩陣系數(shù);ni為隨機(jī)觀測(cè)噪聲;矢量和矩陣表達(dá)式為:
式中:n為m×1噪聲矢量。該模型與標(biāo)準(zhǔn)陣列信號(hào)處理的觀測(cè)信號(hào)模型相似,但在盲信號(hào)分離中,信號(hào)的混合系數(shù)并沒有類似陣列信號(hào)模型中的波達(dá)方向角等先驗(yàn)信息可以利用。
因此信號(hào)源盲分離問題可以描述為計(jì)算一個(gè)n×m的分離矩陣W,使其輸出y(t)=Wx(t)為對(duì)s(t)的一個(gè)估計(jì)。由于上式中的混合矩陣A和s(t)都未知,因此無法精確辨識(shí)源信號(hào)各分量的排列順序和能量,這即是盲信號(hào)分離問題存在的不確定性問題,一是排列順序的不確定性,即無法了解所抽取的信號(hào)應(yīng)是s(t)中的哪一個(gè)分量;二是信號(hào)幅度的不確定性,即無法恢復(fù)信號(hào)波形的真實(shí)幅值。由于信息主要包含在信號(hào)的波形中,所以這兩種不確定性并不影響盲分離技術(shù)的應(yīng)用。但信號(hào)源盲分離的大多數(shù)實(shí)際問題中,不僅信號(hào)源的波形未知,其數(shù)目也是未知的。這就無法確定分離矩陣W的維數(shù),從而使計(jì)算根本無法進(jìn)行。故在進(jìn)行盲分離前,須對(duì)信號(hào)源數(shù)目進(jìn)行估計(jì)。
目前常用的源信號(hào)個(gè)數(shù)估計(jì)方法多是基于觀測(cè)信號(hào)y(t)的協(xié)方差矩陣特征分解,易得觀測(cè)信號(hào)y(t)的協(xié)方差矩陣為:
式中:Rs表示源信號(hào)的協(xié)方差矩陣,記協(xié)方差矩陣Rx特征值為λ1≥λ2≥…≥λn。由于A列滿秩,ARSAT的秩等于k,Rx的特征分解后得到k個(gè)按降序排列的主特征值Λs=diag(λ1,λ2,…,λk)和(m-k)均等于σ2的噪聲特征值Λn=diag(λk+1,λk+2,…,λn)=σ2。信源個(gè)數(shù)就等于k,即m減去相同的最小特征值的個(gè)數(shù),僅由觀察其最小特征值重復(fù)出現(xiàn)次數(shù)就可以確定源信號(hào)個(gè)數(shù)。但是通常觀測(cè)信號(hào)y(t)的協(xié)方差矩陣是未知的,當(dāng)Rx由一組觀測(cè)向量估計(jì)得到時(shí),Rx的特征值各不相同的概率幾乎為1,當(dāng)信噪比比較低時(shí),就很難通過僅觀察特征值來估計(jì)源信號(hào)個(gè)數(shù)。
Wax M和Kailath T提出應(yīng)用信息論中模型AIC和MDL準(zhǔn)則估計(jì)源信號(hào)個(gè)數(shù),上述準(zhǔn)則都是在標(biāo)準(zhǔn)陣列信號(hào)處理中,基于觀測(cè)信號(hào)均服從高斯分布這一基本假設(shè)推導(dǎo)得到的,在標(biāo)準(zhǔn)陣列信號(hào)處理模型而源信號(hào)非高斯的情形下,H T Wu等給出了源信號(hào)個(gè)數(shù)的啟發(fā)性GDE估計(jì),許多國內(nèi)學(xué)者也提出很多新的算法。傳統(tǒng)的盲源分離算法都假設(shè)觀測(cè)信號(hào)數(shù)目大于或者等于源信號(hào)數(shù)目,然而在一些實(shí)際應(yīng)用中會(huì)發(fā)生觀測(cè)信號(hào)數(shù)目小于源信號(hào)數(shù)目的情況,稱為欠定盲源分離,即過完備盲源分離。由于混合系統(tǒng)是欠定的,此時(shí)混合系統(tǒng)不再可逆,從而不能簡(jiǎn)單地通過對(duì)混合矩陣求逆得到源信號(hào)。因?yàn)樵诨旌线^程中有信息丟失,即使混合矩陣A已知,也不能完全恢復(fù)出信號(hào)的獨(dú)立成分。
2基于高階累積量的盲信號(hào)信源數(shù)目估計(jì)算法
2.1四階累積量的定義
在實(shí)際問題中,一階和二階統(tǒng)計(jì)量并不能完全描述信號(hào)的統(tǒng)計(jì)特性,采用高階統(tǒng)計(jì)量的形式不僅可以獲得比二階統(tǒng)計(jì)量更好的性能,而且可以解決二階統(tǒng)計(jì)量不能解決的很多問題。四階統(tǒng)計(jì)量的重要特點(diǎn)是對(duì)任何形式下高斯過程的不敏感性,并且在數(shù)學(xué)形式有很多好的性質(zhì),這是二階矩所不具備的,因此可以有效地從高斯過程中提取出非高斯信號(hào)或抑制高斯噪聲。這點(diǎn)對(duì)于未知譜特性的高斯噪聲情況顯得尤其重要。由于基于高階累積量的相關(guān)算法對(duì)高斯噪聲嚏盲的,不僅在白高斯噪聲下能正確估計(jì)信號(hào)源個(gè)數(shù),而且對(duì)色高斯噪聲和相關(guān)高斯噪聲均能有效地抑制,仍能給出一致性的估計(jì)。
對(duì)于給定隨機(jī)變量x1,x2,x3,x4零均值實(shí)隨機(jī)變量,定義其四階累計(jì)量:
2.2累積量擴(kuò)展矩陣的構(gòu)造
在欠定條件下,傳統(tǒng)信源數(shù)目估計(jì)方法完全失效,通過利用四階累積量的陣列孔徑擴(kuò)展特性,構(gòu)造適當(dāng)?shù)乃碾A累積量矩陣,對(duì)協(xié)方差矩陣進(jìn)行擴(kuò)展,使源信號(hào)個(gè)數(shù)的信息包含于該矩陣中,以估計(jì)出多于觀測(cè)信號(hào)數(shù)目的非高斯信號(hào)源,借以提高估計(jì)算法的性能,突破子空間類算法對(duì)入射信號(hào)數(shù)的限制。
構(gòu)造的累積量擴(kuò)維矩陣可以用Kronecker乘積表示,易得實(shí)信號(hào)模型:
則新信號(hào)模型易得:
新的混合矩陣中系數(shù)位置和原有混合矩陣的位置十分類似,但構(gòu)成的新矩陣仍然能保持原有信號(hào)的獨(dú)立性,滿足盲信號(hào)分離的基本條件。N個(gè)信源,M個(gè)通道,M>N,則對(duì)GX特征分解后,得到N2大特征值和M2-N2個(gè)小特征值。
2.3算法提出
通過結(jié)合高階累積量優(yōu)化過程研究cum-奇異值算法。根據(jù)項(xiàng)目條件,在雙通道條件下進(jìn)行盲源數(shù)目的估計(jì)。計(jì)算過程如下:
設(shè)有n個(gè)信號(hào)(獨(dú)立)經(jīng)過m個(gè)通道混合:
(1)采集數(shù)據(jù)x=[x1(n),x2(n),…,xm(n)]T;
(2)通過高階累積優(yōu)化構(gòu)造的四階累積量矩陣CX;
(3)對(duì)CX運(yùn)用cum-奇異值算法得到m2個(gè)特征值,并將這些特征值從大到小排列σ1≥σ2≥…≥σm;
(4)主特征值數(shù)εδ=k0+1,k0的取值為εδ=γ(kmax)的值,γk=σk+1/σk+2即所求信號(hào)源個(gè)數(shù)。
3仿真實(shí)驗(yàn)
采用2通道3源信號(hào)的欠定條件下情形進(jìn)行仿真實(shí)驗(yàn),仿真根據(jù)項(xiàng)目背景選取的兩組三個(gè)獨(dú)立信號(hào)源分別為AM,F(xiàn)M,BPSK為第一組信號(hào);BPSK,QAM,LFM為第二組信號(hào)。其中,AM,F(xiàn)M的載頻為20 MHz,帶寬10 MHz;BPSK和QAM信號(hào)的載頻為20 MHz,碼速率為5 MHz;線性調(diào)頻信號(hào)的初始頻率為20 MHz,帶寬為20 MHz。
3.1實(shí)驗(yàn)一:信源估計(jì)算法性能隨混合信號(hào)SNR變化的圖表
任取500點(diǎn)數(shù)據(jù),SNR線性變化范圍為-10~10 dB,步長為1 dB,每個(gè)SNR點(diǎn)做100次蒙特卡洛仿真。目標(biāo)個(gè)數(shù)估計(jì)正確率如圖1所示,在欠定條件下優(yōu)化后,cum-奇異值算法不僅可以估計(jì)信源個(gè)數(shù),而且隨SNR的遞增,正確估計(jì)的概率不斷增大,但同其他經(jīng)典算法相比,仍然是用時(shí)最短的最穩(wěn)定算法。圖2為第二組信號(hào)的正確估計(jì)概率。可以看出,該各個(gè)算法的性能均明顯有所下降,說明對(duì)于不同的信號(hào)模型,算法的性能有所不同。盲分離中信源數(shù)目估計(jì)對(duì)模型信號(hào)具有一定的要求,不同的混合信號(hào)在不同的SNR下正確估計(jì)的概率有很大的區(qū)別,而通用的方法則不是很多。
3.2實(shí)驗(yàn)二:信源估計(jì)算法性能隨混合信號(hào)采樣點(diǎn)數(shù)變化的圖表
仿真在SNR為8 dB下,數(shù)據(jù)長度從50~450遞增,步長為50,每個(gè)點(diǎn)做100次蒙特卡洛仿真。如圖3所示,四階累積量SVD算法在小樣本條件下性能突出,具有比AIC,MDL算法更高的正確率。但隨快拍數(shù)逐漸增加,基于信息論的算法性能開始好轉(zhuǎn)。圖4說明在同等實(shí)驗(yàn)條件下,不同的信源組合,帶來不同的算法性能。
4結(jié)語
本文從盲信號(hào)分離的基本假設(shè)出發(fā),研究了通信偵查中雙通道盲信號(hào)個(gè)數(shù)的估計(jì)方法,通過借鑒陣列信號(hào)處理理論,證明了欠定條件下高階累積量優(yōu)化流程可以應(yīng)用在信源數(shù)目估計(jì)的問題,并分別討論了信噪比和采樣點(diǎn)數(shù)這兩個(gè)參數(shù)的變化對(duì)優(yōu)化后算法性能的影響。結(jié)果表明,在不同的信號(hào)混合情況下,信源算法估計(jì)的性能會(huì)不同,因?yàn)槭苄旁茨P汀鞑キh(huán)境等多個(gè)因素的影響,會(huì)造成性能下降。有關(guān)信號(hào)模型的多樣性和信源估計(jì)算法的局限性及更多數(shù)目的情況還有待深入研究,解決方法在后續(xù)的修正算法中探討解決。