摘 要: 盲源信號分離是一種功能強大的信號處理方法,在生物醫(yī)學(xué)信號處理、陣列信號處理、語音識別、圖像處理及移動通信等領(lǐng)域得到了廣泛的應(yīng)用。簡要介紹了盲源分離的數(shù)學(xué)模型、可實現(xiàn)性、可解的假設(shè)條件及算法,綜述了盲源分離的發(fā)展及研究現(xiàn)狀,提出了其未來的發(fā)展方向。
關(guān)鍵詞: 盲源分離;獨立分量分析;發(fā)展
盲源分離BSS(Blind Source Separation)是信號處理中一個傳統(tǒng)而又極具挑戰(zhàn)性的問題。BSS指僅從若干觀測到的混合信號中恢復(fù)出無法直接觀測的各個原始源信號的過程。這里的“盲”指源信號不可觀測、混合系統(tǒng)特性事先未知這兩個方面。在科學(xué)研究和工程應(yīng)用中,很多觀測信號都可以看成多個源信號的混合,所謂“雞尾酒會”[1]問題就是一個典型的例子。其中獨立分量分析ICA(Independent Component Analysis)[2]是一種盲源信號分離方法,它已成為陣列信號處理和數(shù)據(jù)分析的有力工具,而BSS比ICA適用范圍更寬。目前國內(nèi)對盲信號分離問題的研究,在理論和應(yīng)用方面也取得了很大的進步,但是還有很多問題有待進一步研究和解決。
1 盲源分離基本理論
1.1 盲源分離的數(shù)學(xué)模型
盲信號分離研究的信號模型主要有線性混合模型和卷積混合模型,盲源分離源信號線性混合是比較簡單的一種混合形式,典型的BSS/ICA問題就是源于對獨立源信號的線性混合過程的研究。
1.1.1 盲源分離的線性混合模型
所謂的“雞尾酒會”問題,具體描述是:在一個雞尾酒會現(xiàn)場,如果用安放在不同位置的多個麥克風(fēng)現(xiàn)場錄音,則所記錄的信號實際上是不同聲源的混合信號。人們希望從這些混合錄音信號中把不同的聲源分離出來,這顯然不是一件很容易的事,至少用傳統(tǒng)的頻域濾波方法行不通。因為不同聲源信號的頻譜相互混疊在一起,無法有效地設(shè)計濾波器,但從頻譜的角度可以把不同聲源分離出來。根據(jù)以上描述,可以把盲源分離問題表示為如圖1所示的線性模型。為簡單起見,暫時忽略時延、非線性等因素的影響,即最簡單混合系統(tǒng)——線性瞬時混合系統(tǒng)。
圖中虛線框中的源信號矢量s=(s1,s2,…,sN)T和線性混合矩陣H都是未知的,W為待求的分離矩陣,y=(y1,y2,…,yN)T是分離矩陣W的最終輸出結(jié)果。
盲源分離的最終目的就是尋找分離矩陣W,使輸出信號y盡可能地逼近真實源信號s。顯然,如果知道了分離矩陣,此問題就變成了非常簡單的線性方程組的求解問題。但混合H矩陣未知,且在沒有任何源信號的先驗知識的情況下,源信號的恢復(fù)就成了非常困難的問題,即盲源分離問題。
1.1.2 盲源分離的卷積混合模型
在實際系統(tǒng)中,傳感器接收到的信號往往是源信號經(jīng)過不同時延的線性組合,即觀測信號是源信號的卷積和,稱為線性卷積混合模型。這種混合模型更接近實際。
假設(shè)N個統(tǒng)計獨立的源信號si(t),i=1,2,…,N,經(jīng)過卷積混合后被M個傳感器接收,混合信號為xj(t),j=l,2,…,M,則卷積混合的數(shù)學(xué)模型可以表示為:
A為混合矩陣。當(dāng)L=l時,該模型就退化為瞬時混合模型。
1.2 盲源分離的可實現(xiàn)性
盲源分離的可實現(xiàn)性就是要研究在多大程度上混合矩陣H可以由觀測向量x(t)來辨識。如果一個方陣在每一行及每一列中有且僅有一個非零元素,則稱此方陣為非混合陣。如果C是一個非混合陣,則稱y(t)=Cs(t)是s(t)的一個拷貝。y(t)和s(t)的差異僅表現(xiàn)在各元素的排列順序及各元素的幅度值上。在盲源分離問題中,由于沒有其他先驗知識,所以如果能得到源信號的一個拷貝,就可以說完成了盲源分離的工作。
下面討論為什么在觀測信號x(t)已知的情況下,僅僅根據(jù)“源信號之間是統(tǒng)計獨立的”就能得到源信號的一個拷貝。Dannois定理內(nèi)容如下:
假設(shè)s(t)為一個各分量相互獨立的矢量(其中至多有一個高斯分量),C為一任意的可逆矩陣,如果y(t)=Cs(t)的各分量間也是統(tǒng)計獨立的,則y(t)就是s(t)的一個拷貝(即C是一個非混合矩陣)。
從該定理中發(fā)現(xiàn),除非矩陣C是非混合陣,否則將把一個各分量t相互獨立的向量(至多有一個高斯分量)轉(zhuǎn)換成為一個各分量不相互獨立的向量。這一結(jié)論很關(guān)鍵,它意味著只要設(shè)法使模型中的輸出信號y(t)的各分量相互統(tǒng)計獨立,便可以實現(xiàn)信號的盲分離。算法的最終目的是使經(jīng)過分離矩陣之后的輸出信號的各分量間獨立性最大,以此為根據(jù)來調(diào)整分離矩陣的參數(shù),實現(xiàn)信號的盲分離。
1.3 盲源分離問題的假設(shè)條件
由于對源信號和混合矩陣無先驗知識可以利用,為了使盲源分離問題可解需對源信號和混合矩陣作某些假設(shè)。這些基本的假設(shè)條件[3]包括:
(1)源信號向量s的各分量都是零均值的時隨機信號,且在任意時刻均相互獨立;
(2)最多只有一個源信號分量的概率密度函數(shù)是高斯分布;
(3)混合矩陣H為可逆的或者列滿秩的,m≥n。
1.4 盲源分離算法
瞬時線性混疊盲分離代表性的算法主要有Bell-Sejnowski最大信息量(Infomax)方法、Amari自然梯度(Natural Gradient)方法、Cardoso等變化自適應(yīng)方法(EASI)、Hyvarinen快速獨立元分析算法(FastICA)、矩陣特征值分解方法等。其他算法很多都是在這些算法的基礎(chǔ)上推廣或者補充發(fā)展起來的,當(dāng)然盲分離并不僅僅局限于這些算法。盲分離中經(jīng)常要用到優(yōu)化運算,就優(yōu)化手段而言,Infomax算法、自然梯度算法和EASI算法屬于梯度下降(上升)尋優(yōu)算法,收斂速度是線性的,速度略慢一些,但屬于自適應(yīng)方法,具有實時在線處理能力;FastICA算法是一種快速而數(shù)值穩(wěn)定的方法,采用擬牛頓算法實現(xiàn)尋優(yōu),具有超線性收斂速度,通常收斂速度較梯度下降尋優(yōu)算法快得多;矩陣特征值分解盲分離方法通過對矩陣進行特征分解或者廣義特征分解估計分離矩陣,是一種解析方法,可直接找到閉形式解,沒有迭代尋優(yōu)過程,因此運行速度最快。
相比瞬時線性混疊和卷積混疊盲分離,非線性混疊盲分離難度非常大,主要有自組織映射網(wǎng)絡(luò)方法、感知器模型法、徑向基函數(shù)網(wǎng)絡(luò)法、后非線性混疊盲分離幾類方法。
2 盲源分離的發(fā)展及發(fā)展趨勢
目前國際國內(nèi)對盲源分離問題的研究工作仍處于不斷發(fā)展階段,新理論、新方法還在源源不斷地涌現(xiàn)。
2.1 盲源分離的發(fā)展
1986年,法國學(xué)者Jeanny Herault和Christian Jutten提出了遞歸神經(jīng)網(wǎng)絡(luò)模型和基于Hebb學(xué)習(xí)律的學(xué)習(xí)算法,以實現(xiàn)2個獨立源信號混合的分離。這一開創(chuàng)性的論文在信號處理領(lǐng)域中揭開了新的一章,即盲源分離問題的研究。
其后二十幾年來,對于盲信號分離問題,學(xué)者們提出了很多的算法,每種算法都在一定程度上取得了成功。從算法的角度而言,BSS算法可分為批處理算法和自適應(yīng)算法;從代數(shù)函數(shù)和準(zhǔn)則而言,又分為基于神經(jīng)網(wǎng)絡(luò)的方法、基于高階統(tǒng)計量的方法、基于互信息量的方法、基于非線性函數(shù)的方法等。
盡管國內(nèi)對盲信號分離問題的研究相對較晚,但在理論和應(yīng)用方面也取得很大的進展。清華大學(xué)的張賢達教授在其1996年出版的《時間序列分析——高階統(tǒng)計量方法》一書中,介紹了有關(guān)盲分離的理論基礎(chǔ),其后關(guān)于盲分離的研究才逐漸多起來。近年來國內(nèi)各類基金支持了盲信號處理理論和應(yīng)用的項目,也成立了一些研究小組。
2.2 盲源分離的發(fā)展趨勢
雖然盲源分離理論方法在最近20年已經(jīng)取得了長足的發(fā)展,但是還有許多問題有待進一步研究和解決。首先是理論體系有待完善。實際采用的處理算法或多或少都帶有一些經(jīng)驗知識,對于算法的穩(wěn)定性和收斂性的證明不夠充分。盲源分離尚有大量的理論和實際問題有待解決,例如多維ICA問題、帶噪聲信號的有效分離方法、如何更有效地利用各種先驗知識成功分離或提取出源信號、一般性的非線性混合信號的盲分離、如何與神經(jīng)網(wǎng)絡(luò)有效地結(jié)合、源信號的數(shù)目大于觀察信號的數(shù)目時ICA方法等。另外,盲源分離可同其他學(xué)科有機結(jié)合,如模糊系統(tǒng)理論在盲分離技術(shù)中的應(yīng)用可能是一個有前途的研究方向;盲源分離技術(shù)與遺傳算法相結(jié)合,可以減少計算復(fù)雜度,提高收斂速度。如何有效提高算法對源信號統(tǒng)計特性的學(xué)習(xí)和利用也需要進行深入研究。在硬件實現(xiàn)方面,盲分離問題也存在著極大的發(fā)展空間,例如用FPGA實現(xiàn)等。
經(jīng)過人們將近20年的共同努力,有關(guān)盲分離的理論和算法得到了較快發(fā)展,包括盲分離問題本身的可解性以及求解原理等方面的基本理論問題在一定程度上得到了解決,并提出了一些在分離能力、內(nèi)存需求、計算速度等方面性能各異的算法。由于該問題的理論研究深度和算法實現(xiàn)難度都較大,目前對于盲分離的研究仍然很不成熟,難以滿足許多實際應(yīng)用需求,許多理論問題和算法實現(xiàn)的相應(yīng)技術(shù)也有待進一步探索。
參考文獻
[1] BELL A J, SEJNOWSKI T J.An information maximization approch to blind separation and blind deconvolution[J].Neural Computation,1995,7(6): 1004-1034.
[2] JUTTEN C, HERAULT J.Blind separation of source. Part I:An adaptive algorithm based on neuromimatic architecture[J]. Signal Processing, 1991,24(1):1-10.
[3] 馬建倉,牛奕龍,陳海洋.盲信號處理[M].北京:國防工業(yè)出版社,2003.