文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.172043
中文引用格式: 張秀再,王婷,郭業(yè)才,等. 基于維納后置濾波的LS波束形成混響抑制算法[J].電子技術(shù)應(yīng)用,2018,44(3):131-134.
英文引用格式: Zhang Xiuzai,Wang Ting,Guo Yecai,et al. Reverberation suppression algorithm for LS beamforming based on Wiener post-filter[J]. Application of Electronic Technique,2018,44(3):131-134.
0 引言
麥克風(fēng)陣列能夠準(zhǔn)確獲取空間信息,廣泛地應(yīng)用于電話會議、免提語音通信、人機(jī)語音交互和助聽設(shè)備等系統(tǒng)[1]。波束形成是一種重要的麥克風(fēng)陣列處理技術(shù),其主要目的是對特定方向的有用信號形成波束,同時抑制其他方向的干擾信號和噪聲[2]。近年隨著人們對語音通信研究的深入,麥克風(fēng)陣列得到更加廣泛地應(yīng)用。
在具有多個分布式麥克風(fēng)的語音通信應(yīng)用中,通常期望量化每個傳感器處感知信號的混響量,以便選擇具有最高質(zhì)量或最小混響的頻道。假設(shè)不同信道上的噪聲之間不相關(guān)的前提下,ZELINSKI R[3]提出具有維納后置濾波的波束形成器,利用空間信息解決了維納濾波器的估計問題。但這種非相干噪聲場實際上很少遇到,特別是低頻噪聲場。BERKUN R[4]和MARRO C[5]提出基于麥克陣列與維納后置濾波器結(jié)合的降噪和去混響算法。MCCOWAN I[6]基于噪聲場復(fù)相干的假設(shè)知識開發(fā)濾波器估計的更一般表達(dá)式,但該算法要求預(yù)先得到噪聲相干函數(shù),適用范圍受到限制。SIMMER K U[7]提出的多通道維納濾波器(MCWF),其可以分解為最小方差無失真響應(yīng)波束形成器和單通道后置濾波器,求最優(yōu)解表達(dá)式,對混響中語音質(zhì)量改善明顯。LUEBS A[8]在白噪聲和漫反射噪聲的基礎(chǔ)上增加點干擾處理,通過提供全局最優(yōu)的最小二乘解決方案,更有效地利用麥克風(fēng)陣列收集的信息,提高語音質(zhì)量。
本文提出具有維納后置濾波的最小二乘波束形成混響抑制算法。該算法對含混響語音信號通過分頻得到高頻和低頻分量,用LS波束形成算法分別進(jìn)行處理后疊加,并進(jìn)行維納后置濾波,再由逆傅里葉變換得到去混響后的語音信號。計算機(jī)仿真結(jié)果證明,本文提出的基于維納后置濾波的LS波束形成混響抑制算法具有較好的混響抑制能力。
1 信號模型
1.1 最小二乘波束形成算法
設(shè)基陣為M元均勻線陣,每個陣元通道后有一個L階FIR濾波器,接收寬帶信號的頻率帶寬Nf為[fl,fh],信號的傳播方向與基陣法線方向的夾角為θ,陣元間距d。在最小二乘波束形成器的設(shè)計方法[2,9]中,將代價函數(shù)定義為:
1.2 具有維納后置濾波的波束形成器
ZELINSKI R[3]提出的自適應(yīng)后置濾波器結(jié)構(gòu)如圖1所示。其中,A(i)表示第i個通道的自功率譜密度,C(i)表示互功率譜密度,y(t)為輸出信號。該系統(tǒng)首先對麥克風(fēng)陣列接收的語音信號進(jìn)行時延補(bǔ)償。把第i個通道接收到的信號xi(t)表示為:
1.3 基于維納后置濾波的LS改進(jìn)波束形成
根據(jù)LEBART K和BOUCHER J M提出的假設(shè)[10],即基于房間脈沖響應(yīng)h(k)是一個隨機(jī)過程,表示為:
假設(shè)sd(k)與sr(k)分別表示純凈語音信號s(t)與hd(k)和hr(k)的卷積,則sd(k)為待處理語音信號的直達(dá)信號部分,sr(k)為待處理語音信號的混響部分。
由以上分析得到改進(jìn)維納濾波器的估計增益[5]:
因為衰減因子Δ與混響時間T60存在聯(lián)系,而不同頻段的混響時間不同,故Δ是隨著特定房間對不同頻率的衰減和反射程度而改變的,即不同頻率的聲信號產(chǎn)生的混響有一定的差異,并且在實際聲場中低頻部分噪聲相干性較強(qiáng),因此采用分頻處理的思想,將傅里葉變換后的信號分為高頻和低頻分量,頻率分界點取為1 kHz。令α為加權(quán)矩陣系數(shù),是正常數(shù),將高、低頻權(quán)矢量hL、hH分別相加,即將分頻后的信號,用LS波束形成算法分別進(jìn)行處理后再求和,將得到的信號Y(ω)進(jìn)行維納后置濾波,最后將信號進(jìn)行逆傅里葉變換得到去混響后的語音信號?;诰S納后置濾波的LS改進(jìn)波束形成結(jié)構(gòu)如圖2所示。
由式(5)、式(12)可求得改進(jìn)波束形成器的最優(yōu)權(quán)向量為:
2 實驗與評估
仿真環(huán)境:采用6個麥克風(fēng)傳感器均勻線陣,其中聲源位置(-5,1,0),最左邊第一個麥克風(fēng)位置為(-5,2,1),麥克風(fēng)陣元間隔1 m。四面墻、地板、天花板的反射系數(shù)分別為0.9,0.95,0.9,0.95,0.2,0.4。房間的對角坐標(biāo)為(-7,-3,0),(1,3,1.24)。本實驗將一段純凈語音信號(第一課歡迎新同學(xué))與房間脈沖響應(yīng)函數(shù)做卷積得到混響后的信號,純凈語音信號采樣頻率fs為8 000 Hz,持續(xù)2.3 s。從兩個指標(biāo)對提出的算法進(jìn)行驗證。
(1)語譜圖:如圖3用三維的方式顯示語音頻譜特性,是一種動態(tài)的頻譜。用顏色深淺表示特定頻帶的能量大小。
圖3(a)為純凈語音信號的語譜圖;圖3(b)為混響語音信號的語譜圖,從該圖可知共振峰前后重疊較嚴(yán)重,在橫軸(時間軸)上語音信號出現(xiàn)約0.17 s的延遲,語音質(zhì)量受損嚴(yán)重;圖3(c)中單通道維納濾波算法雖然對混響有一定的抑制作用,但是信號失真仍嚴(yán)重;圖3(d)中本文提出的算法對混響抑制效果較好,對信號失真改善較明顯。
(2)采用語音質(zhì)量感知評價(Perceptual Evaluation of Speech Quality,PESQ)對去混響的效果進(jìn)行評估,PESQ表示為:
式中,Dind、Aind分別是平均干擾值和平均的線性組合獲得的對稱干擾值。從表1中看出,加入混響后語音信號的PESQ下降為1.9,語音信號的質(zhì)量嚴(yán)重下降。經(jīng)過本文提出算法進(jìn)行混響抑制后PESQ達(dá)到2.3。
3 總結(jié)
本文提出的具有維納后置濾波的最小二乘波束形成混響抑制算法將混響后的信號分為直達(dá)部分和混響部分,得到改進(jìn)維納后置濾波器增益估計,然后用最小二乘波束形成算法將信號進(jìn)行分頻處理,最后求解最優(yōu)權(quán)值,并通過仿真實驗分別從信號的語譜圖和語音質(zhì)量感知指標(biāo)對算法進(jìn)行評估。仿真實驗結(jié)果表明,相對于維納混響算抑制算法,本文提出算法混響抑制效果更加顯著。
參考文獻(xiàn)
[1] LOIZOU P C.Speech enhancement:Theory and practice[M].CRC Press,Inc.2013.
[2] DOBLINGER G.Optimization of wideband fixed beamformers with adaptive sensor calibration[C].Signal Processing Conference,2010,European.IEEE,2010:2062-2066.
[3] ZELINSKI R.A microphone array with adaptive post-filtering for noise reduction in reverberant rooms[C].International Conference on Acoustics,Speech,and Signal Processing.IEEE,2002,5:2578-2581.
[4] BERKUN R,COHEN I.Microphone array power ratio for quality assessment of reverberated speech[J].EURASIP Journal on Advances in Signal Processing,2015(1):1-11.
[5] MARRO C,MAHIEUX Y,SIMMER K U.Analysis of noise reduction and dereverberation techniques based on micro-phone arrays with postfiltering[J].IEEE Transactions on Speech & Audio Processing,2002,6(3):240-259.
[6] MCCOWAN I,BOURLARD H.Microphone array post-filter based on noise field coherence[J].IEEE Transactions on Speech & Audio Processing,2003,11(6):709-716.
[7] SIMMER K U,BITZER J,MARRO C.Post-filtering techniques[M].Microphone Arrays. Springer Berlin Heidelberg,2001:39-60.
[8] HUANG Y A,LUEBS A,SKOGLUND J,et al.Globally optimized least-squares post-filtering for microphone array speech enhancement[C].IEEE International Conference on Acoustics,Speech and Signal Processing.IEEE,2016:380-384.
[9] 王燕,吳文峰,梁國龍.基于穩(wěn)健最小二乘的魯棒波束形成[J].電子學(xué)報,2013,41(12):2321-2326.
[10] LEBART K,BOUCHER J M,DENBIGH P N.A new method based on spectral subtraction for speech dereverberation[J].Acta Acustica United With Acustica,2001,87(3):359-366.
作者信息:
張秀再1,2,王 婷1,郭業(yè)才1,2,陳小燕1
(1.南京信息工程大學(xué) 電子與信息工程學(xué)院,江蘇 南京210044;
2.江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,江蘇 南京210044)