《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 測(cè)試測(cè)量 > 設(shè)計(jì)應(yīng)用 > 基于遠(yuǎn)場(chǎng)聲源定位的改進(jìn)MUSIC算法研究
基于遠(yuǎn)場(chǎng)聲源定位的改進(jìn)MUSIC算法研究
2018年電子技術(shù)應(yīng)用第12期
鄧艷容,李嘉棟,張法碧,羅 迪,朱承同,馮振邦
桂林電子科技大學(xué) 廣西精密導(dǎo)航技術(shù)與應(yīng)用重點(diǎn)實(shí)驗(yàn)室,廣西 桂林541004
摘要: 結(jié)合語(yǔ)音信號(hào)的特點(diǎn),對(duì)遠(yuǎn)場(chǎng)聲源定位方法進(jìn)行了系統(tǒng)的研究。以傳統(tǒng)的多重信號(hào)分類(lèi)(MUSIC)算法為基礎(chǔ),在麥克風(fēng)陣列遠(yuǎn)場(chǎng)信號(hào)模型的情況下,提出了改進(jìn)的MUSIC算法,并通過(guò)模擬實(shí)驗(yàn)環(huán)境進(jìn)行驗(yàn)證。仿真結(jié)果表明,改進(jìn)的算法具有較高的空間分辨率和較強(qiáng)的抗噪聲能力,可以有效地估計(jì)出相隔比較近的多個(gè)低信噪比聲源信號(hào),從而驗(yàn)證了該算法的有效性和高效性。
中圖分類(lèi)號(hào): TN912.3
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.181705
中文引用格式: 鄧艷容,李嘉棟,張法碧,等. 基于遠(yuǎn)場(chǎng)聲源定位的改進(jìn)MUSIC算法研究[J].電子技術(shù)應(yīng)用,2018,44(12):69-72.
英文引用格式: Deng Yanrong,Li Jiadong,Zhang Fabi,et al. The research of improved MUSIC algorithm based on far field sound source localization[J]. Application of Electronic Technique,2018,44(12):69-72.
The research of improved MUSIC algorithm based on far field sound source localization
Deng Yanrong,Li Jiadong,Zhang Fabi,Luo Di,Zhu Chengtong,F(xiàn)eng Zhenbang
Guangxi Key Laboratory of Precision Navigation Technology and Application, Guilin University of Electronic Technology,Guilin 541004,China
Abstract: Systemic research has been done on the thesis of far field sound source localization combined characteristics of the speech signal in this paper. An improved MUSIC algorithm is proposed based on the traditional MUSIC algorithm in far-field of microphone array signal model, and experiments in simulated environment is carried out. Simulation results show that the improved algorithm has higher spatial identification rate and strong noise immunity, it can estimate the adjacent sound source signals with small SNR effectively, so the effectiveness and high efficiency of the improved algorithm are proved.
Key words : MUSIC algorithm;sound source localization;far field;subspace

0 引言

    聲源定位技術(shù)是陣列信號(hào)處理的關(guān)鍵技術(shù)之一,它在視頻會(huì)議、語(yǔ)音識(shí)別、說(shuō)話人識(shí)別和助聽(tīng)設(shè)備等領(lǐng)域中都有廣泛的應(yīng)用,是語(yǔ)音信號(hào)處理領(lǐng)域中一個(gè)新的研究熱點(diǎn)。目前,基于麥克風(fēng)陣列的聲源定位方法大體上可分為三類(lèi):基于到達(dá)時(shí)延(TDOA)的定位技術(shù)[1]、基于可控波束形成的定位技術(shù)[2]、基于子空間的定位技術(shù)[3]。

    基于子空間的聲源定位技術(shù)來(lái)源于現(xiàn)代高分辨率譜估計(jì)技術(shù),其中多重信號(hào)分類(lèi)(Multiple Signal Classification,MUSIC)是一種經(jīng)典的子空間定位法,在特定的條件下具有很高的估計(jì)精度和穩(wěn)定性等良好性能,本文結(jié)合麥克風(fēng)陣列遠(yuǎn)場(chǎng)信號(hào)的特點(diǎn),對(duì)其進(jìn)行深入的分析,將傳統(tǒng)的MUSIC算法進(jìn)行改進(jìn),使其適用于麥克風(fēng)陣列的聲源定位[4]。

1 MUSIC聲源定位算法分析

1.1 傳統(tǒng)MUSIC算法

    MUSIC算法是一種經(jīng)典的超分辨DOA估計(jì)算法,它是在窄帶信號(hào)源的假設(shè)情況下提出來(lái)的,其主要思想是對(duì)陣列輸出數(shù)據(jù)協(xié)方差矩陣進(jìn)行特征分解,得到與信號(hào)分量相對(duì)應(yīng)的信號(hào)子空間和與信號(hào)分量相正交的噪聲子空間,再利用信號(hào)子空間和噪聲子空間的正交性,構(gòu)造出非常尖銳的“針狀”空間譜峰,通過(guò)譜峰的搜索,從而實(shí)現(xiàn)信號(hào)的DOA估計(jì)[5]。下面針對(duì)遠(yuǎn)場(chǎng)窄帶信號(hào)模型,簡(jiǎn)要介紹傳統(tǒng)MUSIC算法的基本原理及其計(jì)算步驟。

    (1)假設(shè)空間有D個(gè)遠(yuǎn)場(chǎng)窄帶信號(hào)源,分別入射到M元陣列上,其中信號(hào)源則整個(gè)陣列的接收信號(hào)為:

    ck6-gs1.gif

ck6-gs2-6.gif

    由式(6)可知,與譜峰所對(duì)應(yīng)的角度就是波達(dá)方向的估計(jì)值,即在真實(shí)波達(dá)方向的附近出現(xiàn)非常尖銳的“針狀”空間譜峰。

    在實(shí)際應(yīng)用場(chǎng)合中,麥克風(fēng)通常處理的是寬帶非平穩(wěn)語(yǔ)音信號(hào),而傳統(tǒng)的MUSIC算法是在窄帶平穩(wěn)信號(hào)的假設(shè)基礎(chǔ)上提出來(lái)的,除此之外,由于多徑信號(hào)傳輸現(xiàn)象,使得相干聲源普遍存在[6],從而導(dǎo)致定位性能較差,精度不高。因此需要對(duì)傳統(tǒng)的MUSIC算法進(jìn)行必要的改進(jìn),以適用于麥克風(fēng)陣列的聲源定位。

1.2 改進(jìn)的MUSIC聲源定位算法

    本文針對(duì)麥克風(fēng)接收信號(hào)為寬帶信號(hào)且存在相干源這一特點(diǎn)[7],采取把寬帶信號(hào)在頻域上分成N個(gè)帶寬較小的子帶來(lái)處理。假設(shè)一幀信號(hào)的頻率范圍為[fL,fH],則每一個(gè)子帶對(duì)應(yīng)的頻率范圍為{[f1,f2],…,[fk,fk+1],…,[fN,fH]},再根據(jù)寬帶聚焦算法對(duì)每個(gè)子帶信號(hào)進(jìn)行處理。寬帶聚焦算法的基本思想是通過(guò)聚焦矩陣將頻帶內(nèi)不重疊的各頻率點(diǎn)的數(shù)據(jù)轉(zhuǎn)變成參考頻率點(diǎn)的數(shù)據(jù),得到聚焦后的協(xié)方差矩陣,然后再利用傳統(tǒng)的MUSIC方法進(jìn)行DOA估計(jì)[8]。其關(guān)鍵就在于聚焦矩陣的選擇,本文采用的是雙邊相關(guān)變換(TCT)算法。

    雙邊相關(guān)變換算法是利用頻帶內(nèi)各頻率點(diǎn)間無(wú)噪聲數(shù)據(jù)之間的關(guān)系來(lái)選擇聚焦矩陣。假設(shè)Tβj)為聚焦矩陣,其中β是真實(shí)信號(hào)的預(yù)估計(jì)方向。則有:

ck6-gs7-15.gif

    從式(15)可以看出,權(quán)向量WSNR與該子帶的總平均功率成正比。那么式(14)可以寫(xiě)成:

     ck6-gs16.gif

    由于在短時(shí)間內(nèi)語(yǔ)音信號(hào)可以看作是近似平穩(wěn)的,因此可以采取對(duì)接收信號(hào)進(jìn)行分幀和短時(shí)傅里葉變換的方法來(lái)解決語(yǔ)音信號(hào)的非平穩(wěn)性問(wèn)題[10]。這樣即可提高定位性能,減少噪聲對(duì)估計(jì)結(jié)果的影響。綜上所述,改進(jìn)的MUSIC聲源定位算法具體實(shí)現(xiàn)流程如圖1所示。

ck6-t1.gif

2 實(shí)驗(yàn)仿真分析與比較

2.1 遠(yuǎn)場(chǎng)信號(hào)模型的建立

ck6-gs17-18.gif

2.2 實(shí)驗(yàn)環(huán)境和參數(shù)設(shè)置

    本實(shí)驗(yàn)在圖2所示的均勻圓形陣列遠(yuǎn)場(chǎng)聲源模型的條件下進(jìn)行,選取25個(gè)全向麥克風(fēng),采用3個(gè)語(yǔ)音信號(hào)源,均為標(biāo)準(zhǔn)的英文誦讀,采樣頻率為16 kHz,采樣精度為16 bit。噪聲為全向高斯白噪聲,為了保證其短時(shí)平穩(wěn)性,先將陣列采集數(shù)據(jù)進(jìn)行分幀加窗短時(shí)傅里葉變換,幀長(zhǎng)為512點(diǎn)(32 ms),幀移為256點(diǎn),俯仰角θ的搜索范圍為0~90°,方位角ck6-t2-x1.gif的搜索范圍為0~180°,θ角和ck6-t2-x1.gif角的搜索步長(zhǎng)為1°。

ck6-t2.gif

2.3 性能分析與比較

    為了更好地驗(yàn)證改進(jìn)MUSIC算法的性能,采用空間譜及其等高曲線圖來(lái)表示定位結(jié)果的精確性。設(shè)定信噪比SNR=8 dB,子帶數(shù)N=12,3個(gè)聲源信號(hào)的俯、仰角各為[θ1ck6-t2-x1.gif1]=[30,30],[θ2,ck6-t2-x1.gif2]=[40,50],[θ3,ck6-t2-x1.gif3]=[60,50],兩種定位算法的仿真結(jié)果如圖3、圖4所示。

ck6-t3.gif

ck6-t4.gif

    空間譜峰的極值點(diǎn)對(duì)應(yīng)聲源的位置,圖5和圖6分別為兩種算法的空間譜等高曲線圖、中心點(diǎn)對(duì)應(yīng)聲源位置。

ck6-t5.gif

ck6-t6.gif

    從仿真結(jié)果可以看出,傳統(tǒng)的MUSIC算法僅能估計(jì)出2個(gè)聲源的位置,而改進(jìn)的MUSIC算法可以清晰地估計(jì)出3個(gè)聲源的位置,相對(duì)傳統(tǒng)MUSIC算法而言,其峰值尖銳程度和定位精度都有顯著提高,其定位性能和實(shí)時(shí)性得到改善。

    下面再?gòu)母┭鼋呛头轿唤堑木讲顏?lái)對(duì)這兩種算法的定位性能進(jìn)行分析,信噪比為-10 dB~10 dB,利用陣列采集的所有數(shù)據(jù)獨(dú)立試驗(yàn)50次,得到其均方誤差如圖7所示。

ck6-t7.gif

    從俯仰角和方位角的定位均方誤差曲線可以看出,在低噪聲的情況下,兩種定位算法的性能相差不大,但在高噪聲環(huán)境下,傳統(tǒng)MUSIC算法的定位效果則明顯變差,從而驗(yàn)證了改進(jìn)的MUSIC算法抗干擾性較強(qiáng),其定位性能及精度遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)的MUSIC算法。

3 結(jié)束語(yǔ)

    傳統(tǒng)的MUSIC算法僅對(duì)窄帶平穩(wěn)信號(hào)有效,且抗干擾能力較差,定位精度較低。改進(jìn)的MUSIC算法采取分幀和短時(shí)傅里葉變換的方法來(lái)解決語(yǔ)音信號(hào)的非平穩(wěn)性問(wèn)題;針對(duì)麥克風(fēng)接收信號(hào)為寬帶信號(hào)且存在相干源這一特點(diǎn),改進(jìn)的MUSIC算法采取把寬帶信號(hào)在頻域上分成N個(gè)帶寬較小的子帶,并將信噪比(SNR)和性能結(jié)合起來(lái)考慮,采用基于信噪比的加權(quán)法來(lái)進(jìn)行定位處理。通過(guò)理論分析和實(shí)驗(yàn)仿真結(jié)果表明,對(duì)傳統(tǒng)的MUSIC算法進(jìn)行改進(jìn)和擴(kuò)展,得到改進(jìn)的MUSIC算法在低信噪比情況下,仍能準(zhǔn)確地分辨出多個(gè)比較接近的聲源信號(hào),且算法穩(wěn)健,定位精度較高,從而驗(yàn)證了該算法具有較強(qiáng)的抗噪聲能力和較高的空間分辨率。

參考文獻(xiàn)

[1] 王紅軍.基于TDOA定位GSM移動(dòng)臺(tái)的信號(hào)處理算法[J].電信技術(shù),2011,51(7):55-59.

[2] 王志峰,馮杰,蔣灝,等.基于SRP和GA的聲源定位方法[J].電聲技術(shù),2013,37(10):36-40.

[3] 王磊,吳仁彪,盧丹.基于子空間技術(shù)的常規(guī)多波束形成抗干擾算法[J].華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,37(3):372-376.

[4] 蘇永振,袁慎芳,王瑜.基于多重信號(hào)分類(lèi)算法的復(fù)合材料沖擊定位[J].復(fù)合材料學(xué)報(bào),2010,27(3):105-110.

[5] 趙謙,董民,梁文娟.DOA估計(jì)算法的一種修正MUSIC算法的研究[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(10):102-105.

[6] 曾光,趙樂(lè)軍.室內(nèi)無(wú)線高精度定位的改進(jìn)MUSIC算法[J].華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,40(5):614-618.

[7] MARINESCU R S,BUZO A,CUCU H,et al.New considerations for accumulated ?籽-cross power spectrum phase with coherence time delay estimation[C].The Eighth International Conference on Digital Telecommunications,2013:45-48.

[8] 王進(jìn),趙擁軍,王志剛.一種新的寬帶DOA估計(jì)自聚焦算法[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(29):57-60.

[9] 周生華,劉宏偉,劉保昌,等.信噪比加權(quán)空間分集雷達(dá)目標(biāo)檢測(cè)算法[J].西安電子科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,38(4):82-88.

[10] 張奕,孟書(shū)杰.針對(duì)頭佩式麥克風(fēng)陣列的聲源定位算法研究[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(24):266-270.




作者信息:

鄧艷容,李嘉棟,張法碧,羅  迪,朱承同,馮振邦

(桂林電子科技大學(xué) 廣西精密導(dǎo)航技術(shù)與應(yīng)用重點(diǎn)實(shí)驗(yàn)室,廣西 桂林541004)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。