《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 測(cè)試測(cè)量 > 設(shè)計(jì)應(yīng)用 > 基于六元空間陣列的聲源定位系統(tǒng)實(shí)現(xiàn)
基于六元空間陣列的聲源定位系統(tǒng)實(shí)現(xiàn)
2020年電子技術(shù)應(yīng)用第2期
余秋婷,熊俊俏
武漢工程大學(xué) 電氣信息學(xué)院,湖北 武漢430205
摘要: 聲源定位技術(shù)是語音識(shí)別技術(shù)的基礎(chǔ),針對(duì)復(fù)雜噪聲和混響的室內(nèi)環(huán)境造成聲源定位精度不理想的問題,提出了一種基于麥克風(fēng)陣列的聲源定位系統(tǒng)。首先闡述了聲源定位原理,然后提出了改進(jìn)的廣義互相關(guān)算法。該算法利用兩信號(hào)之間的相關(guān)性,估計(jì)出麥克風(fēng)之間的時(shí)延,進(jìn)而得到聲程差,并根據(jù)幾何關(guān)系確定聲源在空間中的位置,最后在嵌入式平臺(tái)上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明,該方法能較準(zhǔn)確地得到聲源位置,且距離和方位角的誤差分別不超過+5°和±15 cm。
中圖分類號(hào): TN641
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.190864
中文引用格式: 余秋婷,熊俊俏. 基于六元空間陣列的聲源定位系統(tǒng)實(shí)現(xiàn)[J].電子技術(shù)應(yīng)用,2020,46(2):58-61.
英文引用格式: Yu Qiuting,Xiong Junqiao. Realization of sound source locating system based on six-dimensional space array[J]. Application of Electronic Technique,2020,46(2):58-61.
Realization of sound source locating system based on six-dimensional space array
Yu Qiuting,Xiong Junqiao
School of Electrical and Information Engineering,Wuhan Institute of Technology,Wuhan 430205,China
Abstract: Sound source localization technology is the basis of speech recognition technology. For the problem that the sound source localization accuracy is not ideal for complex noise and reverberant indoor environment, a sound source localization system based on microphone array is proposed. Firstly, the principle of sound source localization is expounded, and then an improved generalized cross-correlation algorithm is proposed. The algorithm uses the correlation between the two signals to estimate the delay between the microphones, and then obtains the sound path difference, and determines the position of the sound source in space according to the geometric relationship. Finally, the experiment is carried out on the embedded platform. The experimental results show that the method can obtain the sound source position more accurately, and the distance and azimuth errors are not exceeded positive and negative 5 degrees and plus or minus 15 cm.
Key words : sound source localization;microphone array;time delay estimation;embedded system

0 引言

    聽覺是人感知外界環(huán)境,并與外界環(huán)境進(jìn)行交互的重要方式,根據(jù)不同物體發(fā)出的聲音,人們可以判斷出聲源的方位。而在某些特定場(chǎng)合,就需要機(jī)器來準(zhǔn)確定位出聲源的位置[1]。因此,基于麥克風(fēng)陣列聲源定位技術(shù)得到了廣泛的關(guān)注和快速的發(fā)展,對(duì)其開展研究具有很強(qiáng)的實(shí)踐價(jià)值[2]。

    目前,常用的基于麥克風(fēng)陣列的聲源定位方法有3種:基于最大輸出功率的可控波束形成定位方法[3]、基于高分辨率譜估計(jì)技術(shù)的定位方法[4]和基于時(shí)延估計(jì)的定位方法[5]。其中,基于時(shí)延估計(jì)的定位方法由于運(yùn)算量小、實(shí)時(shí)性好、易于實(shí)現(xiàn)等優(yōu)點(diǎn)而成為最普遍的使用方法[6]。其方法首先估計(jì)了聲源到達(dá)各個(gè)麥克風(fēng)的時(shí)延,再根據(jù)幾何關(guān)系得到聲源的位置。文獻(xiàn)[7]提出了一種改進(jìn)時(shí)延估計(jì)的聲源定位方法。該方法首先設(shè)計(jì)了四元十字型麥克風(fēng)陣列,然后在廣義互相關(guān)的基礎(chǔ)上引入二次相關(guān)算法來削弱環(huán)境噪聲產(chǎn)生的干擾,同時(shí)采用自適應(yīng)濾波算法來提高環(huán)境混響的時(shí)延精度,從而獲得更準(zhǔn)確的聲源位置。但缺少界面的直觀顯示。文獻(xiàn)[8]首先提出了GCC-IMLPT算法,并通過仿真驗(yàn)證了該算法的性能,且選取了計(jì)算量小、實(shí)時(shí)性較好的球形插值法來得到聲源位置,然后研究了麥克風(fēng)拓?fù)浣Y(jié)構(gòu),確定麥克風(fēng)陣列的大小,最后在實(shí)際環(huán)境中測(cè)試了系統(tǒng)的性能,但由于系統(tǒng)是在計(jì)算機(jī)上實(shí)現(xiàn)的,不方便攜帶。當(dāng)前,優(yōu)化算法提高定位精度,實(shí)現(xiàn)界面的直觀顯示,以及方便攜帶成為考慮的熱點(diǎn)問題。

    本文提出一種基于麥克風(fēng)陣列的聲源定位系統(tǒng)。采用改進(jìn)的廣義互相關(guān)算法獲取時(shí)延,進(jìn)而得到聲程差,并根據(jù)幾何關(guān)系確定聲源在空間中的位置,最后在嵌入式平臺(tái)上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明,該方法能較準(zhǔn)確地得到聲源位置。

1 聲源定位系統(tǒng)原理 

1.1 聲源定位原理

    由于同一個(gè)聲源傳播到位置不同的各個(gè)麥克風(fēng)時(shí)會(huì)產(chǎn)生時(shí)間差,這個(gè)時(shí)間差稱為時(shí)延。時(shí)延與聲速相乘即可得到聲程差。由雙曲線的性質(zhì)可知,雙曲線上任意一點(diǎn)到兩個(gè)焦點(diǎn)的距離之差的絕對(duì)值為雙曲線的實(shí)軸長(zhǎng)。因此,聲源在以任意兩個(gè)麥克風(fēng)為焦點(diǎn),聲程差為實(shí)軸長(zhǎng)的多條雙曲線的焦點(diǎn)上[9]。聲源定位原理圖如圖1所示,S為聲源。

ck2-t1.gif

1.2 改進(jìn)的廣義互相關(guān)算法

    廣義互相關(guān)算法是目前最常用的一種時(shí)延估計(jì)方法。廣義互相關(guān)算法是通過將兩路聲音信號(hào)從時(shí)域變化為頻域,并求得兩信號(hào)之間的互功率譜,再進(jìn)行加權(quán),這樣可以降低噪聲和反射帶來的誤差,然后經(jīng)過反傅里葉變換,將頻域轉(zhuǎn)換回時(shí)域得到互相關(guān)函數(shù)并計(jì)算峰值,峰值所對(duì)應(yīng)的位置即時(shí)延[10]。廣義互相關(guān)時(shí)延估計(jì)基本原理和流程圖如圖2所示。

ck2-t2.gif

    由于聲源不斷產(chǎn)生聲音信號(hào),麥克風(fēng)接收到聲源傳來的聲音信號(hào)。假設(shè)麥克風(fēng)1、2接收到聲音信號(hào)的理想模型為:

ck2-gs1-3.gif

    在理想情況下或在弱噪聲和弱混響的環(huán)境下互功率譜可近似表示為:

ck2-gs4-6.gif

    互功率譜加權(quán)函數(shù)(PHAT)通過對(duì)信號(hào)互功率譜歸一化,去除信號(hào)的幅度信息,只保留了信號(hào)的相位特性,對(duì)噪聲和混響有一定的抑制作用[11]。

ck2-gs7-9.gif

2 空間定位方法

    目前有2種方法估計(jì)聲源位置:通過搜索的方式和通過幾何的方式。由于本文采用的是三維陣列,故采用幾何的方法估計(jì)聲源位置。

    本文采用球形插值法對(duì)聲源位置進(jìn)行估計(jì)。球型插值法根據(jù)多個(gè)麥克風(fēng)相對(duì)參考麥克風(fēng)的時(shí)延和各個(gè)麥克風(fēng)的矢量位置得到一個(gè)誤差方程組,并求其最小二乘解[12]。

    如圖3所示,聲源的坐標(biāo)點(diǎn)用s(x,y,z)表示,麥克風(fēng)m0放在原點(diǎn)處作為參考點(diǎn),mi表示其他麥克風(fēng)的坐標(biāo)位置,i∈[1,5],各麥克風(fēng)與參考麥克風(fēng)之間的聲程差用di表示。

ck2-t3.gif

    聲源s應(yīng)該滿足矢量方程:

ck2-gs10-18.gif

ck2-gs19-22.gif

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)設(shè)備

    本文系統(tǒng)在硬件上主要包括三維陣列、麥克風(fēng)模塊、數(shù)據(jù)采集卡以及計(jì)算機(jī)。三維陣列模型如圖4所示,相鄰兩麥克風(fēng)之間的距離為50 cm,麥克風(fēng)采用MAX9812麥克風(fēng)模塊,為全向性麥克風(fēng),20 dB固定增益放大。選用 USB DAQ多功能數(shù)據(jù)采集卡采集聲音數(shù)據(jù),采集卡的輸入端通過6根數(shù)據(jù)線與麥克風(fēng)陣列相連,輸出端通過USB連接計(jì)算機(jī),USB DAQ采集卡具有8路差分16位高速同步模擬信號(hào)采集,8 個(gè)AD620高精度差分放大器,16路數(shù)字信號(hào)單向輸入,16路數(shù)字信號(hào)單向輸出。單通道的采樣頻率最大可達(dá)200 kHz。本實(shí)驗(yàn)只使用了其中6路通道。

ck2-t4.gif

3.2 實(shí)驗(yàn)分析

    通過具體實(shí)驗(yàn)對(duì)麥克風(fēng)陣列以及算法進(jìn)行驗(yàn)證。本實(shí)驗(yàn)環(huán)境內(nèi)存在一定的噪聲,噪聲主要來源于室內(nèi)照明設(shè)備、電腦風(fēng)扇以及空調(diào),聲源為手機(jī)播放的一段音樂。數(shù)據(jù)采集卡的采樣頻率設(shè)置為200 kHz,采樣位數(shù)為16位,采樣點(diǎn)數(shù)設(shè)為1×105個(gè)。

    測(cè)試時(shí),對(duì)每個(gè)位置都進(jìn)行6次實(shí)驗(yàn),求取的實(shí)驗(yàn)結(jié)果為6次實(shí)驗(yàn)的平均值。實(shí)驗(yàn)結(jié)果如表1所示。

ck2-b1.gif

    由表1的定位結(jié)果來看,該系統(tǒng)實(shí)現(xiàn)了聲源定位的基本功能,角度的誤差在±5°以內(nèi),能夠較準(zhǔn)確地找到聲源所在的方位,距離誤差不超過±15 cm,在所接受的范圍內(nèi)。

4 結(jié)論

    本文設(shè)計(jì)實(shí)現(xiàn)了基于麥克風(fēng)陣列的聲源定位系統(tǒng),該系統(tǒng)采用6個(gè)麥克風(fēng)組成的三維陣列,并根據(jù)改進(jìn)的廣義互相關(guān)算法獲取時(shí)延,再根據(jù)球形插值法確定聲源在空間中的位置。

    從實(shí)驗(yàn)結(jié)果與分析可以看出,該算法得到的聲源位置較準(zhǔn)確。而且本系統(tǒng)能將聲源的位置信息顯示在界面上,具有更加直觀的效果。不足的是,系統(tǒng)不夠便攜且只能定位單聲源,后續(xù)需要進(jìn)一步研究將算法移植到便攜式開發(fā)板上以及多聲源定位算法。

參考文獻(xiàn)

[1] 韓文革,蘇淑靖,薛彥杰.基于麥克風(fēng)陣列的聲源被動(dòng)定位系統(tǒng)設(shè)計(jì)[J].電子技術(shù)應(yīng)用,2017,43(12):61-64.

[2] 姜志鵬,唐加能,梁瑞宇.實(shí)時(shí)聲源定位算法研究與實(shí)現(xiàn)[J].電子器件,2015,38(6):1406-1411.

[3] 葛李賀.基于波束形成算法的聲源定位研究及DSP實(shí)現(xiàn)[D].南京:南京信息工程大學(xué),2015.

[4] 劉賓.基于聲源定位的靶標(biāo)測(cè)量技術(shù)研究[D].西安:西安電子科技大學(xué),2017.

[5] 劉璐.基于麥克風(fēng)陣列的機(jī)器人聲源定位系統(tǒng)研究[D].長(zhǎng)春:長(zhǎng)春工業(yè)大學(xué),2018.

[6] 伏智超.基于Cortex-A8嵌入式系統(tǒng)的聲源定位技術(shù)研究與實(shí)現(xiàn)[D].南京:東南大學(xué),2015.

[7] 程方曉,劉璐,姚清華,等.基于改進(jìn)時(shí)延估計(jì)的聲源定位算法[J].吉林大學(xué)學(xué)報(bào)(理學(xué)版),2018,56(3):681-687.

[8] 劉云飛.基于麥克風(fēng)陣列的聲源定位方法的研究[D].杭州:杭州電子科技大學(xué),2018.

[9] 陳國(guó)良,徐揚(yáng),黃曉琴.基于正四棱錐結(jié)構(gòu)的機(jī)器人聲源定位系統(tǒng)研究[J].計(jì)算機(jī)應(yīng)用研究,2018,36(4):1088-1092.

[10] 郭俊成.基于傳聲器陣列的聲源定位技術(shù)研究[D].南京:南京航空航天大學(xué),2007.

[11] 喬健,王建明.抑制風(fēng)噪聲的頻點(diǎn)離散值加權(quán)GCC-PHAT時(shí)延估計(jì)算法[J].電子技術(shù)應(yīng)用,2018,44(3):72-76,80.

[12] 張明瀚.基于時(shí)延估計(jì)的聲源定位系統(tǒng)研究[D].重慶:重慶大學(xué),2009.



作者信息:

余秋婷,熊俊俏

(武漢工程大學(xué) 電氣信息學(xué)院,湖北 武漢430205)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。