文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.190864
中文引用格式: 余秋婷,熊俊俏. 基于六元空間陣列的聲源定位系統(tǒng)實(shí)現(xiàn)[J].電子技術(shù)應(yīng)用,2020,46(2):58-61.
英文引用格式: Yu Qiuting,Xiong Junqiao. Realization of sound source locating system based on six-dimensional space array[J]. Application of Electronic Technique,2020,46(2):58-61.
0 引言
聽覺是人感知外界環(huán)境,并與外界環(huán)境進(jìn)行交互的重要方式,根據(jù)不同物體發(fā)出的聲音,人們可以判斷出聲源的方位。而在某些特定場(chǎng)合,就需要機(jī)器來準(zhǔn)確定位出聲源的位置[1]。因此,基于麥克風(fēng)陣列的聲源定位技術(shù)得到了廣泛的關(guān)注和快速的發(fā)展,對(duì)其開展研究具有很強(qiáng)的實(shí)踐價(jià)值[2]。
目前,常用的基于麥克風(fēng)陣列的聲源定位方法有3種:基于最大輸出功率的可控波束形成定位方法[3]、基于高分辨率譜估計(jì)技術(shù)的定位方法[4]和基于時(shí)延估計(jì)的定位方法[5]。其中,基于時(shí)延估計(jì)的定位方法由于運(yùn)算量小、實(shí)時(shí)性好、易于實(shí)現(xiàn)等優(yōu)點(diǎn)而成為最普遍的使用方法[6]。其方法首先估計(jì)了聲源到達(dá)各個(gè)麥克風(fēng)的時(shí)延,再根據(jù)幾何關(guān)系得到聲源的位置。文獻(xiàn)[7]提出了一種改進(jìn)時(shí)延估計(jì)的聲源定位方法。該方法首先設(shè)計(jì)了四元十字型麥克風(fēng)陣列,然后在廣義互相關(guān)的基礎(chǔ)上引入二次相關(guān)算法來削弱環(huán)境噪聲產(chǎn)生的干擾,同時(shí)采用自適應(yīng)濾波算法來提高環(huán)境混響的時(shí)延精度,從而獲得更準(zhǔn)確的聲源位置。但缺少界面的直觀顯示。文獻(xiàn)[8]首先提出了GCC-IMLPT算法,并通過仿真驗(yàn)證了該算法的性能,且選取了計(jì)算量小、實(shí)時(shí)性較好的球形插值法來得到聲源位置,然后研究了麥克風(fēng)拓?fù)浣Y(jié)構(gòu),確定麥克風(fēng)陣列的大小,最后在實(shí)際環(huán)境中測(cè)試了系統(tǒng)的性能,但由于系統(tǒng)是在計(jì)算機(jī)上實(shí)現(xiàn)的,不方便攜帶。當(dāng)前,優(yōu)化算法提高定位精度,實(shí)現(xiàn)界面的直觀顯示,以及方便攜帶成為考慮的熱點(diǎn)問題。
本文提出一種基于麥克風(fēng)陣列的聲源定位系統(tǒng)。采用改進(jìn)的廣義互相關(guān)算法獲取時(shí)延,進(jìn)而得到聲程差,并根據(jù)幾何關(guān)系確定聲源在空間中的位置,最后在嵌入式平臺(tái)上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明,該方法能較準(zhǔn)確地得到聲源位置。
1 聲源定位系統(tǒng)原理
1.1 聲源定位原理
由于同一個(gè)聲源傳播到位置不同的各個(gè)麥克風(fēng)時(shí)會(huì)產(chǎn)生時(shí)間差,這個(gè)時(shí)間差稱為時(shí)延。時(shí)延與聲速相乘即可得到聲程差。由雙曲線的性質(zhì)可知,雙曲線上任意一點(diǎn)到兩個(gè)焦點(diǎn)的距離之差的絕對(duì)值為雙曲線的實(shí)軸長(zhǎng)。因此,聲源在以任意兩個(gè)麥克風(fēng)為焦點(diǎn),聲程差為實(shí)軸長(zhǎng)的多條雙曲線的焦點(diǎn)上[9]。聲源定位原理圖如圖1所示,S為聲源。
1.2 改進(jìn)的廣義互相關(guān)算法
廣義互相關(guān)算法是目前最常用的一種時(shí)延估計(jì)方法。廣義互相關(guān)算法是通過將兩路聲音信號(hào)從時(shí)域變化為頻域,并求得兩信號(hào)之間的互功率譜,再進(jìn)行加權(quán),這樣可以降低噪聲和反射帶來的誤差,然后經(jīng)過反傅里葉變換,將頻域轉(zhuǎn)換回時(shí)域得到互相關(guān)函數(shù)并計(jì)算峰值,峰值所對(duì)應(yīng)的位置即時(shí)延[10]。廣義互相關(guān)時(shí)延估計(jì)基本原理和流程圖如圖2所示。
由于聲源不斷產(chǎn)生聲音信號(hào),麥克風(fēng)接收到聲源傳來的聲音信號(hào)。假設(shè)麥克風(fēng)1、2接收到聲音信號(hào)的理想模型為:
在理想情況下或在弱噪聲和弱混響的環(huán)境下互功率譜可近似表示為:
互功率譜加權(quán)函數(shù)(PHAT)通過對(duì)信號(hào)互功率譜歸一化,去除信號(hào)的幅度信息,只保留了信號(hào)的相位特性,對(duì)噪聲和混響有一定的抑制作用[11]。
2 空間定位方法
目前有2種方法估計(jì)聲源位置:通過搜索的方式和通過幾何的方式。由于本文采用的是三維陣列,故采用幾何的方法估計(jì)聲源位置。
本文采用球形插值法對(duì)聲源位置進(jìn)行估計(jì)。球型插值法根據(jù)多個(gè)麥克風(fēng)相對(duì)參考麥克風(fēng)的時(shí)延和各個(gè)麥克風(fēng)的矢量位置得到一個(gè)誤差方程組,并求其最小二乘解[12]。
如圖3所示,聲源的坐標(biāo)點(diǎn)用s(x,y,z)表示,麥克風(fēng)m0放在原點(diǎn)處作為參考點(diǎn),mi表示其他麥克風(fēng)的坐標(biāo)位置,i∈[1,5],各麥克風(fēng)與參考麥克風(fēng)之間的聲程差用di表示。
聲源s應(yīng)該滿足矢量方程:
3 實(shí)驗(yàn)結(jié)果與分析
3.1 實(shí)驗(yàn)設(shè)備
本文系統(tǒng)在硬件上主要包括三維陣列、麥克風(fēng)模塊、數(shù)據(jù)采集卡以及計(jì)算機(jī)。三維陣列模型如圖4所示,相鄰兩麥克風(fēng)之間的距離為50 cm,麥克風(fēng)采用MAX9812麥克風(fēng)模塊,為全向性麥克風(fēng),20 dB固定增益放大。選用 USB DAQ多功能數(shù)據(jù)采集卡采集聲音數(shù)據(jù),采集卡的輸入端通過6根數(shù)據(jù)線與麥克風(fēng)陣列相連,輸出端通過USB連接計(jì)算機(jī),USB DAQ采集卡具有8路差分16位高速同步模擬信號(hào)采集,8 個(gè)AD620高精度差分放大器,16路數(shù)字信號(hào)單向輸入,16路數(shù)字信號(hào)單向輸出。單通道的采樣頻率最大可達(dá)200 kHz。本實(shí)驗(yàn)只使用了其中6路通道。
3.2 實(shí)驗(yàn)分析
通過具體實(shí)驗(yàn)對(duì)麥克風(fēng)陣列以及算法進(jìn)行驗(yàn)證。本實(shí)驗(yàn)環(huán)境內(nèi)存在一定的噪聲,噪聲主要來源于室內(nèi)照明設(shè)備、電腦風(fēng)扇以及空調(diào),聲源為手機(jī)播放的一段音樂。數(shù)據(jù)采集卡的采樣頻率設(shè)置為200 kHz,采樣位數(shù)為16位,采樣點(diǎn)數(shù)設(shè)為1×105個(gè)。
測(cè)試時(shí),對(duì)每個(gè)位置都進(jìn)行6次實(shí)驗(yàn),求取的實(shí)驗(yàn)結(jié)果為6次實(shí)驗(yàn)的平均值。實(shí)驗(yàn)結(jié)果如表1所示。
由表1的定位結(jié)果來看,該系統(tǒng)實(shí)現(xiàn)了聲源定位的基本功能,角度的誤差在±5°以內(nèi),能夠較準(zhǔn)確地找到聲源所在的方位,距離誤差不超過±15 cm,在所接受的范圍內(nèi)。
4 結(jié)論
本文設(shè)計(jì)實(shí)現(xiàn)了基于麥克風(fēng)陣列的聲源定位系統(tǒng),該系統(tǒng)采用6個(gè)麥克風(fēng)組成的三維陣列,并根據(jù)改進(jìn)的廣義互相關(guān)算法獲取時(shí)延,再根據(jù)球形插值法確定聲源在空間中的位置。
從實(shí)驗(yàn)結(jié)果與分析可以看出,該算法得到的聲源位置較準(zhǔn)確。而且本系統(tǒng)能將聲源的位置信息顯示在界面上,具有更加直觀的效果。不足的是,系統(tǒng)不夠便攜且只能定位單聲源,后續(xù)需要進(jìn)一步研究將算法移植到便攜式開發(fā)板上以及多聲源定位算法。
參考文獻(xiàn)
[1] 韓文革,蘇淑靖,薛彥杰.基于麥克風(fēng)陣列的聲源被動(dòng)定位系統(tǒng)設(shè)計(jì)[J].電子技術(shù)應(yīng)用,2017,43(12):61-64.
[2] 姜志鵬,唐加能,梁瑞宇.實(shí)時(shí)聲源定位算法研究與實(shí)現(xiàn)[J].電子器件,2015,38(6):1406-1411.
[3] 葛李賀.基于波束形成算法的聲源定位研究及DSP實(shí)現(xiàn)[D].南京:南京信息工程大學(xué),2015.
[4] 劉賓.基于聲源定位的靶標(biāo)測(cè)量技術(shù)研究[D].西安:西安電子科技大學(xué),2017.
[5] 劉璐.基于麥克風(fēng)陣列的機(jī)器人聲源定位系統(tǒng)研究[D].長(zhǎng)春:長(zhǎng)春工業(yè)大學(xué),2018.
[6] 伏智超.基于Cortex-A8嵌入式系統(tǒng)的聲源定位技術(shù)研究與實(shí)現(xiàn)[D].南京:東南大學(xué),2015.
[7] 程方曉,劉璐,姚清華,等.基于改進(jìn)時(shí)延估計(jì)的聲源定位算法[J].吉林大學(xué)學(xué)報(bào)(理學(xué)版),2018,56(3):681-687.
[8] 劉云飛.基于麥克風(fēng)陣列的聲源定位方法的研究[D].杭州:杭州電子科技大學(xué),2018.
[9] 陳國(guó)良,徐揚(yáng),黃曉琴.基于正四棱錐結(jié)構(gòu)的機(jī)器人聲源定位系統(tǒng)研究[J].計(jì)算機(jī)應(yīng)用研究,2018,36(4):1088-1092.
[10] 郭俊成.基于傳聲器陣列的聲源定位技術(shù)研究[D].南京:南京航空航天大學(xué),2007.
[11] 喬健,王建明.抑制風(fēng)噪聲的頻點(diǎn)離散值加權(quán)GCC-PHAT時(shí)延估計(jì)算法[J].電子技術(shù)應(yīng)用,2018,44(3):72-76,80.
[12] 張明瀚.基于時(shí)延估計(jì)的聲源定位系統(tǒng)研究[D].重慶:重慶大學(xué),2009.
作者信息:
余秋婷,熊俊俏
(武漢工程大學(xué) 電氣信息學(xué)院,湖北 武漢430205)