??? 摘? 要: 分析了耳蝸濾波器與小波變換" title="小波變換" target="_blank">小波變換的相似性,以耳蝸頻率響應(yīng)為基礎(chǔ),設(shè)計(jì)出相應(yīng)的小波變換基函數(shù),并通過(guò)二進(jìn)尺度變換得到一組小波作為耳蝸濾波器組。研究了利用該小波濾波器組進(jìn)行多分辨率分析的數(shù)字實(shí)現(xiàn)方法,給出了相應(yīng)的分析濾波器。理論和實(shí)驗(yàn)結(jié)果均表明,利用小波變換來(lái)實(shí)現(xiàn)耳蝸濾波器組是可行的。?
??? 關(guān)鍵詞: 耳蝸濾波器組; 離散小波變換; 多分辨分析; 語(yǔ)音信號(hào)處理
?
??? 耳蝸濾波器在語(yǔ)音增強(qiáng)、語(yǔ)音編碼、語(yǔ)音識(shí)別等方面得到了廣泛的應(yīng)用[1-2]。耳蝸濾波器的設(shè)計(jì)因此也成了語(yǔ)音信號(hào)處理研究的一個(gè)熱點(diǎn)。耳蝸濾波器組的實(shí)現(xiàn)通常是在各頻率點(diǎn)上分別設(shè)計(jì)濾波器,然后利用VLSI(Very Large Scale Integration)來(lái)實(shí)現(xiàn)。這種方法設(shè)計(jì)出的濾波器各通道相互獨(dú)立,參數(shù)調(diào)整需要分別進(jìn)行,增加了濾波器設(shè)計(jì)和修改的復(fù)雜度,并且由于采用模擬的方法,其可靠性和靈活性都受到了很大的限制[3]。數(shù)字耳蝸的實(shí)現(xiàn)近年來(lái)得到了廣泛的關(guān)注。Kate在1991年就提出了耳蝸濾波器數(shù)字實(shí)現(xiàn)的軟件算法,Summerfield于1992年利用ASIC實(shí)現(xiàn)了該算法[4]。然而這種數(shù)字濾波器是對(duì)耳蝸濾波器高度簡(jiǎn)化的模式,它只是由一個(gè)二階濾波器后級(jí)聯(lián)數(shù)個(gè)一階濾波器構(gòu)成。1997年,Lim[5]設(shè)計(jì)出了基于VHDL的耳蝸濾波器組模型,不過(guò)他的濾波器是一階Butterworth濾波器。隨后也出現(xiàn)了一系列的數(shù)字濾波器模型, 然而這些濾波器都是對(duì)耳蝸濾波器組的高度簡(jiǎn)化,其頻率響應(yīng)與生物學(xué)的測(cè)試結(jié)果也相去較遠(yuǎn)。2002年,Apurva Mishra[6]以耳蝸濾波器的Hubbard’s TWAmp模型的頻率響應(yīng)為基礎(chǔ),通過(guò)最小均方誤差算法對(duì)模型的頻率響應(yīng)進(jìn)行擬合,從而設(shè)計(jì)出數(shù)字濾波器的系數(shù),他采用IIR的方式來(lái)實(shí)現(xiàn),這種方法設(shè)計(jì)出的濾波器雖然與生物學(xué)模型吻合較好,但其普適性和設(shè)計(jì)的靈活性較差,而且IIR為非線性相位濾波器,相位失真會(huì)對(duì)聽(tīng)覺(jué)系統(tǒng)后續(xù)處理產(chǎn)生影響。?
??? 本研究將小波變換的多分辨時(shí)頻分析思想引入到耳蝸濾波器組的設(shè)計(jì)中。利用生理學(xué)上獲得的耳蝸頻率響應(yīng)數(shù)據(jù)設(shè)計(jì)小波基函數(shù) (母小波),通過(guò)母小波獲得一組二進(jìn)制離散小波基作為耳蝸濾波器組。這組濾波器覆蓋了人類聽(tīng)覺(jué)范圍,并且由于它們都源自母小波,所以具有很好的一致性,其頻率響應(yīng)與生理學(xué)結(jié)果也能很好地吻合。?
1 小波變換與耳蝸濾波器?
??? 耳蝸是內(nèi)耳的主要組成部分,它是一條蝸牛狀卷曲的管子,里面充滿了液體,其形狀示意如圖1(a)所示。在耳蝸液體的中部有基膜,當(dāng)有聲波進(jìn)入時(shí),基膜的不同區(qū)域會(huì)對(duì)不同頻率產(chǎn)生最大程度的響應(yīng),即沿基膜發(fā)生“諧振”。沿耳蝸各點(diǎn)的諧振頻率分布如圖1(a)所示。發(fā)生諧振時(shí),基膜上的內(nèi)毛細(xì)胞會(huì)將諧振信息轉(zhuǎn)換為神經(jīng)脈沖并通過(guò)聽(tīng)覺(jué)神經(jīng)傳輸?shù)酱竽X,也就是說(shuō),耳蝸的不同位置允許不同頻率的聲波信號(hào)通過(guò)[7]。從這種響應(yīng)模式的耳蝸的作用相當(dāng)于沿基膜放置的一組帶通濾波器。實(shí)驗(yàn)數(shù)據(jù)表明,這組濾波器的帶寬成對(duì)數(shù)增大,其頻率響應(yīng)曲線呈現(xiàn)恒定Q值的特點(diǎn),并且這些濾波器具有非對(duì)稱的頻率響應(yīng),在高頻端比在低頻端的下降更為陡峭。這種結(jié)構(gòu)的濾波器組為聽(tīng)覺(jué)系統(tǒng)提供了一個(gè)多分辨率分析系統(tǒng):當(dāng)輸入為快速變化持續(xù)時(shí)間短的信號(hào)時(shí),其頻率高,將會(huì)在高諧振頻率的通道產(chǎn)生激勵(lì),而此通道濾波器帶寬大,可以獲得高的時(shí)間分辨率;而對(duì)頻譜尖銳的信號(hào)則可提供很好的頻率分辨率。所以,聽(tīng)覺(jué)系統(tǒng)的時(shí)頻分析具有很高的靈活性和自適應(yīng)性。?
?
?
??? 拉直后的耳蝸的頻率響應(yīng)特性如圖1(b)所示,其中心頻率隨位置呈對(duì)數(shù)分布,將其頻率響應(yīng)記為Hω(x-ln(ω))[8],ln(ω)表示自然底對(duì)數(shù)。?
??? 假設(shè)輸入信號(hào)f(t),其Fourier變換?
????
??? ??
??? 這正是輸入信號(hào)f(t)的連續(xù)小波變換。τ為平移參數(shù),s為尺度參數(shù)。小波變換的基函數(shù)(母小波):?
?????
式中,WTf(s,τ)表示f(t)的小波變換,其中的*表示卷積。取不同的尺度因子s,得到一組濾波器Ψs(τ),這組小波濾波器具有恒定的Q值,這與耳蝸濾波器組的恒Q特性也是相符的。?
??? 離散小波變換的小波基Ψn,m(t)是通過(guò)對(duì)小波的尺度參數(shù)和平移參數(shù)抽樣得到的。實(shí)際中采用最多的是二進(jìn)制抽樣,am=2-m,τn=nam,得到離散化小波:?
??? hn,m(t)=2m/2h(2mt-n), m,n∈Z?
??? 這是一種自然的抽樣,當(dāng)比例因子以2為倍數(shù)增大時(shí),小波濾波器的帶寬以2為倍數(shù)減小,同時(shí),平移的抽樣率也以2為倍數(shù)減小,這樣,一半的帶寬采用一半的抽樣率,可以有效避免數(shù)據(jù)冗余。二進(jìn)制小波濾波器組的自適應(yīng)性表現(xiàn)在:它利用一組恒Q值的帶通濾波器將信號(hào)劃分為若干倍頻頻帶,并且在各頻帶內(nèi)的時(shí)間抽樣與帶寬成正比。?
??? 上述分析表明,小波變換的特點(diǎn)與耳蝸的頻率分析特性極為相似,小波變換引入耳蝸濾波器組的設(shè)計(jì)中。從耳蝸頻率響應(yīng)的實(shí)測(cè)數(shù)據(jù)中獲得Hω(x-ln(ω)),便可根據(jù)(6)式計(jì)算小波基,進(jìn)而通過(guò)尺度變換得到一組帶通濾波器,可以大大簡(jiǎn)化濾波器設(shè)計(jì)。傳統(tǒng)的耳蝸濾波器組設(shè)計(jì)方法是對(duì)各通道分別設(shè)計(jì),各通道相互獨(dú)立,參數(shù)調(diào)整需要分別進(jìn)行,增加了濾波器設(shè)計(jì)的復(fù)雜度。而基于小波變換的濾波器組設(shè)計(jì)就可以很好地回避這個(gè)問(wèn)題。?
2 聽(tīng)覺(jué)小波濾波器組的設(shè)計(jì)與實(shí)現(xiàn)?
??? 人耳耳蝸?lái)憫?yīng)的頻率范圍大約為20 Hz~20 kHz,其對(duì)數(shù)中心頻率大約為f0=1 kHz。參考文獻(xiàn)[9]給出了這一中心頻率的耳蝸濾波器的幅頻響應(yīng)曲線,如圖2所示。
?
?
??? 利用MATLAB的invfreqz函數(shù)設(shè)計(jì)具有上述幅頻特性的濾波器系數(shù)。這種方法設(shè)計(jì)出的濾波器的頻率響應(yīng)是給定頻率響應(yīng)在最小均方誤差意義上的逼近。通過(guò)這組濾波器的系數(shù)便可得到相應(yīng)的小波基函數(shù)Ψ(t),如圖3所示。?
?
?
??? 以該沖擊響應(yīng)為小波基函數(shù),通過(guò)二進(jìn)制尺度變換得到一組小波,這組小波濾波器的中心頻率從62.5 Hz(1 kHz×2-4)到16 kHz(1 kHz×24)呈對(duì)數(shù)分布,其幅頻響應(yīng)如圖4所示。與基于物理學(xué)原理的耳蝸濾波器模型的頻率響應(yīng)相比較,可以看出,該小波濾波器組反映出了耳蝸濾波器的本質(zhì)特征。圖5是基于物理學(xué)原理的耳蝸濾波器模型在各倍頻程上的頻率響應(yīng)。?
?
?
?
??? 得到小波函數(shù)Ψ(t)后,便可通過(guò)式(8)設(shè)計(jì)尺度函數(shù)φ(t)[10],得到的φ(t)如圖6所示。?
?
?
????
??? 結(jié)合Ψ(t)和φ(t),通過(guò)關(guān)系式(9)、式(10)計(jì)算二進(jìn)制小波用于多分辨率分析的低通濾波器H(ω)和高通濾波器G(ω),進(jìn)而得到濾波器系數(shù)h(n)和g(n)[11-12],如圖7所示。?
?
?
?????
??? 二進(jìn)聽(tīng)覺(jué)小波多分辨率分析實(shí)現(xiàn)框圖如圖8所示。?
?
?
3 實(shí)驗(yàn)結(jié)果及討論?
??? 圖9為用上述設(shè)計(jì)的聽(tīng)覺(jué)小波濾波器組對(duì)實(shí)際的語(yǔ)音信號(hào)進(jìn)行處理的各通道的處理結(jié)果。其輸入信號(hào)為男音,內(nèi)容為“we,be”,采樣率為10 kHz,8 bit量化。濾波器組的輸出經(jīng)過(guò)全波整流和低通濾波(截止頻率300 Hz,二階IIR濾波器)。?
?
?
??? 圖9中,a是輸入語(yǔ)音信號(hào)的波形,b~g為各倍頻帶內(nèi)的輸出波形,由于語(yǔ)音信號(hào)頻率一般在50 Hz~5 kHz以內(nèi),所以實(shí)驗(yàn)中只使用了62.5 Hz~4 kHz 這7個(gè)倍頻通道。由實(shí)驗(yàn)結(jié)果可以看出,不同的音素會(huì)在不同的濾波通道出現(xiàn),例如,半元音|w|(對(duì)應(yīng)圖中樣點(diǎn)1~1 500)主要分布在中頻段(f0=125、250、500)三個(gè)通道;爆破音|b|濾(對(duì)應(yīng)圖中樣點(diǎn)6 000~7 000)則基本只出現(xiàn)在f0=125 Hz的通道,而元音|i:|則在低頻段和高頻段均會(huì)出現(xiàn)。可見(jiàn),小波變換能很好地表征語(yǔ)音信號(hào)在頻域內(nèi)的特征。?
??? 二進(jìn)聽(tīng)覺(jué)小波對(duì)信號(hào)實(shí)施逐級(jí)抽取(如圖8),使得抽樣率自適應(yīng)匹配信號(hào)帶寬,從而有效減少了冗余數(shù)據(jù)。而且小波變換有快速算法,所以用小波變換來(lái)設(shè)計(jì)和實(shí)現(xiàn)耳蝸濾波器組可以提高語(yǔ)音處理系統(tǒng)的實(shí)時(shí)性。然而,從圖9中也可以看出,這種方法的缺點(diǎn)就是它只能在各倍頻程頻率點(diǎn)上實(shí)現(xiàn)濾波,對(duì)頻帶的劃分比較粗糙,而實(shí)際的生理系統(tǒng)中與耳蝸基膜相連的內(nèi)毛細(xì)胞多達(dá)上萬(wàn)個(gè),即耳蝸將聽(tīng)覺(jué)頻段劃分成了上萬(wàn)個(gè)子帶進(jìn)行處理。所以這種方法還有進(jìn)一步的改進(jìn)之處。?
??? 理論分析及實(shí)驗(yàn)結(jié)果均表明,二進(jìn)制小波變換的特性與耳蝸濾波器組的特性存在很多相似之處,例如,頻率的對(duì)數(shù)分布特性、濾波器組的恒Q特性等。利用小波變換來(lái)實(shí)現(xiàn)耳蝸濾波,不僅可以使濾波器的設(shè)計(jì)和修改大大簡(jiǎn)化,而且可以通過(guò)快速算法提高實(shí)時(shí)性。?
參考文獻(xiàn)?
[1] YU Shao, CHANG Chip Hong. A generalized timefrequency subtraction method for robust speech enhancement based on wavelet filter banks modeling of human?auditory system. IEEE Transactions on Systems,MAN,?and Cybernetic, Part B: Cybernetics, 2007,37(4):877-889.?
[2]?WONG Chun Kit. A decimated electronic cochlea?on a reconfigurable platform, Master thesis, Chinese?University of Hong Kong, July, 2006.?
[3]?LEONG M P,JIN C T,LEONG P H W.An FPGAbased electronic cochlea. EURASIP Journal on?Applied?? Signal Processing, 2003(7):629-638.?
[4] SUMMERFIELD C D, LYON R F.ASIC implementation of the lyon cochlea model. Proc. IEEE Int.Conf.Acoust., Speech, and Signal Processing, San?Francisco, CA, 1992:673-676.?
[5]?LIM S C, TEMPLE A R, JONES S, et al. VHDLbased design of biologically inspired pitch detection?system. in Proc. IEEE Int. Conf. Neural Networks,?vol. 2, Houston, TX, 1997, pp. 922-927.?
[6]?MISHRA A, HUBBARD A E. A cochlear filter implemented? with a field-programmable gate array. IEEE Transactions on Circuits and Systems II:Analog and Digital Signal?Processing, 2002,49(1):54-60.?
[7] SALIMPOUR Y, ABOLHASSANI M D, ZADEH S H.Auditory wavelet transform. The 3rd European Medical?and Biological Engineering Conference, November, 2005:20-25.?
[8] ALDROUBI A, UNCER M. Wavelets in medicine and?biology. CRC press, Inc.1996:528-529.?
[9]?KIANG N Y S. Processing of speech by the auditory?nervous system. Acoust. Soc. Am,1980,68(3):830-835.?
[10] MALLAT S. A wavelet tour of signal processing.Academic?Press, 1999.?
[11] KARMAKAR A, KUMAR A, PATNEY R K. Design of?optimal wavelet packet trees based on auditory perception?criterion. IEEE Signal Processing Letters,2007,14(4):240-243.?
[12] SALIMPOUR Y, ABOLHASSANI M D. Auditory wavelet?transform based on auditory wavelet families. Proceedings?of the 28th IEEE EMBS Annual International Conference?New York City, USA, Aug 30-Sept 3, 2006.