123,123

九个步骤轻松降低手机非稳态噪声

摘要： 移动运营商非常明白语音质量对于留住用户来说很重要。影响语音质量的一个主要因素是环境噪声，因此任何...

關(guān)鍵詞： 放大器非稳态噪声源噪声抑制语音质量测试标准

Abstract：

Key words :

移動(dòng)運(yùn)營(yíng)商非常明白語(yǔ)音質(zhì)量" title="語(yǔ)音質(zhì)量">語(yǔ)音質(zhì)量對(duì)于留住用戶來(lái)說(shuō)很重要。影響語(yǔ)音質(zhì)量的一個(gè)主要因素是環(huán)境噪聲，因此任何抑制噪聲的方法對(duì)于手機(jī)制造商來(lái)說(shuō)都是一個(gè)實(shí)現(xiàn)差異化的機(jī)會(huì)。不過(guò)，直到最近噪聲抑制" title="噪聲抑制">噪聲抑制技術(shù)還只專注于降低緩慢變化的穩(wěn)態(tài)噪聲源" title="噪聲源">噪聲源。然而，很多非穩(wěn)態(tài)" title="非穩(wěn)態(tài)">非穩(wěn)態(tài)噪聲源為快速變化的，因此不能被抑制。因而，用戶不能在繁忙的大街上、擁擠的酒店或者甚至是在家里可靠地使用他們的手機(jī)。

　　抑制非穩(wěn)態(tài)噪聲對(duì)用戶和運(yùn)營(yíng)商都有很大的好處。用戶可以在任何時(shí)候和任何地點(diǎn)自由清楚地通話，可以在嘈雜的環(huán)境中低聲說(shuō)話以保護(hù)其隱私，不會(huì)被要求離開(kāi)重要的電話會(huì)議。運(yùn)營(yíng)商會(huì)看到丟失用戶的數(shù)量降低，增加通話時(shí)間，而且更有效地使用網(wǎng)絡(luò)帶寬，并大大地節(jié)省投資和運(yùn)營(yíng)成本。

圖1. 在采用瞬時(shí)非穩(wěn)態(tài)噪聲抑制技術(shù)前后的時(shí)域波形

　　1．理解穩(wěn)態(tài)和非穩(wěn)態(tài)噪聲之間的差異

　　由于其相對(duì)穩(wěn)定的特性？例如嘈雜的鼓風(fēng)機(jī)環(huán)境中，穩(wěn)態(tài)噪聲可以很容易地被識(shí)別，能用傳統(tǒng)的新好處理方法輕易地去除。相反，非穩(wěn)態(tài)噪聲具有快速或隨即的變化，例如一個(gè)人的說(shuō)話聲、背景音樂(lè)或按鍵音。當(dāng)非穩(wěn)態(tài)噪聲被作為噪聲識(shí)別的時(shí)候，這些噪聲實(shí)際上已經(jīng)通過(guò)，因此需要更成熟的噪聲抑制方法。

　　2．利用分組原理來(lái)分隔聲音點(diǎn)

　　分組方法簡(jiǎn)化了噪聲抑制，同時(shí)還能確定非穩(wěn)態(tài)噪聲源。例如聽(tīng)覺(jué)場(chǎng)分析（ASA）使用人的聽(tīng)覺(jué)通道作為一個(gè)模型，按照人實(shí)際對(duì)某個(gè)聲音的聽(tīng)覺(jué)來(lái)處理噪聲。通過(guò)多聲學(xué)能量進(jìn)行分組來(lái)重新產(chǎn)生原來(lái)的聲音，ASA實(shí)現(xiàn)了來(lái)自多個(gè)源的準(zhǔn)確分組，同時(shí)避免任何聽(tīng)覺(jué)上應(yīng)該分開(kāi)的聲音被混合在一起。分組原理可以被大致描述為連續(xù)的（在一段時(shí)間內(nèi)發(fā)生的）和同時(shí)的（在一段頻率內(nèi)）。

　　3．使用多個(gè)線索來(lái)分組，否則難以正確地對(duì)聲音進(jìn)行分組

　　每一個(gè)分組線索都有局限性。使用多個(gè)線索能對(duì)難以分析的聲音進(jìn)行正確的分組。某些重要的線索包括：

　　●聲音的特性：一個(gè)音源產(chǎn)生的諧波可以形成清楚的頻率圖，這個(gè)頻率圖可以用來(lái)對(duì)兩個(gè)聲音進(jìn)行區(qū)分。聲音特性是區(qū)分男人和女人的一個(gè)主要線索。

　　● 空間信息：由距離和方向判斷出來(lái)的距離可以用來(lái)對(duì)聲音分組，因而可以對(duì)感興趣的聲音進(jìn)行分辨。

　　● 發(fā)出時(shí)間：如果兩個(gè)聲音能量和他們對(duì)應(yīng)的諧波在時(shí)間上一致，他們很可能來(lái)自同一個(gè)音源。

　　4．使用兩個(gè)麥克風(fēng)來(lái)改善對(duì)聽(tīng)覺(jué)現(xiàn)場(chǎng)的理解

　　下一代噪聲抑制技術(shù)，例如聽(tīng)覺(jué)場(chǎng)分析（ASA）、波束成形（BF）和盲源隔離（BSS）使用幾個(gè)麥克風(fēng)來(lái)更準(zhǔn)確地識(shí)別、定位以及噪聲源分組，準(zhǔn)確性比單個(gè)麥克風(fēng)更高。當(dāng)今的手機(jī)制造商已經(jīng)意識(shí)到這種趨勢(shì)，在手機(jī)的架構(gòu)中引入了第二個(gè)麥克風(fēng)。

　　5．減少收斂時(shí)間以消除更多的瞬間噪聲

　　傳統(tǒng)的噪聲抑制方法必須在他們消除噪聲之前收斂，因而他們?cè)谝种品欠€(wěn)態(tài)噪聲源上效率較低。通過(guò)利用快速響應(yīng)的線索來(lái)對(duì)聲音進(jìn)行描述，像打響指這樣的瞬間時(shí)間都可以被識(shí)別并消除。

　　6．采用對(duì)數(shù)與線性頻率比例（FCT vs. FFT）

　　熟悉的快速傅立葉變換（FFT）對(duì)頻率分量按線性比例進(jìn)行分解，這樣限制了在低頻處的頻譜分辨率，而且使用很定的幀大小和獨(dú)立于頻率的帶寬。相反的，快速耳蝸?zhàn)儞Q（FCT）基于人耳蝸的原理，按對(duì)數(shù)頻率比例變化。這樣一來(lái)，它不會(huì)限制頻譜分辨率。通過(guò)不斷的處理，而不是按幀進(jìn)行處理，F(xiàn)CT還降低了處理延遲，因此它適合于識(shí)別非穩(wěn)態(tài)的噪聲源。此外，F(xiàn)CT工作的帶寬是與頻率相關(guān)的，在人耳聽(tīng)覺(jué)范圍內(nèi)能更準(zhǔn)確地匹配時(shí)域-頻域折衷。

　　7．將回聲作為獨(dú)立的音源來(lái)處理

　　一直以來(lái)，人們利用回波消除方法來(lái)消除回聲。這種方法的運(yùn)算量非常大，因?yàn)楸仨氂?jì)算回波反射，在噪聲源變化很快的時(shí)候，其性能很差。分組線索使我們能將會(huì)波作為另外一種噪聲源。由于回波既不需要進(jìn)行計(jì)算，而且不會(huì)改變路徑，因此可以進(jìn)行瞬間抑制，能實(shí)現(xiàn)高達(dá)46dB的回波噪聲抑制性能。

　　8．使用全向麥克風(fēng)來(lái)降低成本

　　像波束成形這類方法需要一種專門(mén)的心型曲線式（cardioid，單向）麥克風(fēng)。這種麥克風(fēng)的成本比全向麥克風(fēng)成本更高，具有更低的噪聲容限，必須進(jìn)行單獨(dú)的校準(zhǔn)和匹配，誤差要低于1dB，帶來(lái)對(duì)間隔的限制，由于對(duì)風(fēng)聲和呼吸聲很敏感，因此會(huì)增加+12dB的噪聲。波束成形技術(shù)也有其局限性，對(duì)所關(guān)注的波束的任何錯(cuò)誤選擇都會(huì)被錯(cuò)誤地傳遞。對(duì)一個(gè)系統(tǒng)所需要的麥克風(fēng)的數(shù)量的管理也很重要。例如，盲源分離（Blind Source Separation）使用一種簡(jiǎn)單的線性非混合方法，在麥克風(fēng)的數(shù)量與音源的數(shù)量一樣多的條件下，這種方法效果非常理想。

　　9．采用新的測(cè)試標(biāo)準(zhǔn)

　　移動(dòng)通信行業(yè)不斷地推進(jìn)測(cè)試標(biāo)準(zhǔn)" title="測(cè)試標(biāo)準(zhǔn)">測(cè)試標(biāo)準(zhǔn)來(lái)表現(xiàn)出通過(guò)在噪聲抑制技術(shù)上的創(chuàng)新實(shí)現(xiàn)更高的語(yǔ)音質(zhì)量等級(jí)。為了保證他們的產(chǎn)品獲得最佳的質(zhì)量，該行業(yè)最近修正了ITU P.835規(guī)范來(lái)提供一致的測(cè)試方法，對(duì)采用了噪聲抑制技術(shù)的語(yǔ)音質(zhì)量進(jìn)行測(cè)試并產(chǎn)生測(cè)試報(bào)告。

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容