《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 華平多路音頻的混音方法
華平多路音頻的混音方法
CCTIME飛象網(wǎng)
摘要: 目前,隨著視頻會議及監(jiān)控的迅速發(fā)展,視頻和音頻的應(yīng)用技術(shù)已經(jīng)相對成熟。在實(shí)際應(yīng)用中,音頻的交互處理仍然處于最基本和最核心的部分,人們對音頻的實(shí)時性要求更為苛刻,因此,在網(wǎng)絡(luò)帶寬允許的條件下,當(dāng)不同地點(diǎn)的多個終端,需要進(jìn)行實(shí)時音頻交互時,需要將多路音頻按照一定的策略進(jìn)行混合,并最終編碼發(fā)送給另外的終端。
關(guān)鍵詞: 華平 多路音頻 混音方法
Abstract:
Key words :

     背景及問題

    目前,隨著視頻會議及監(jiān)控的迅速發(fā)展,視頻和音頻的應(yīng)用技術(shù)已經(jīng)相對成熟。在實(shí)際應(yīng)用中,音頻的交互處理仍然處于最基本和最核心的部分,人們對音頻的實(shí)時性要求更為苛刻,因此,在網(wǎng)絡(luò)帶寬允許的條件下,當(dāng)不同地點(diǎn)的多個終端,需要進(jìn)行實(shí)時音頻交互時,需要將多路音頻按照一定的策略進(jìn)行混合,并最終編碼發(fā)送給另外的終端。

    多路音頻交互的核心問題就是混音,而提供資源使用率相對低且音頻交互質(zhì)量更高的混音方法,以提升用戶的實(shí)際體驗(yàn)效果,已成為本領(lǐng)域技術(shù)人員需要解決的技術(shù)難題。

    傳統(tǒng)多路音頻混音方法分析

    為解決此類問題,傳統(tǒng)的方法是采用多點(diǎn)控制單元(MCU)將多路音頻信號混音為一路,如此可以有效降低網(wǎng)絡(luò)數(shù)據(jù)的傳輸量。MCU混音的方式是:根據(jù)信號線性疊加的原理,將多路音頻信號的采樣量化數(shù)據(jù)疊加。隨著終端數(shù)量的增多,此種方式會導(dǎo)致MCU的運(yùn)算負(fù)荷和上傳帶寬急劇增大,所以此方式只能適用在較小規(guī)模的會議系統(tǒng)中。

    將混音處理都集中在一臺服務(wù)器來進(jìn)行,對服務(wù)器的上傳帶寬和CPU處理能力要求很高,由此衍生出了分布式處理方式,即由多個終端來進(jìn)行混音處理,而分布式的混音方法遇到的最主要問題就是對終端的下載帶寬要求較高,同時也需要終端具有較高的多路音頻解碼和混音的處理能力,此外還需要終端配置良好的混音算法以獲得高質(zhì)量的混音效果。

    目前,諸多的混音算法,用于處理4路以內(nèi)的音頻,還能獲得較好的混音效果,然而對于4路以上的音頻,混音后音質(zhì)會急劇下降,而且極易出現(xiàn)量化溢出等問題(如圖1所示效果)。為了確保各路音頻的波形盡量能夠在混音后保持原始的形態(tài),以達(dá)到聲音真實(shí)還原和音質(zhì)更佳的效果,就必須解決數(shù)據(jù)疊加溢出的問題。

    常見的幾種解決溢出問題的方式如下:

    1.平均化時域線性疊加的方法;

    此法最為簡單,但是混音效果很不好,存在混音后各路的音頻衰減太多,音量偏小,不利于實(shí)時的溝通。

    2.基于變換域的混音方法:

    將各路音頻轉(zhuǎn)化為頻域并做覆蓋性差值,最后轉(zhuǎn)換回時域得到混音數(shù)據(jù)的方法。此類方法雖然能很好解決溢出問題,但實(shí)現(xiàn)四路以上的混音難度較高,不具備普遍應(yīng)用的優(yōu)勢。

    圖1現(xiàn)有直接疊加混音后的效果圖(6路音頻輸入)

    華平多路音頻混音方法分析

    華平提供的多路音頻幀的混音方法是一種基于時域信號疊加的自適應(yīng)的多路音頻混合方法,能夠混合超過4路以上的音頻,實(shí)現(xiàn)方法:先將多路音頻幀中相應(yīng)采樣點(diǎn)的值分別疊加以獲得至少一個樣點(diǎn)數(shù)據(jù),且當(dāng)有疊加后的結(jié)果超出預(yù)設(shè)范圍時,對當(dāng)前幀增益因子進(jìn)行調(diào)整,當(dāng)一幀疊加完成后,將所得的當(dāng)前幀增益因子與前一幀增益因子進(jìn)行比較,根據(jù)比較后的結(jié)果再次調(diào)整當(dāng)前幀增益因子,接著,再根據(jù)再次調(diào)整后的當(dāng)前幀增益因子、及音量強(qiáng)度的初始值計(jì)算當(dāng)前幀的音量強(qiáng)度等級,并判斷音量強(qiáng)度等級是否等于預(yù)設(shè)值,如果是,則將疊加后獲得的各樣點(diǎn)數(shù)據(jù)形成的幀作為混音幀,如果否,則根據(jù)音量強(qiáng)度等級對各樣點(diǎn)數(shù)據(jù)進(jìn)行處理,以使處理后的各樣點(diǎn)數(shù)據(jù)都處于預(yù)設(shè)范圍內(nèi),并將處理后的各樣點(diǎn)數(shù)據(jù)所形成的幀作為混音幀。

    本多路音頻幀的混音方法通過對線性疊加后的混音數(shù)據(jù)進(jìn)行溢出判斷,當(dāng)溢出時,對當(dāng)前幀增益因子做一定的調(diào)整和計(jì)算,然后通過對混音后每幀數(shù)據(jù)進(jìn)行對比分析,根據(jù)對比前后幀的相關(guān)參數(shù)來不斷調(diào)整增益調(diào)節(jié)因子,并當(dāng)混音出現(xiàn)溢出的時候自動將當(dāng)前幀做飽和處理,能夠避免混音后產(chǎn)生的溢出的噪音,并保持原始波形基本不變,音量大小基本不會受影響(如圖2所示效果)。

    圖2華平多路音頻混音方法混音后效果圖(6路音頻輸入)

    綜上所述,及對比圖1和圖2效果可知:現(xiàn)有直接疊加混音方法在超過6路的音頻輸入后,不能保持波形的原始形態(tài),且出現(xiàn)采樣過載和溢出等問題,導(dǎo)致聲音不能完全再現(xiàn)其原始的效果。華平的混音方法在超過6路音頻輸入后,可以保持波形的原始形態(tài),完全解決了多路混音后存在的采樣疊加溢出的問題,使溝通更加順暢。

    華平多路音頻混音方法的其他特點(diǎn)及應(yīng)用

    ² 混音出現(xiàn)溢出的時候能自動將當(dāng)前幀做飽和處理,能夠徹底避免混音產(chǎn)生的不同程度的噪音問題。

    ² 實(shí)現(xiàn)方法相對簡單,基于定點(diǎn)更易于應(yīng)用在便攜設(shè)備和低功耗設(shè)備上。

    ² 可以用于集中式或分布式的各種環(huán)境中,在超過5路以上音頻混音的總體輸出效果,超過了其他方法。

    ² 相比現(xiàn)有的方法,在保持了音頻的波形質(zhì)量的同時,可以混合更多路數(shù)的音頻作為混音輸出。完全可以應(yīng)用在更大型的指揮監(jiān)控系統(tǒng)中,實(shí)現(xiàn)更多點(diǎn)的音頻實(shí)時交互功能。

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。