在MP3之后,3GPP又制定了一系列的語音編碼(壓縮)新標準──AAC和AMR家族。AAC家族包含了AAC、HE-AAC、EAAC+;其競爭對手AMR家族則包含了:AMR、AMR-WB、AMR-WB+。這些新技術(shù)足夠讓人眼花繚亂,但對手機芯片、制造業(yè)者和工程師而言,這是一個嶄新的機會。
AAC
AAC(Advanced Audio Coding)也稱為MPEG-2 AAC,是一種數(shù)據(jù)會遺失(lossy)的語音串流壓縮標準。AAC是MPEG-2的一部份,是用來取代MP3的,但是AAC和MP3不同,AAC無法向后兼容,MP3可以,例如:MP3可以和MP2兼容。
AAC最多可以支持48個頻道,取樣率從8 kHz到96 kHz。AAC的語音分辨率(resolution)比MP3高,一般而言,96 kbps的AAC之語音品質(zhì)優(yōu)于或等同于128 kbps的MP3,因此,AAC可以在低速的網(wǎng)絡(luò)內(nèi)傳輸語音串流,而且,不會影響語音的品質(zhì)。
HE-AAC(AAC+)
HE(high efficiency) AAC又稱為MPEG-4 HE-AAC或簡稱AAC+,它是MPEG-2 AAC和SBR(Spectral Band Replication)帶寬延伸修訂版的技術(shù)組合。HE-AAC不是要取代AAC,而是要延伸MPEG-4的語音品質(zhì),能夠以更低的速率傳輸(32 kbps)。而且,HE-AAC譯碼器可以對AAC解碼。
若要產(chǎn)生48 kbps的HE-AAC立體聲,HE-AAC編碼器會產(chǎn)生兩種信號:一個是42 kbps的MPEG AAC信號,另一個是6 kbps的SBR信號。然后,此SBR信號置于MPEG AAC的輔助字段內(nèi)(該字段是MPEG-4定義的)。最后,構(gòu)成一個完整48 kbps的MPEG-4 HE-AAC串流。SBR代表高頻的成份,而AAC代表低頻的成份。HE-AAC譯碼器使用AAC和SBR信號,產(chǎn)生全頻信號;而AAC譯碼器只使用AAC信號,亦即,只有低頻成份被它解碼。
HE-AAC能傳輸48 kbps的CD立體聲,或128 kbps、5.1聲道的“環(huán)場聲”(surround sound)。這樣的效率,使它適用于Internet傳輸,或移動數(shù)字廣播。不過,由于HE-AAC的高延遲特性,使它不適用于雙向的通信應(yīng)用。
EAAC+
Enhanced AAC+(EAAC+)是在2004年時,納入3GPP的第6版標準中。根據(jù)3GPP,它是由MPEG-4 AAC、MPEG-4 SBR和MPEG-4“參數(shù)立體聲”(Parametric Stereo)技術(shù)組合的。“參數(shù)立體聲”技術(shù)能夠在低傳輸率中,進行“立體聲”的編碼,其基本原理類似SBR。
AMR
AMR(Adaptive Multi-Rate)標準是在1998年被提出。它的主要功能是提供移動裝置使用的基本語音(baseline speech)。它以可變速率的非立體聲(mono)傳輸,速率在4.75 kbps~12.2 kbps之間,它屬于窄頻,帶寬只有3.5 kHz。它被3GPP當(dāng)成3G無線電網(wǎng)絡(luò)系統(tǒng)的基本編譯碼技術(shù);3G是從GSM、WCDMA、EDGE、GPRS演變而來的,而且,不管是2G、2.5G或3G,AMR都是這些無線電網(wǎng)絡(luò)標準的最基本編譯碼技術(shù)。
AMR的基本原理是:當(dāng)通信干擾增加時,就降低編譯碼速率,而且還能實現(xiàn)更多的校錯(error correction)功能。AMR也可以讓不同手機系統(tǒng)的編譯碼技術(shù)之間能夠盡量兼容,這是靠ACELP(Algebraic Code Excited Linear Prediction)技術(shù)達到的。ACELP是一種語音壓縮系統(tǒng),它可以在低速的網(wǎng)絡(luò)環(huán)境中,提供高品質(zhì)的語音。
AMR-WB
AMR-WB(wideband extension)是AMR的升級版,它也是使用ACELP技術(shù)。2000年12月時,ETSI/3GPP將AMR-WB標準化,并公布于世。ITU-T在2002年采用它,并另命名為G.722.2。
由于AMR-WB的語音帶寬很寬(50 Hz~7 kHz),所以它的語音品質(zhì)很高。它具有9種采樣速率(都是非立體聲),分別是:23.85 kbps、23.05 kbps、19.85 kbps、18.25 kbps、15.85 kbps、14.25 kbps、12.65 kbps、8.85 kbps、6.6 kbps。其中,能夠保持高的語音品質(zhì),并且速率最低者是12.65 kbps。AMR-WB已經(jīng)被UMTS/IMT-2000無線電網(wǎng)絡(luò)采用,作為它的編譯碼基本技術(shù);UMTS也是一種3G新標準。
AMR-WB+
2004年9月,ETSI/3GPP將AMR-WB+標準化。AMR-WB+是AMR-WB的升級版,它使用ACELP和TCX(Transform Coded Excitation)技術(shù),提供高品質(zhì)的語音和其它音頻內(nèi)容──這包括:自然聲、數(shù)字音樂、與音樂相混合的聲音(voice-between-music/voice-over-music)。
AMR-WB+增加了立體聲信號和支持更高的采樣速率。并且,使用高效率的“參數(shù)立體聲”(HE-PS)技術(shù),能夠以低速率傳輸高品質(zhì)的立體聲。TCX轉(zhuǎn)換編碼技術(shù)則補償了ACELP的不足。
AMR-WB+的采樣速率是從6 kbps~48 kbps;立體聲的采樣速率是8 kbps~48 kbps,非立體聲的采樣速率是6 kbps~36 kbps。這使得它的語音帶寬更寬(24 kHz),接近CD的語音品質(zhì)。此外,AMR-WB+可以和AMR-WB兼容。
技術(shù)比較
根據(jù)歐洲廣播聯(lián)盟(EBU)的人工測試(其方法稱為MUSHRA),除AMR家族尚未測試以外,編譯碼后的語音品質(zhì)最好者是AAC+,在采樣率為48 kbps時,它的品質(zhì)與CD一樣好。其它技術(shù)的語音品質(zhì),按優(yōu)劣順序分別是:MP3PRO、AAC、Real 8、7 kHz LPF、WMA 8、MP3、Real G2、3.5 kHz LPF。
按照3GPP的分類,依傳輸率大小,可區(qū)分成兩類:
1. 低于或等于24 kbps者:ARM-WB+、HE-AAC/AAC+、EAAC+。
2. 高于24 kbps者:HE-AAC/AAC+、EAAC+。
根據(jù)3GPP的MUSHRA測試結(jié)果,ARM-WB+在采樣率為48 kbps時的語音品質(zhì)最高。若以ARM-WB+與EAAC+做比較,在采樣率低于24 kbps時,ARM-WB+的立體聲優(yōu)于EAAC+。
結(jié)語
目前,AAC和AMR-WB技術(shù)已經(jīng)被使用于2G和2.5手機中。而AAC+、EAAC+和AMR-WB+則被使用于3G手機中。它們的應(yīng)用如圖1所示。音樂手機比視頻手機、電視手機更早被市場接受。但是,MP3播放機的價格卻一直下滑,所以,音樂手機或音樂播放機極需要AAC+、EAAC+和AMR-WB+的興起和普及,以帶動另一波的購買熱潮。