摘 要:語(yǔ)音編碼方案的選取對(duì)移動(dòng)通信系統(tǒng)的通話質(zhì)量、信道容量等有重要影響。討論了TD-SCDMA系統(tǒng)中AMR語(yǔ)音編碼的自適應(yīng)機(jī)制,分析了AMR中代數(shù)碼本線性預(yù)測(cè)(ACELP)算法及實(shí)現(xiàn)過(guò)程。該方案可以在一塊TMS320C5510上實(shí)現(xiàn),通過(guò)在TD-SCDMA系統(tǒng)的硬件平臺(tái)上自環(huán)測(cè)試,結(jié)果是理想的。
0 引 言
在語(yǔ)音編碼領(lǐng)域中,隨著傳輸、處理、存儲(chǔ)等各種信息量的巨增,信息的壓縮處理已成為迫切的要求,基于新的網(wǎng)絡(luò)和新的要求,無(wú)論是從節(jié)省傳輸頻帶資源,還是保持線路通信的高效率等方面來(lái)看,研究采用各種可變速率語(yǔ)音編碼技術(shù)的系統(tǒng)都有重要意義。目前為了適應(yīng)此需要提出了AMR(adaptivemulti-rate)概念,即自適應(yīng)話音編碼器?;趲挼目紤]可分為AMR- NB(AMRNarrowband)和AMR-WB(AMRwideband)。對(duì)于AMR-NB,語(yǔ)音通道帶寬限制為3.7 MHz,采樣頻率為8 kHz,而AMR-WB為7 MHz的帶寬,采樣頻率為16 kHz,但考慮語(yǔ)音的短時(shí)相關(guān)性,每幀長(zhǎng)度均為20 ms。這2種編碼器根據(jù)帶寬的要求雖然選用了不同的速率,但有異曲同工
之處,以下著重介紹在TD-SCDMA中AMR-NB的實(shí)現(xiàn)。此編碼器運(yùn)用了代數(shù)碼本線性預(yù)測(cè)(ACELP)混合編碼方式,也就是數(shù)字語(yǔ)音信號(hào)中既包括若干語(yǔ)音特征參數(shù)又包括部分波形編碼信息,再運(yùn)用這些特征信息重新合成語(yǔ)音信號(hào)的過(guò)程??刂七@些參數(shù)的提取數(shù)目,根據(jù)速率要求對(duì)信息進(jìn)行取舍而得到了以下8種速率,混合組成如表1所示的自適應(yīng)語(yǔ)音編碼器。表1中模式AMR-12.20就提取出244比特的參數(shù)信息,而模式AMR-4.70卻只提取了95比特信息。根據(jù)這些比特所含的信息量可以將其分為3類比特class 0,1,2。在信道編碼時(shí)class0和1都將會(huì)使用循環(huán)冗余校驗(yàn)碼進(jìn)行差錯(cuò)檢驗(yàn),對(duì)于class 2則根據(jù)上一幀進(jìn)行恢復(fù)。
語(yǔ)音編碼或語(yǔ)音壓縮編碼研究的基本問(wèn)題,就是在給定編碼速率的條件下,如何能得到盡量好的重建語(yǔ)音質(zhì)量。主觀評(píng)定方法符合人類聽話時(shí)對(duì)語(yǔ)音質(zhì)量的感覺得到了廣泛應(yīng)用。常用的方法有平均得分意見(mean opinion score,簡(jiǎn)稱MOS)判定法,表2說(shuō)明了AMR話音編碼器各模式的話音質(zhì)量。
1 AMR模式選擇的自適應(yīng)機(jī)制
自適應(yīng)的基本概念是以更加智能的方式解決信源和信道編碼的速率分配問(wèn)題,使得無(wú)線資源的配置和利用更加靈活和高效。實(shí)際的語(yǔ)音編碼速率取決于信道的條件,它是信道質(zhì)量的函數(shù)。而這部分的工作是解碼器根據(jù)噪聲等測(cè)量參數(shù)協(xié)助基站來(lái)完成的,選擇模式,決定速率快慢。原則上在信道很差的時(shí)候采用速率比較低的編碼器,這樣就能分配給信道編碼更多的比特?cái)?shù)來(lái)實(shí)現(xiàn)糾錯(cuò),實(shí)現(xiàn)更可靠的差錯(cuò)控制,從而有效地抑制錯(cuò)誤發(fā)生,提高話音質(zhì)量[1]。
在TD-SCDMA系統(tǒng)實(shí)現(xiàn)方面為了便于量化比較而采用了C/I(載干比)這一概念,取其滑動(dòng)平均值,再將此值與一預(yù)先定義好的門限值進(jìn)行比較,來(lái)決定速率的選擇。由于不同的特性,全速率信道和半速率信道就應(yīng)有不同的定義值。在全速率信道,當(dāng)C/I≥13時(shí),MR122的MOS值可以達(dá)到4以上,可以提供很好的性能;9≤C/I<13時(shí),MR122、MR102、MR795都是可以選擇的,速率越低,誤幀率越低;當(dāng)6≤C/I<9時(shí),最好選擇MR74、 MR67、MR59;而當(dāng)C/I<6時(shí)就應(yīng)盡量選擇越低的速率,隨著信道質(zhì)量的下降,誤幀率都會(huì)增加,但相對(duì)選擇的速率低,就能提供相對(duì)較好的話音質(zhì)量。對(duì)于半速率信道,與上述類似,不再累述。下面進(jìn)一步說(shuō)明自適應(yīng)速率選擇的實(shí)現(xiàn)過(guò)程。圖1是完整的說(shuō)明圖。自適應(yīng)要求有2類信息需要傳輸:在下行信道上,需要基站發(fā)送給移動(dòng)臺(tái)1模式選擇測(cè)量命令,而在上行信道上,移動(dòng)臺(tái)將信道測(cè)量信息傳送給基站。這種模式要求傳送信息準(zhǔn)確、可靠、及時(shí),才能有效達(dá)到自適應(yīng)的目的?;久繋l(fā)送1測(cè)量命令,得到返回信息,通過(guò)比較選擇,選擇1模式用于下一幀。這樣就可以實(shí)現(xiàn)速率間的轉(zhuǎn)換,達(dá)到自適應(yīng)的目的,在速率間的切換會(huì)有一定功率損耗,并且不同速率間的損 耗是不同的,這是在實(shí)現(xiàn)過(guò)程中應(yīng)該考慮的[2,3]。
2 AMR編碼器算法
AMR編碼器算法是基于代數(shù)碼本線性預(yù)測(cè)(ACELP)的混合編碼算法[4,5]。基本原理是原始語(yǔ)音按幀輸入,根據(jù)使合成語(yǔ)音與原始語(yǔ)音的加權(quán)均方誤差最小的準(zhǔn)則,從隨機(jī)碼本和固定碼本中挑選合適的碼矢以代替殘差信號(hào),并將碼矢地址和增益及各濾波器的參數(shù)量化編碼后傳送到接收端;接收端恢復(fù)各濾波器時(shí),采用與發(fā)送端相同的碼本,按照碼矢地址找到該碼矢乘上增益,激勵(lì)合成濾波器,得到合成語(yǔ)音。在編碼部分需要抽取下列典型參數(shù):線性預(yù)測(cè)濾波器系數(shù)(LP),自適應(yīng)碼本(ACB)和固定碼本(FCB)索引以及2種碼本的增益( 見圖2)。下面將分別從編碼和解碼 的角度闡述AMR編解碼方案。
?。?)線性預(yù)測(cè)計(jì)算。LPC濾波器表征語(yǔ)音信號(hào)發(fā)生模型中的聲道模型,圖2中
其中,A(z)為聲道傳輸函數(shù),ai隨語(yǔ)音幀的變化不斷改變(ai具有短時(shí)穩(wěn)定性)。因此,在每個(gè)語(yǔ)音幀中,需要提取LPC系數(shù)。按其預(yù)測(cè)值與實(shí)際值最小 化均方誤差原則,可得下式:
上述正則方程[6]采用Durbin算法進(jìn)行線性預(yù)測(cè)便可得到參數(shù)ak??紤]到線譜頻率(LSF)誤差的相對(duì)獨(dú)立性及有序有界性質(zhì),與線性預(yù)測(cè)參數(shù)(LP)是一一對(duì)應(yīng)的,采用Chebyshev多項(xiàng)式估計(jì)方法是可以相互轉(zhuǎn)換的,因此在考慮傳輸時(shí)用LSF參數(shù)代替LP參數(shù),將其進(jìn)行矢量量化,在解碼部分再對(duì)LP進(jìn)行恢復(fù)。在12.2 kbit/s模式下采用分裂矩陣(SMQ)的方式進(jìn)行矢量量化,在其它模式下采用分裂矢量(SVQ)的方式進(jìn)行矢量量化。由于在12.2kbit/s中,每一幀需要進(jìn)行2次線性預(yù)測(cè)編碼(LPC)分析,所以會(huì)得到2組LSF系數(shù)。AMR在TD-SCDMA系統(tǒng)的具體實(shí)現(xiàn)過(guò)程中將這2組系數(shù)進(jìn)行聯(lián)合量化。也就是將矩陣(r(1),r(2))分為5個(gè)2×2的子陣,分別
進(jìn)行矢量量化,維數(shù)為4,碼本容量分別為128(子陣1),64(子陣5),256(子陣 2,3,4),失真 測(cè)度選擇計(jì)算量最小也有主觀評(píng)價(jià)意義的歐式距離,在碼本搜索過(guò)程中采用了全搜索算法。同樣,對(duì)于其它的編碼速率,有相同的思路和操作步驟,最大的差別就是對(duì)LSF矢量的子陣劃分,它們的劃分方法是采用維數(shù)為3,3和4的3個(gè)子陣(子矢量)。
?。?)碼本搜索[4]。TD- SCDMA系統(tǒng)中,AMR自適應(yīng)碼本搜索和代數(shù)碼本搜索是語(yǔ)音合成的關(guān)鍵,它們都是在子幀的基礎(chǔ)上完成的,其中,每個(gè)子幀長(zhǎng)為5 ms,對(duì)應(yīng)4個(gè)樣點(diǎn)。自適應(yīng)碼本表征語(yǔ)音信號(hào)發(fā)生模型中的周期性結(jié)構(gòu),自適應(yīng)碼本搜索通過(guò)一個(gè)長(zhǎng)時(shí)預(yù)測(cè)濾波器(LTP),去除信號(hào)中存在的長(zhǎng)時(shí)相關(guān),使殘差信號(hào)頻譜更加平坦,以便于形成白噪聲激勵(lì)信號(hào),同時(shí)提取基音延遲和對(duì)應(yīng)的基音增益。再經(jīng)過(guò)基音開環(huán)和閉環(huán)分析得到分?jǐn)?shù)基音延遲決定后,自適應(yīng)碼本矢量v (n)通過(guò)在最佳的整數(shù)延遲kopt和相位(分?jǐn)?shù)延遲)t處內(nèi)插就得到
代數(shù)碼本表示語(yǔ)音信號(hào)發(fā)生模型中的隨機(jī)信號(hào),根據(jù)感覺加權(quán)均方誤差最小的原則,最終獲得[2]。代數(shù)碼本結(jié)構(gòu)是基于交織單脈沖序列(ISPP)的,其脈沖幅度和位置的取值都要受到一定的限制以滿足一定的代數(shù)結(jié)構(gòu)和比特分配要求,對(duì)于不同速率,脈沖位置和個(gè)數(shù)都選擇不同。而且在系統(tǒng)中,碼本設(shè)計(jì)上改進(jìn)了以前的高斯隨機(jī)碼本結(jié)構(gòu),構(gòu)造了中心削波的重疊碼本。經(jīng)稀疏后,碼本中就會(huì)產(chǎn)生90%的零值。這樣是可以簡(jiǎn)化搜索過(guò)程的。通過(guò)最大化下式可?量,d=Htx2表示目標(biāo)信號(hào)x2(n)和沖激響應(yīng)h′w(n)之間的相關(guān)性。在得到以上參數(shù)后,AMR中系統(tǒng)總共設(shè)計(jì)了3種量化器。AMR-12.2代數(shù)碼本增益的量化是采用6比特標(biāo)量量化器,AMR -4.75是將自適應(yīng)碼本增益和代數(shù)碼本增益進(jìn)行聯(lián)合量化,而對(duì)于其他速率則是按原始語(yǔ)音與合成語(yǔ)音的加權(quán)誤差最小找出目標(biāo)矢量。由于考慮多速率的公用,所以碼本容量較大,這與其他編碼器是不同的。
?。?)AMR解碼原理。解碼器分為3大部分:譯碼部分、語(yǔ)音合成和后濾波。在解碼器輸入端,從接收的比特流中獲得LSP矢量、自適應(yīng)碼本和代數(shù)碼本參數(shù)(索引和增益)等。LSP線譜對(duì)參數(shù)還需要轉(zhuǎn)化為線性預(yù)測(cè)濾波器系數(shù),再根據(jù)LP系數(shù)內(nèi)插得到各子幀的合成濾波器系數(shù)。激勵(lì)矢量由自適應(yīng)碼本和代數(shù)碼本經(jīng)各自的增益加權(quán)后獲得,將激勵(lì)矢量輸入合成濾波器得到重建的語(yǔ)音信號(hào)。最后,重建的語(yǔ)音信號(hào)還需要經(jīng)過(guò)后濾波處理。ACELP編碼器編碼的語(yǔ)音可看成是包含了高斯噪聲的原始語(yǔ)音。使用后濾波可以減少合成語(yǔ)音中包含的噪聲信號(hào),從而有效地提高合成語(yǔ)音的語(yǔ)音質(zhì)量。后處理包括兩部分功能:自適應(yīng)后濾波和信號(hào)放大。自適應(yīng)增益控制用于補(bǔ)償合成語(yǔ)音和經(jīng)過(guò)后濾波的合成語(yǔ)音之間的失真。將信號(hào)通過(guò)以下濾波器,就可得到修正的后濾波合成語(yǔ)音。
3 結(jié)束語(yǔ)
AMR的提出能提供高質(zhì)量的語(yǔ)音,增強(qiáng)抗信道誤差的能力,通過(guò)低編碼速率靈活配置提高了系統(tǒng)容量,編碼速率根據(jù)無(wú)線環(huán)境和本地容量需求動(dòng)態(tài)選擇不同模式。筆者圍繞AMR語(yǔ)音編碼算法進(jìn)行分析和研究。該算法已在TI公司的TMS320 C5510DSP上采用定點(diǎn)C語(yǔ)音和匯編語(yǔ)言的混合編程實(shí)現(xiàn),并用于TD-SCDMA系統(tǒng)中,運(yùn)算量能降低到20 MIPS左右,通過(guò)在TD-SCDMA系統(tǒng)的硬件平臺(tái)上自環(huán)測(cè)試,可得到良好的通話語(yǔ)音質(zhì)量,結(jié)果是很理想的。