摘 要: 針對(duì)無(wú)線衰落信道中AMR-WB寬帶語(yǔ)音編碼,提出一種基于多速率刪余卷積碼的不等錯(cuò)誤保護(hù)傳輸方案。根據(jù)AMR-WB語(yǔ)音編碼數(shù)據(jù)的不同重要性,采用強(qiáng)錯(cuò)誤保護(hù)能力的刪余卷積碼為AMR-WB語(yǔ)音編碼中的A類數(shù)據(jù)提供錯(cuò)誤保護(hù)能力,對(duì)B類數(shù)據(jù)采用高碼率刪余卷積碼提供錯(cuò)誤保護(hù)能力。研究結(jié)果表明,在同樣傳輸帶寬條件下,不等錯(cuò)誤能力保護(hù)可以有效改善無(wú)線衰落信道中AMR-WB語(yǔ)音質(zhì)量。
關(guān)鍵詞: 自適應(yīng)多速率寬帶語(yǔ)音編碼;無(wú)線衰落信道;不等錯(cuò)誤保護(hù);刪余卷積碼
?
國(guó)際電信聯(lián)盟ITU(International Telecommunication Union)于2003年發(fā)布了高質(zhì)量的自適應(yīng)多速率寬帶AMR-WB(Adaptive Multi-Rate Wideband)語(yǔ)音編碼G.722.2作為未來(lái)全球移動(dòng)通信系統(tǒng)GSM(Global System for Mobile)與寬帶碼分多址WCDMA(Wideband Code Division Multiple Access)移動(dòng)通信系統(tǒng)的寬帶語(yǔ)音編解碼標(biāo)準(zhǔn)[1]。該語(yǔ)音編碼標(biāo)準(zhǔn)采樣率為16kHz,支持的語(yǔ)音帶寬為50~7 000Hz,其語(yǔ)音質(zhì)量相對(duì)于G.711、G.723、G.728都有明顯提高。G.722.2采用代數(shù)碼激勵(lì)線性預(yù)測(cè)ACELP(Algebraic Code-Excited Linear Prediction)算法,提供比特率從6.60kb/s到23.85kb/s的9種不同的編碼模式,語(yǔ)音聲碼器根據(jù)無(wú)線信道和傳輸狀況來(lái)自適應(yīng)地選擇合適速率進(jìn)行編碼傳輸,支持不連續(xù)傳輸模式、語(yǔ)音激活檢測(cè)和舒適背景噪聲產(chǎn)生的功能[2]。AMR-WB寬帶編解碼標(biāo)準(zhǔn)可以應(yīng)用于無(wú)線通信網(wǎng)絡(luò)和有線通信網(wǎng)絡(luò), 解決了不同網(wǎng)絡(luò)之間的語(yǔ)音編碼方式的轉(zhuǎn)換問(wèn)題,可以緩解通信系統(tǒng)與設(shè)備之間不同語(yǔ)音編碼方式轉(zhuǎn)換帶來(lái)的額外復(fù)雜性[3]。
如何提高無(wú)線衰落信道中AMR-WB語(yǔ)音的傳輸質(zhì)量是無(wú)線多媒體通信研究的一個(gè)熱點(diǎn),其中不等錯(cuò)誤能力保護(hù)UEP(Unequal Error Protection)是一種簡(jiǎn)單有效的手段。UEP通過(guò)對(duì)語(yǔ)音編碼中不同類型的數(shù)據(jù)提供不同的錯(cuò)誤保護(hù)能力來(lái)改善語(yǔ)音的傳輸質(zhì)量。本文研究平坦Rayleigh衰落信道中UEP下AMR-WB的性能,采用不同碼率的變速率刪余卷積碼RCPC(Rate Compatible Punctured Convolutional Codes)為AMR-WB語(yǔ)音編碼數(shù)據(jù)提供的不同錯(cuò)誤保護(hù)能力。研究結(jié)果表明,在語(yǔ)音質(zhì)量感覺(jué)評(píng)價(jià)準(zhǔn)則下,采用不等錯(cuò)誤保護(hù)能力的RCPC可以改善衰落信道中AMR-WB語(yǔ)音的傳輸質(zhì)量。
1 AMR-WB語(yǔ)音編碼器的分類保護(hù)特性
AMR-WB編解碼器是按20ms為一幀進(jìn)行處理的,在每幀中包括了三部分:AMR-WB頭部、AMR-WB輔助信息(模式預(yù)測(cè)4bit、模式要求4bit、CRC校驗(yàn)8bit)、AMR-WB核心幀。AMR-WB核心幀存放的是語(yǔ)音數(shù)據(jù)或舒適噪聲參數(shù)。由編碼器產(chǎn)生的比特順序?yàn)閧s(1),s(2),…,s(K)}, K代表不同的編碼模式所產(chǎn)生的總比特?cái)?shù)。這些比特在輸出編碼器之前將根據(jù)它們的主觀重要性的不同而重新調(diào)整順序,以達(dá)到不等錯(cuò)誤保護(hù)的目的。排序算法為:
其中m=0,1,…,8為編碼模式,tablem(j)的內(nèi)容在G.722.2附件E表格E.5中給出。
重新排序的比特順序變?yōu)閧d(0),d(1),…,d(K)},其重要性隨著K的增大而減小。重新排序的比特流根據(jù)它們的主觀重要性被分成A、B和C三類數(shù)據(jù)。不同模式下三類分配的比特?cái)?shù)如表1所示。
?
A類數(shù)據(jù)中的比特對(duì)錯(cuò)誤非常敏感,其中的錯(cuò)誤都會(huì)嚴(yán)重影響解碼端正常的解碼操作,因此需要采用合適的錯(cuò)誤隱藏方法進(jìn)行解決,A類需要用在幀的輔助信息中加入CRC校驗(yàn)來(lái)對(duì)數(shù)據(jù)進(jìn)行差錯(cuò)校驗(yàn)。8位CRC產(chǎn)生的多項(xiàng)式為
????
B類和C類較A類對(duì)錯(cuò)誤有更強(qiáng)的魯棒性,其中的比特錯(cuò)誤會(huì)降低語(yǔ)音質(zhì)量,但這些類的錯(cuò)誤比特在解碼過(guò)程中不會(huì)影響到語(yǔ)音的可懂度。B類比C類對(duì)錯(cuò)誤更敏感些。
2 AMR-WB編碼器算法
G.722.2中AMR-WB語(yǔ)音編碼采用ACELP算法,編碼模型為碼激勵(lì)線性預(yù)測(cè)CELP(Code Excited Linear Prediction)模型。CELP采用合成分析、碼本搜索過(guò)程、感覺(jué)加權(quán)、矢量量化和線性預(yù)測(cè)技術(shù)[4]。CELP合成模型如圖1所示。
?
在這種模型中,線性預(yù)測(cè)編碼LPC(Linear Prediction Coding)濾波器是一個(gè)16階的短時(shí)濾波器,其傳輸函數(shù)為:
其中,是量化的線性預(yù)測(cè)濾波器系數(shù),基音周期合成濾波器(長(zhǎng)時(shí)合成濾波器)形式為:
其中, T為基音延時(shí),gp為基音增益。CELP采用自適應(yīng)碼本中的一個(gè)矢量來(lái)逼近語(yǔ)音的長(zhǎng)時(shí)基音結(jié)構(gòu);同時(shí)采用固定隨機(jī)碼本中的一個(gè)碼矢量來(lái)逼近語(yǔ)音短時(shí)、長(zhǎng)時(shí)預(yù)測(cè)后的殘差信號(hào)。從兩個(gè)碼本中搜索出最佳碼矢量,乘以各自的最佳增益后相加,得到CELP激勵(lì)信號(hào)源。將激勵(lì)信號(hào)輸入線性預(yù)測(cè)綜合濾波器1/A(z),得到合成語(yǔ)音信號(hào)與原始信號(hào)s(n)的誤差經(jīng)過(guò)感覺(jué)加權(quán)濾波器W(z)得到感覺(jué)加權(quán)誤差e(n),CELP用感覺(jué)加權(quán)的最小均方預(yù)測(cè)誤差作為搜索最佳碼矢量及其幅度的度量準(zhǔn)則,使感覺(jué)加權(quán)誤差最小的碼矢量即是最佳碼矢量。AMR-WB的感覺(jué)加權(quán)濾波器的形式為:
???
??? AMR-WB編解碼器從每一幀中提取LPC濾波器系數(shù)、自適應(yīng)碼本和固定碼本的序號(hào)和增益;對(duì)這些參數(shù)經(jīng)過(guò)編碼后傳輸?shù)浇邮斩?。接收端從接收到的?shù)據(jù)流中提取參數(shù),構(gòu)建濾波器來(lái)重建語(yǔ)音。
3 無(wú)線衰落信道的編碼
??? RCPC是通過(guò)對(duì)標(biāo)準(zhǔn)碼率為碼率的卷積碼進(jìn)行周期性刪余得到不同碼率兼容的卷積碼,由同一個(gè)卷積碼刪余得到的各種碼率的RCPC可以共用一個(gè)Viterbi譯碼器進(jìn)行譯碼[5]。RCPC在通信系統(tǒng)中被廣泛應(yīng)用。本文利用不同速率的RCPC實(shí)現(xiàn)UEP功能,其中1/3卷積碼的生成元為(13,15,17)8,自由距離為10,刪余后1/2卷積碼的生成元為(15,17)8,自由距離為6,二者共用一個(gè)Viterbi譯碼器[6]。圖2為平坦瑞利信道中RCPC硬判決譯碼的性能,橫坐標(biāo)為比特信噪比(Eb/N0),縱坐標(biāo)為誤比特率BER(Bit Error Rate)。
??? 從圖2可知,在相同的信噪比條件下,1/3碼率的RCPC相對(duì)于碼率為1/2的RCPC大約有2dB的編碼增益。本文利用碼率為1/2和1/3的RCPC實(shí)現(xiàn)AMR-WB數(shù)據(jù)的不等錯(cuò)誤保護(hù)。
4 仿真與實(shí)驗(yàn)結(jié)果?
在對(duì)語(yǔ)音文件仿真時(shí),使用ITU-T G.722.2附件D提供的語(yǔ)音測(cè)試序列作為語(yǔ)音原材料。其文件名為tst.inp, 大小為125KB,采用ITU編碼格式。實(shí)驗(yàn)過(guò)程為:AMR-WB編碼器先對(duì)tst.inp進(jìn)行壓縮編碼,輸出碼流經(jīng)過(guò)RCPC信道編碼之后采用BPSK進(jìn)行調(diào)制,調(diào)制后的信號(hào)通過(guò)瑞利衰落信道傳送到接收端;接收端采用與發(fā)送端相反的操作,最終得到以.out為后綴的語(yǔ)音輸出文件。評(píng)判語(yǔ)音質(zhì)量時(shí)采用ITU-T建議P.862.3中給出的語(yǔ)音質(zhì)量感覺(jué)評(píng)價(jià)方法,即PESQ(Perceptual Evaluation of Speech Quality)算法[7]。PESQ得分用于衡量語(yǔ)音質(zhì)量。
AMR-WB編碼器提供了9種不同的編碼模式,對(duì)每種模式都采用RCPC信道編碼,對(duì)AMR-WB核心幀中重要程度最高的A類數(shù)據(jù)使用速率為1/3的信道編碼,對(duì)B類數(shù)據(jù)使用速率為1/2的信道編碼, C類數(shù)據(jù)沒(méi)有編碼比特,因此不予考慮。在不采用UEP時(shí),對(duì)A和B類數(shù)據(jù)統(tǒng)一采用碼率為4/9的RCPC,這樣采用UEP和不采用UEP的編碼方案具有相同的傳輸帶寬。圖3給出了tst.inp語(yǔ)音文件在采用UEP和不采用UEP情況下的部分語(yǔ)音時(shí)域波形圖。從圖中可以看出,在沒(méi)有使用UEP情況下其質(zhì)量相對(duì)要差一些。
對(duì)AMR-WB核心幀采用UEP方案的PESQ得分與沒(méi)有采用UEP方案時(shí)的得分進(jìn)行比較,可以得到圖4的結(jié)果。在相同的編碼模式下, 使用刪余卷積碼對(duì)語(yǔ)音進(jìn)行刪余保護(hù),其PESQ值高于沒(méi)有使用時(shí)的得分。從圖中還可以看出在較低速率編碼模式下兩者的差別更為明顯,說(shuō)明在低速率語(yǔ)音編碼情況下,采用UEP提高語(yǔ)音質(zhì)量的效果更為明顯。
?
本文利用不同碼率的刪余卷積碼對(duì)AMR-WB核心幀中不同重要程度的語(yǔ)音編碼數(shù)據(jù)提供不同的錯(cuò)誤保護(hù)能力。研究結(jié)果表明,在相同傳輸帶寬的條件下,不同錯(cuò)誤保護(hù)可以改善AMR-WB語(yǔ)音質(zhì)量,在低速率語(yǔ)音編碼模式下效果更為明顯。
參考文獻(xiàn)
[1]?ITU-T Recommendation G.722.2: Wideband coding of Speech at around 16kbit/s using Adaptive Multi-Rate
?Wideband(AMR-WB) [S]. ITU, 2003.
[2]?VARGA I, IACOVO R. Standardization of the AMR?wideband speech codec in 3GPP and ITU-T [J]. IEEE?Communications Magazine, 2006,44(5):66-73.
[3]?OJALA P, LAKANIEMI A. Wideband speech codec:?system characteristics, quality advances, and deployment
?strategies [J]. IEEE Communications Magazine,2006,44(5):59-65.
[4]?HUANG Yi Teng, BENESTY J. Audio signal processing?for ext-generation multimedia communication systems [M]. ?Boston, MA, USA: Kluwer Academic Publishers.
[5]?HAGENAUER J. Rate-compatible punctured convolutional?codes(RCPC Codes) and their applications[J].IEEE Trans.Comm, Apr.1988,36(4):389-399.
[6]?SHU LIN, COSTELLO D. Error control coding: fundamentals and applications [M]. Upper Saddle River, NJ,
?USA: Prentice Hall, 2003.
[7]?ITU-T recommendation P. 862.3: Application guide for?objective quality measurement based on recommendations?[S]. ITU, 2007.