青青河边草免费观看电视剧,久久人人做人人妻人人玩精品VA

ILBC編碼算法及其在VOIP中的應(yīng)用

日期： 2008-05-08

作者：郭廷廷, 李敬

關(guān)鍵詞： 語音質(zhì)量編解碼矢量量化網(wǎng)絡(luò)環(huán)境激勵(lì)信號

　　摘　要: VOIP正在成為熱門的應(yīng)用領(lǐng)域，語音質(zhì)量" title="語音質(zhì)量">語音質(zhì)量的提高是其難點(diǎn)之一。ILBC算法是一種基于CELP(Code Excited Linear Predictive Coding)的新的低比特率語音編碼算法，其優(yōu)異的語音質(zhì)量、突出的長時(shí)預(yù)測方法^[1]及丟包掩蔽^[2](PLC)技術(shù)，很好地解決了互聯(lián)網(wǎng)上傳輸語音的問題。詳細(xì)探討了ILBC的實(shí)現(xiàn)原理，對其關(guān)鍵技術(shù)進(jìn)行了較深入的分析，給出了實(shí)驗(yàn)結(jié)論，并對其應(yīng)用作了一些展望。
　　關(guān)鍵詞： ILBC(Internet Low Bit Vate Codec) VOIP(Voice Over IP) PLC 丟包掩蔽動(dòng)態(tài)碼本

　　隨著互聯(lián)網(wǎng)的迅速發(fā)展，人們對通過互聯(lián)網(wǎng)進(jìn)行實(shí)時(shí)語音、視頻傳輸?shù)囊笤桨l(fā)強(qiáng)烈，VOIP正是在這一應(yīng)用背景下誕生的一門新技術(shù)，它把數(shù)字語音編碼技術(shù)與分組交換網(wǎng)相結(jié)合，提供實(shí)時(shí)語音及其相關(guān)服務(wù)，該技術(shù)要求占用盡可能小的網(wǎng)絡(luò)帶寬并擁有良好的語音質(zhì)量。由于當(dāng)前網(wǎng)絡(luò)環(huán)境" title="網(wǎng)絡(luò)環(huán)境">網(wǎng)絡(luò)環(huán)境的特點(diǎn)，丟包現(xiàn)象不可避免，以往的低比特率編碼標(biāo)準(zhǔn)雖然可以解決帶寬問題，但丟包時(shí)語音質(zhì)量不能保證。因而，需要新的語音編碼算法來滿足這一要求。
1 ILBC簡介
　　ILBC是由Global IP Sound公司提出的一種專為包交換網(wǎng)絡(luò)通信設(shè)計(jì)的編解碼" title="編解碼">編解碼，優(yōu)于目前流行的G.729A、G.723.1，對丟包進(jìn)行了特殊處理，既使在丟包率相當(dāng)高的網(wǎng)絡(luò)環(huán)境下，仍可獲得非常清晰的語音效果。
　　ILBC是一種適用于窄帶網(wǎng)絡(luò)的編碼算法。根據(jù)網(wǎng)絡(luò)帶寬的不同，ILBC提供兩種編碼的格式，如表1。該算法使用了長時(shí)的預(yù)測技術(shù)和幀獨(dú)立編碼方法，使其非常適合在存在丟包的網(wǎng)絡(luò)環(huán)境中傳播。

2 ILBC算法的原理
2.1 ILBC編碼
　　ILBC本質(zhì)上是一種基于幀的線性預(yù)測編碼方法，是對CELP(碼激勵(lì)線性預(yù)測編碼)的一種發(fā)展，其獨(dú)有的動(dòng)態(tài)碼本更新技術(shù)、語音加強(qiáng)算法和丟包掩蔽技術(shù)使其在VOIP中應(yīng)用時(shí)有更好的性能。對于每一個(gè)含有160/240(20ms/30ms) 樣點(diǎn)的輸入幀，ILBC算法將進(jìn)行以下主要操作：
　　(1) 把該幀分為4/6 個(gè)子幀,每子幀40個(gè)樣點(diǎn)。對30ms的幀，進(jìn)行兩組10階的LPC分析，得到相應(yīng)的LPC系數(shù)；對于20ms的幀，進(jìn)行一次10階LPC分析。
　　(2)每次分析得到的LPC系數(shù)將轉(zhuǎn)化為LSF(線譜對)參數(shù)，并對LSF系數(shù)進(jìn)行量化，內(nèi)插以得到各個(gè)子幀的LSF系數(shù)；隨后，由各子幀的LSF系數(shù)得到各子幀對應(yīng)的分析器，對各個(gè)子幀進(jìn)行線性預(yù)測，計(jì)算各子幀的殘差。
　　(3)從殘差中找到兩個(gè)能量最大的連續(xù)子幀，然后把能量值較小的首23/22個(gè)樣點(diǎn)(30ms/20ms)或尾23/22樣點(diǎn)從連續(xù)子幀中去除，剩余的57/58個(gè)被選定為本次處理的初始狀態(tài)。對于濁音語音，這樣的選取方式將至少包含一個(gè)基音脈沖。
　　(4)對初始狀態(tài)進(jìn)行基于DPCM的標(biāo)量量化，量化結(jié)果將作為編碼輸出的一部分。與此同時(shí)，初始狀態(tài)被存入碼本存儲(chǔ)區(qū)，以構(gòu)成動(dòng)態(tài)碼本的初始值，用于對本幀的剩余樣點(diǎn)進(jìn)行矢量量化" title="矢量量化">矢量量化。
　　(5)對于剩余的殘差，矢量量化將按下面順序進(jìn)行：(a)包含有初始狀態(tài)的兩個(gè)連續(xù)子幀中剩余的23/22個(gè)樣點(diǎn);(b) 時(shí)間軸上處于初始狀態(tài)之后的各個(gè)子幀; (c)時(shí)間軸上在初始狀態(tài)之前的各個(gè)子幀。對于此矢量量化，每次搜索碼本的范圍是動(dòng)態(tài)碼本，其中存儲(chǔ)了已經(jīng)被解碼的對象，并隨著最新的解碼結(jié)果，該動(dòng)態(tài)碼本被更新。
　　(6)對編碼結(jié)果進(jìn)行封包處理。
　　ILBC的編碼的框圖如圖1所示。

2.2 ILBC解碼
　　ILBC是一種運(yùn)用了分析合成方法的編解碼算法，解碼部分的運(yùn)算量相對要小一些，使其在功能不強(qiáng)的客戶端的實(shí)時(shí)解碼成為可能。
　　解碼的主要過程如下:
　　(1)解包，參數(shù)提取。
　　(2)從得到的LSF參數(shù)進(jìn)行內(nèi)插，并轉(zhuǎn)化各個(gè)子幀的LPC系數(shù)，以便進(jìn)行合成操作。
　　(3) 對初始狀態(tài)進(jìn)行解碼，解碼結(jié)果一方面作為激勵(lì)信號" title="激勵(lì)信號">激勵(lì)信號暫存，另一方面存入碼本存儲(chǔ)區(qū)，以構(gòu)成動(dòng)態(tài)碼本的初始值。
　　(4) 對剩余的子幀部分，按照與編碼相同的次序進(jìn)行殘差解碼，并用解碼結(jié)果更新動(dòng)態(tài)碼本，重復(fù)(4)直到所有子幀完成譯碼。
　　(5) 對于解碼得到的殘差信號，進(jìn)行語音增強(qiáng)的操作。該語音增強(qiáng)采用了條件限制的增強(qiáng)方法。
　　(6) 進(jìn)行語音合成，形成解碼后的語音。
　　(7) 高通濾波，以消除合成后的低頻語音。
　　ILBC解碼的流程圖如圖2所示。

2.3 ILBC的比特流定義
　　對于20 ms的幀，共使用了304個(gè)比特來表示編碼后的語音信號，被封裝在38個(gè)字節(jié)中；對于30ms的幀，共使用了400個(gè)比特，封裝在50個(gè)字節(jié)中。在封裝的過程中，按照數(shù)據(jù)對傳輸誤差的敏感程度不同，這些比特被分成三類，第一類代表了最敏感的數(shù)據(jù)^[3]。表2 列出了ILBC編碼的比特流分配情況。

3 ILBC的關(guān)鍵技術(shù)
　　與以往的低比特率語音編解碼算法相比，ILBC除了采用經(jīng)典的線性預(yù)測分析法、LPC系數(shù)到LSF系數(shù)相互轉(zhuǎn)換、分裂矢量量化LSF參數(shù)和多級形狀-增益量化^[4]殘差外，主要有下面特殊的方法。
　　(1) 基于初始狀態(tài)的動(dòng)態(tài)碼本的選取和更新。
　　ILBC利用了基于初始狀態(tài)的動(dòng)態(tài)碼本的更新方法，把最新的解碼結(jié)果加入碼本，以取代較老的碼矢。通過這種算法，可以較為方便地生成碼本，同時(shí)也提供了很好的碼本預(yù)測能力。
　　(2) 幀間獨(dú)立的長時(shí)預(yù)測方法，在此基礎(chǔ)上的PLC(丟包掩蔽)技術(shù)。
　　經(jīng)典的CELP方法是利用以往的激勵(lì)信號來對自適應(yīng)碼本進(jìn)行更新的，這樣的方法在分組交換網(wǎng)中有下面問題：
　?、偃绻^去的信號丟失或在傳輸過程中被污染，解碼用的碼本就會(huì)與編碼時(shí)不同，將導(dǎo)致解碼語音質(zhì)量變差；
　?、谠谡Z音建立階段，解碼端的自適應(yīng)碼本并不能很好地描述基音周期，導(dǎo)致解碼語音建立時(shí)間加長。
　　ILBC采用了基于初始狀態(tài)的解碼方法，初始碼本是從初始狀態(tài)中得到的，通常都會(huì)包含至少一個(gè)基音脈沖，因而建立時(shí)間較快；同時(shí)，從初始狀態(tài)出發(fā)，既有時(shí)間上前向的預(yù)測，也有向后的預(yù)測，因而體現(xiàn)了長時(shí)預(yù)測的概念，配合PLC技術(shù)，即使出現(xiàn)丟幀，解碼語音質(zhì)量也不會(huì)有明顯下降。
　　PLC技術(shù)的基本原則是：解碼端若收到正確的幀，則計(jì)算出的LPC系數(shù)和激勵(lì)碼本被存儲(chǔ); 若丟幀，則使用上一個(gè)正確幀中的激勵(lì)信號，利用基音同步重復(fù)的方法得到本幀解碼信號。
　　(3) 利用有條件限制的優(yōu)化算法^[3]加強(qiáng)殘差語音。
　　該算法的主要思想是對要加強(qiáng)的殘差語音塊，尋找其前3個(gè)塊和后3個(gè)塊，用這6個(gè)塊的線性組合逼近當(dāng)前待加強(qiáng)的塊。計(jì)算待加強(qiáng)塊和逼近塊的均方誤差。若誤差足夠小，就把逼近塊作為加強(qiáng)塊；否則，加強(qiáng)塊為待加強(qiáng)塊和逼近塊的線性組合。

4 實(shí)驗(yàn)結(jié)果與性能評測
　　圖3是Dynstat公司在具有丟包情況的網(wǎng)絡(luò)環(huán)境下對ILBC、G729.A、G723.1幾種算法進(jìn)行測試后的MOS(平均意見得分)對比圖，可以看出ILBC編碼的語音質(zhì)量整體高于其余兩種編碼，尤其是當(dāng)丟包率較高時(shí)，MOS得分遠(yuǎn)高于另外兩種編碼。
　　為了對ILBC在丟幀時(shí)仍有良好語音質(zhì)量做出解釋，進(jìn)行了以下實(shí)驗(yàn):
　　(1)在短時(shí)間內(nèi)對有丟包時(shí)的解碼片斷做分析，如圖4所示。實(shí)驗(yàn)得出，僅有一幀丟失時(shí)，語音的損壞基本上不會(huì)被聽者察覺，當(dāng)出現(xiàn)連續(xù)兩幀以上丟失時(shí)，才會(huì)被察覺。在文獻(xiàn)^[2]中有ILBC與G.729.A的丟幀對比。

　　(2)初始狀態(tài)編碼是ILBC中的關(guān)鍵步驟，應(yīng)用了標(biāo)量編碼的方式。為使編碼更有效，實(shí)現(xiàn)時(shí)，先用一個(gè)全通濾波器將殘差的動(dòng)態(tài)范圍壓縮，解碼時(shí)再通過逆濾波恢復(fù)。圖5是對某一幀語音的殘差分析的結(jié)果，經(jīng)過多幀測試發(fā)現(xiàn)，該技術(shù)使殘差的動(dòng)態(tài)范圍減小了約1/3。
　　由于實(shí)時(shí)傳輸?shù)男枰?，算法的時(shí)間復(fù)雜度成為實(shí)際系統(tǒng)實(shí)現(xiàn)時(shí)重要的考慮因素，在PC機(jī)(Celeron 2.7G, 512M內(nèi)存)上對用ANSI-C實(shí)現(xiàn)的ILBC浮點(diǎn)算法^[1]進(jìn)行運(yùn)算量統(tǒng)計(jì)，可以得到表3的結(jié)果，可以得到①解碼的復(fù)雜度較小，是一種非對稱的編碼方案；②編碼部分碼本搜索占用了最長的時(shí)間，成為算法優(yōu)化時(shí)要考慮的關(guān)鍵部分。

　　ILBC算法優(yōu)異的語音質(zhì)量及良好的丟包掩蔽技術(shù)，使其在VOIP中的應(yīng)用前景非常廣闊。2002年2月,ILBC是IETF 接受的關(guān)于語音/音頻編解碼的第一個(gè)標(biāo)準(zhǔn)。2004年4月在關(guān)于多媒體終端適配器和媒體網(wǎng)關(guān)分布的CableLabsPacketCable1.1 Audio/Video編解碼規(guī)范中，被指定為強(qiáng)制的編解碼算法。軟件與系統(tǒng)方面, Skype、Hostip、Pandora Networks和Pingtel Instant都對該算法進(jìn)行支持，DSP及專用集成電路方面，TI 已經(jīng)推出相應(yīng)的定點(diǎn)DSP實(shí)現(xiàn)方案，AudioCodes已有專用芯片支持。
　　可以預(yù)計(jì)，不久的將來, ILBC將在VOIP中得到更加廣泛的應(yīng)用。
參考文獻(xiàn)
1 Andersen S V. Internet low bit rate codec. IETF internet-draft, 2002
2 Andersen S V. ILBC- A linear predictive coder with robustness to packetlosses. Global IP Sound
3 Klein WB. Enhancement of coded speech by constrained optimization. In: proc IEEE Speech Coding Workshop, 2002,submitted for publication
4 楊行峻, 唐昆. 語音信號數(shù)字處理. 北京：電子工業(yè)出版社，1995

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

ILBC編碼算法及其在VOIP中的應(yīng)用

日期： 2008-05-08

作者：郭廷廷, 李 敬

相關(guān)內(nèi)容

作者：郭廷廷, 李敬