中文引用格式: 李凌云,李肖克,陳奕釗,等. 基于IP包拆分重組技術(shù)的混合語音壓縮編碼算法研究[J]. 電子技術(shù)應(yīng)用,2025,51(2):70-74.
英文引用格式: Li Lingyun,Li Xiaoke,Chen Yizhao,et al. Research on hybird speech compression coding algorithm based on IP packet splitting and reassembling technology[J]. Application of Electronic Technique,2025,51(2):70-74.
引言
語音壓縮編碼是指為提高通信網(wǎng)中的信息傳輸效率及實(shí)現(xiàn)語音的高效存儲,對編碼后的數(shù)字語音進(jìn)行壓縮的技術(shù)。由于現(xiàn)代通信網(wǎng)對傳輸帶寬、數(shù)據(jù)保密性等各種特殊場景的需要,低速率語音壓縮編碼技術(shù)因其占用帶寬少、抗干擾、保密性強(qiáng)及系統(tǒng)容量高等特點(diǎn)而成為語音研究領(lǐng)域中的一個(gè)重要課題。
在某特殊通信網(wǎng)業(yè)務(wù)系統(tǒng)中,既要在平均通信速率僅有10 kb/s的信道上傳輸1路基于IP的語音傳輸VoIP語音,又要求話音編碼標(biāo)準(zhǔn)采用G.729標(biāo)準(zhǔn)。傳統(tǒng)G.729標(biāo)準(zhǔn)話音數(shù)據(jù)需要34.4 kb/s的傳輸帶寬,僅采用一種語音壓縮編碼技術(shù)已明顯不能滿足要求。
研究人員提出一種基于混合激勵(lì)線性預(yù)測(Mixed Excited Linear Prediction,MELP)的0.6 kb/s的聲碼器算法,將多個(gè)連續(xù)語音幀合成一個(gè)超級幀,充分利用參數(shù)的幀間相關(guān)性進(jìn)行聯(lián)合量化,通過仿真驗(yàn)證了該算法可得到一個(gè)可懂度較高、清晰度和自然度較好的合成語音[1-5]。常亮等提出一種基于正弦激勵(lì)線性預(yù)測(Sinusoidal Excitation Linear Prediction,SELP)的0.56 kb/s多幀聯(lián)合分模式矢量量化算法,獲得接近電話質(zhì)量的語音[6]。Huang等提出一種矩陣量化方案和低速率的聲碼器算法,在低速率通信鏈路中獲得了高質(zhì)量語音[7]。Ozaydin等針對窄帶通信鏈路中語音信號特征,基于共軛結(jié)構(gòu)代數(shù)碼激勵(lì)線性預(yù)測編碼(Conjugate Structure-Algebraic Code Excited Linear Prediction,CS-ACELP)設(shè)計(jì)了一種低復(fù)雜度、高效的語音激活檢測(Voice Activity Detection,VAD)算法,該算法的實(shí)現(xiàn)將語音的平均通信速率約降至4 kb/s[8]。上述語音壓縮編碼算法的速率雖都達(dá)到了4.6 kb/s以下,甚至達(dá)到了0.56 kb/s,具有一定的借鑒意義,但上述算法并未使用G.729語音編碼標(biāo)準(zhǔn)。
鑒于此,本文提出一種基于IP包拆分重組技術(shù)的混合語音壓縮編碼算法,在使用G.729標(biāo)準(zhǔn)的基礎(chǔ)上,利用改進(jìn)的多帶激勵(lì)(Advanced Multi-Band Excitation,AMBE)語音編碼技術(shù)對語音數(shù)據(jù)進(jìn)行二次壓縮解壓,結(jié)合IP包拆分重組技術(shù),使語音數(shù)據(jù)傳輸比特率達(dá)到5.7 kb/s,有效避免開銷數(shù)據(jù)消耗過多信道帶寬,提高語音有效載荷的傳輸效率和質(zhì)量。
本文詳細(xì)內(nèi)容請下載:
http://ihrv.cn/resource/share/2000006328
作者信息:
李凌云,李肖克,陳奕釗,王國法,王輝
(中國電子科技集團(tuán)公司第三十四研究所,廣西 桂林 541004)