摘 要: 結(jié)合礦井的實際環(huán)境討論了井下數(shù)字漏泄移動通信系統(tǒng)中語音編解碼方法的選擇原則;分析了LD-CELP算法的特點和優(yōu)勢,研究了該算法的性能;給出了在TMS320DM643平臺上LD-CELP編解碼方法的具體設(shè)計方案。
關(guān)鍵詞: 井下數(shù)字通信;語音編解碼;LD-CELP;TMS320DM643
國家工信部近年將逐步停止對模擬對講機(jī)型號的核準(zhǔn),并將在幾年內(nèi)完成模擬對講機(jī)到數(shù)字對講機(jī)的過渡。根據(jù)這一規(guī)定及市場的發(fā)展前景可以看出,現(xiàn)有的礦井下模擬漏泄通信系統(tǒng)在未來5~6年后將逐步淘汰,因此開發(fā)先進(jìn)的礦井下數(shù)字漏泄通信系統(tǒng)是現(xiàn)代通信技術(shù)發(fā)展的必然趨勢。而語音通信作為數(shù)字通信的核心部分必然會作為研究的重點,其中選擇適應(yīng)井下復(fù)雜環(huán)境的數(shù)字語音編解碼方法顯得尤為重要。
1 語音編解碼技術(shù)及井下選擇標(biāo)準(zhǔn)
1.1 語音編碼的分類及介紹
語音信號的編碼方法可分為波形編碼、參數(shù)編碼和混合編碼三類。波形編碼自適應(yīng)能力強(qiáng),語音質(zhì)量好,但所需要的編碼速率較高,一般在16 kb/s以上。而參數(shù)編碼以數(shù)學(xué)模型模擬語音信號產(chǎn)生機(jī)制為基礎(chǔ),通過提取信號的特征參數(shù)來編碼,優(yōu)點是編碼速率低,但語音質(zhì)量較差,清晰度不高。混合編碼則是在保留分析合成編碼的技術(shù)基礎(chǔ)上,引進(jìn)了波形編碼準(zhǔn)則去優(yōu)化激勵信號,從而在低碼率上獲得了較高質(zhì)量的合成語音。連續(xù)可變斜率增量調(diào)制(CVSD)是增量調(diào)制的一種改進(jìn)方法。這種方法中信號斜率是根據(jù)碼流中連“1”或連“0”的個數(shù)來檢測,所以又稱為數(shù)字檢測。低時延碼激勵線性預(yù)測編碼(LD-CELP)是G.728語音編碼標(biāo)準(zhǔn)算法,這種算法采用后向自適應(yīng)線性預(yù)測、50階全極點合成濾波、短激勵矢量(5個樣值)等改進(jìn)方法,達(dá)到高質(zhì)量和低時延的目的,總的編碼時延小于2 ms。
1.2 適合井下通信要求的編碼方式
礦井下環(huán)境復(fù)雜,存在著巷道繁多、干擾較大等特點,所以在選擇編碼方式時一定要結(jié)合實際環(huán)境選擇適合井下通信的方法,其原則有:(1)雖然井下通信對語音的清晰度要求不是很高,但井下環(huán)境比較復(fù)雜,巷道距離長,彎道多,噪聲大,所以編碼應(yīng)有較強(qiáng)的抗噪聲干擾和抗誤碼性能;(2)井下帶寬資源有限,所以語音編碼速率在保證話音清晰的前提下應(yīng)盡可能低,以減少在系統(tǒng)帶寬中的占有率;(3)對編譯碼時延要求不是很高,但編譯碼器必須簡單,性價比要高;(4)井下環(huán)境易燃易爆,所以設(shè)備功率要小,必須是本安型的防爆設(shè)備。目前國內(nèi)井下通信系統(tǒng)主要應(yīng)用的數(shù)字語音編碼方式為CVSD編碼,它主要有以下優(yōu)點:原理簡單,硬件要求低,抗誤碼性能強(qiáng)和技術(shù)成熟,具有專屬芯片產(chǎn)品CMX639。但隨著技術(shù)的發(fā)展,現(xiàn)代井下通信系統(tǒng)有了更高的要求,在語音通信的基礎(chǔ)上要求圖像或視頻的通信功能,這樣就要求利用DSP、FPGA等模塊化的嵌入式系統(tǒng)來實現(xiàn),而且要求語音編碼的速率更低,盡可能地不占用寶貴的井下帶寬資源。CVSD在編碼速率方面有著局限性,在16 kb/s以上語音質(zhì)量比較良好,但是在16 kb/s下語音質(zhì)量下降很快,不能適應(yīng)現(xiàn)代井下數(shù)字通信系統(tǒng)的要求,所以尋找一個更加合適的語音編碼方式勢在必行,而作為ITU-T的G.728標(biāo)準(zhǔn)的LD-CELP方法是系統(tǒng)最佳的選擇。
2 LD-CELP原理及實現(xiàn)
LD-CELP被ITU-T定為標(biāo)準(zhǔn)的G.728語音編碼協(xié)議,圖1和圖2是算法的編解碼器原理圖。LD-CELP和CELP(碼本激勵線性預(yù)測)算法一樣利用了合成分析法進(jìn)行碼本搜索,并在此基礎(chǔ)上利用后向自適應(yīng)預(yù)測技術(shù)對短時譜包絡(luò)和增益進(jìn)行預(yù)測,所以能達(dá)到算法延時0.625 ms,一路編解碼延時小于2 ms。編碼過程首先將速率為64 kb/s的A律或者μ律PCM輸入信號轉(zhuǎn)換成均勻量化的PCM信號,接著由5個連續(xù)的語音樣點su(5n),su(5n+1),……su(5n+4)形成一個五維語音矢量。激勵碼本中共有1 024個五維的碼矢量。對于每個輸入語音矢量,編碼器利用合成分析法從碼本中搜索出最佳碼矢量,然后將10 bit的碼本標(biāo)號送出去。線性預(yù)測(LP)系數(shù)是用先前量化過的語音信號來提取和更新的。每4個相鄰的輸入矢量(20個樣點)構(gòu)成一幀,每幀更新一次LP系數(shù);激勵的增益也是利用之前量化激勵信號的增益信息逐矢量地進(jìn)行提取和更新。LD-CELP這種獨特的編碼技術(shù)在16 kb/s速率上編解碼后的語音質(zhì)量在MOS(平均意見分,最大值5分)評分標(biāo)準(zhǔn)中達(dá)到了4.173的高分,基本可以還原原始的語音信號,并且在低于16 kb/s速率下語音質(zhì)量能保持較好的穩(wěn)定狀態(tài)。其優(yōu)良的性能完全適合礦井下數(shù)字漏泄移動通信的要求。
3 硬件設(shè)計
系統(tǒng)采用了SEED-DEC643作為算法實時實現(xiàn)的硬件平臺,以高性能的32 bit定點DSP(TMS320DM643)為主控芯片的DSP系統(tǒng),處理能力達(dá)到了4 800 MIPS,完全滿足運算的需求。芯片上集成了一個多通道音頻串行接口(McASP)外設(shè),具有8根串行數(shù)據(jù)線,由軟件配置輸入和輸出,具有很強(qiáng)的可編程能力,可以配置為多種同步串口標(biāo)準(zhǔn),可以和音頻ADC、DAC,Codec,數(shù)字音頻接口接收器DIR和S/PDIF傳輸物理層器件實現(xiàn)無縫連接,直接與各種器件高速接口。圖3所示為TMS320DM643接口框圖。
以TMS320DM643為核心的聲碼器結(jié)構(gòu)框圖如圖4所示。DEC643開發(fā)板通過XDS510PLUS仿真器與PC機(jī)連接,由PC機(jī)通過CCS(Code Composer Studio)集成開發(fā)環(huán)境進(jìn)行調(diào)試。運行時,語音信號由MIC輸入,經(jīng)A/D轉(zhuǎn)換為數(shù)字信號,通過設(shè)定的串口0進(jìn)入DM643編碼器部分對該語音信號進(jìn)行編碼,編碼后進(jìn)入解碼模塊進(jìn)行解碼,輸出重建語音信號,最后經(jīng)串口1送至D/A轉(zhuǎn)換器輸出至耳機(jī),從而完成編解碼的過程。
4 軟件設(shè)計
軟件設(shè)計主要采用混合編程方法實現(xiàn),在DSP資源配置、通信串口模塊、中斷模塊、濾波器等模塊采用了匯編程序編寫。編碼模塊流程圖和主程序流程圖分別如圖5、圖6所示。主程序首先用GEL文件對DM643進(jìn)行初始化,再初始化McASP模塊,然后打開中斷控制寄存器,允許中斷請求,設(shè)置數(shù)據(jù)接收緩存,進(jìn)入主循環(huán),開始接收、處理和發(fā)送數(shù)據(jù)。在接收過程中不斷檢測接收緩存區(qū),直至緩存區(qū)為空,數(shù)據(jù)接收完畢,將一幀數(shù)據(jù)從中取出,同時緩存區(qū)計數(shù)器清零,開始對接收的語音數(shù)據(jù)進(jìn)行壓縮編碼處理。解碼過程則是編碼的逆過程。重復(fù)上述循環(huán)過程完成對一組語音數(shù)據(jù)的編解碼處理。
利用系統(tǒng)對語音數(shù)據(jù)進(jìn)行采集與分析,對一段男聲錄音“合肥工業(yè)大學(xué)”的原始語音信號和編解碼后的信號的時域波形進(jìn)行比較,如圖7、圖8所示,可以看出,原始錄音人為夾雜了一些噪聲時,波形相對比較尖銳,而在假定信道無噪聲干擾的情況下利用LD-CELP編解碼后的語音信號波形能夠很好地重建原始信號的包絡(luò),可以過濾出原始信號中尖銳的環(huán)境噪聲,并且語音編碼速率得到了很大的降低,實現(xiàn)在低速率下滿足人們對語音可懂度和清晰度的要求,節(jié)約了整個系統(tǒng)的帶寬。
本文通過對LD-CELP算法原理的分析,在TMS320DM643平臺上實現(xiàn)了編解碼的過程,演示了算法的性能。說明了LD-CELP完全可以在數(shù)字通信快速發(fā)展的今天代替目前礦井下常用的CVSD算法,實現(xiàn)更高質(zhì)量的語音通信,并且其在低速率通信下能保持高清晰度的特點,大大節(jié)省了整個漏泄通信系統(tǒng)的帶寬,為以后在DM643平臺上開發(fā)礦井?dāng)?shù)字漏泄移動通信系統(tǒng)中先進(jìn)的視頻通信模塊提供了良好的條件。在下一步的研究中將結(jié)合礦井下復(fù)雜的巷道環(huán)境,在傳輸過程中模擬加入一些礦井中常見的噪聲,進(jìn)一步分析LD-CELP算法在井下特定環(huán)境具有各種干擾的情況下能否適應(yīng)數(shù)字漏泄移動通信系統(tǒng)對語音通信功能的要求。
參考文獻(xiàn)
[1] CCITT. Recommendation G.728.coding of speech at 16 kb/s using low-delay code excited linear prediction.Geneva,1992.
[2] Texas Instruments. TMS320DM643 user′s guide[Z]. 2004.
[3] 張雪英.數(shù)字語音處理及MATLAB仿真[M].北京:電子工業(yè)出版社,2010.
[4] 楊行峻.語音信號數(shù)字處理[M].北京:電子工業(yè)出版社,2007.
[5] SEED-DTK643V1.0實驗手冊.北京合眾達(dá)電子技術(shù)有限公司,2009.