《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 設(shè)計(jì)應(yīng)用 > AMBE-2000TM語(yǔ)音壓縮編碼電路分析
AMBE-2000TM語(yǔ)音壓縮編碼電路分析
摘要: AMBE-2000TM語(yǔ)音壓縮編碼電路分析,1引言語(yǔ)音壓縮編碼技術(shù)一直是在盡可能低的數(shù)碼率下獲得盡可能好的合成語(yǔ)音質(zhì)量的矛盾中發(fā)展的。數(shù)碼率實(shí)質(zhì)上反映的是頻帶寬度,降低數(shù)碼率實(shí)質(zhì)上就是壓縮頻帶寬度。
Abstract:
Key words :

1 引言

語(yǔ)音壓縮編碼技術(shù)一直是在盡可能低的數(shù)碼率下獲得盡可能好的合成語(yǔ)音質(zhì)量的矛盾中發(fā)展的。數(shù)碼率實(shí)質(zhì)上反映的是頻帶寬度,降低數(shù)碼率實(shí)質(zhì)上就是壓縮頻帶寬度。近10年來(lái),固定電話和移動(dòng)通信高速發(fā)展,頻率資源變得愈加寶貴,信道利用率成為一項(xiàng)關(guān)鍵因素,這促使語(yǔ)音壓縮技術(shù),即語(yǔ)音編碼技術(shù)不斷發(fā)展。在有線通信及移動(dòng)通信、衛(wèi)星通信和掌上電腦的語(yǔ)音傳送應(yīng)用中,語(yǔ)音編碼依舊扮演著十分重要的角色。
基于多帶激勵(lì)(MBE)算法,1997年,美國(guó)數(shù)字語(yǔ)音系統(tǒng)公司(DVSI)研制出先進(jìn)的多帶激勵(lì)(AMBE-Advanced MBE)語(yǔ)音雙工編解碼芯片AMBE-1000TM,AMBE算法是標(biāo)準(zhǔn)MBE的改進(jìn)和補(bǔ)充。隨后又推出AMBE-2000TM型語(yǔ)音壓縮碼電路。該壓縮技術(shù)已被證明優(yōu)于CELP,RELP,VSELP,MELP,ECELP,MP-MLQ,LPC-10及其他壓縮技術(shù)。該語(yǔ)音電路能應(yīng)用于包括數(shù)字移動(dòng)通信系統(tǒng)在內(nèi)的許多領(lǐng)域,如衛(wèi)星通信、保密通信、語(yǔ)音多路技術(shù)、語(yǔ)音郵件、多媒體、IP電話等。

2 多帶激勵(lì)編碼的原理

美國(guó)麻省理工學(xué)院(MIT)的D.W.Griffin博士提出的多帶激勵(lì)(MBE)語(yǔ)音編碼方案突破了二元激勵(lì)的局限性,是一個(gè)不用預(yù)測(cè)殘差的完全的參數(shù)語(yǔ)音編碼器,在2.0kb/s~4.8kb/s速率內(nèi)能夠合成質(zhì)量比傳統(tǒng)聲碼器好得多的語(yǔ)音,并且具有較好的自然度和容忍環(huán)境噪聲的能力,是目前這一速率范圍內(nèi)的一種較理想的編碼算法。

2.1 MBE的基本原理

多帶激勵(lì)的基本原理如圖1所示,將語(yǔ)音譜按各基音諧波頻率分成若干個(gè)帶,對(duì)各帶信號(hào)分別進(jìn)行清濁音判決。總的激勵(lì)信號(hào)由各帶激勵(lì)信號(hào)相加構(gòu)成。對(duì)于濁音帶用以基音周期為間隔的脈沖序列譜作為激勵(lì)信號(hào)譜;對(duì)于清音帶采用白噪聲譜作為激勵(lì)信號(hào)譜,最后將各帶信號(hào)相加,形成全帶激勵(lì)信號(hào)。激勵(lì)信號(hào)通過(guò)時(shí)變數(shù)字濾波器,確定各諧波帶的相對(duì)幅度和相位,將激勵(lì)譜映射為語(yǔ)音譜。這種方案能將合成語(yǔ)音與原始語(yǔ)音在頻譜的細(xì)致結(jié)構(gòu)上擬合得很好,更加符合實(shí)際語(yǔ)音的特性,因而能夠獲得較高的自然度。
 



2.2 AMBE的語(yǔ)音壓縮算法

AMBE是在MBE基礎(chǔ)上的改進(jìn)和補(bǔ)充,基本算法是先將輸入的每幀160個(gè)數(shù)字話音取樣,分成交迭的段,經(jīng)模型分析后得出該幀的模型參數(shù)。編碼器先進(jìn)行V/U判別,將其分成交迭的8個(gè)段;再對(duì)每個(gè)段進(jìn)行模型分析,得到模型參數(shù),然后量化編碼,最后加上前向糾錯(cuò)碼(FEC),以2.0kb/s~9.6kb/s的碼率發(fā)送。解碼器將接收到的比特流進(jìn)行相應(yīng)的糾錯(cuò)解碼,將重構(gòu)模型參數(shù),再利用這些參數(shù)進(jìn)行合成,恢復(fù)出語(yǔ)音。

3 AMBE-2000TM電路簡(jiǎn)介

3.1 電路優(yōu)點(diǎn)

1)優(yōu)異的語(yǔ)音質(zhì)量;2)低造價(jià),低功耗,緊湊的引腳100 TQFP型封裝;3)無(wú)需外部存儲(chǔ)器;4)較強(qiáng)的抗干擾能力;5)支持插入前向糾錯(cuò)碼的可變速率(2.0kb/s~9.6kb/s);6)全雙工實(shí)時(shí)處理;7)語(yǔ)音激活探測(cè)(VAD)/舒適背景噪音插入;8)雙音多頻(DTMF)探測(cè)和生成;9)回音抵消。

3.2 基本工作原理

該電路可以被視為兩個(gè)獨(dú)立的部分即編碼器和解碼器。編碼器接收8kHz話音數(shù)據(jù)流(16位線性、8位A率、8位μ率)并以所希望的碼率輸出數(shù)據(jù)流到傳輸信道上,相反,解碼器接收從傳輸信道上傳送的數(shù)據(jù)流合成出8kHz話音數(shù)據(jù)流。其編碼器與解碼器的接口時(shí)序是完全異步的。基本工作原理如圖2所示。
 



3.3 工作模式及其幀格式

3.3.1 工作模式

AMBE-2000TM不同于AMBE-1000TM,AMBE-2000TM只有串行接口模式,沒(méi)有并行接口模式。

AMBE-2000TM有四種工作模式:主幀格式、主非幀格式、從幀格式和從非幀格式。這四種工作模式都可以用軟件編程和硬件引腳設(shè)置來(lái)獲得。

在從模式下,AMBE-2000TM的編碼器輸出壓縮后的數(shù)據(jù)流所需的選通信號(hào)CHAN_TX_STRB由外部時(shí)鐘源提供。在主模式下,CHAN_TX_STRB由內(nèi)部時(shí)鐘源提供。

在正常工作中,編碼器要每20ms輸出一幀數(shù)據(jù),而解碼器需要接收處理一幀數(shù)據(jù),對(duì)于編碼器和解碼器都需要有一些數(shù)據(jù)格式,主要的目的是為編碼時(shí)提供一定的校正信息。采用幀格式模式時(shí),編碼器輸出的數(shù)據(jù)都是已知的固定幀格式,在該模式下有一些狀態(tài)標(biāo)志信息,用于控制目的和同步,并用于解碼器解碼。采用非幀格式時(shí),編碼器的輸出數(shù)據(jù)沒(méi)有固定的格式,其同步和控制的狀態(tài)信息比特?cái)?shù)據(jù)插入語(yǔ)音編碼比特流中,它們一起被視為連續(xù)的語(yǔ)音數(shù)據(jù)流,因此,該模式的一個(gè)優(yōu)點(diǎn)就是在信道上不用為傳幀頭而增加額外的帶寬。缺點(diǎn)是解碼器為了能在正確地合成語(yǔ)音波形之前獲得與數(shù)據(jù)流同步,需要接收完10組~12組語(yǔ)音數(shù)據(jù)幀

3.3.2 幀格式工作模式下數(shù)據(jù)的幀格式

數(shù)據(jù)幀格式分為輸入幀格式和輸出幀格式。

1)輸入幀格式

輸入格式如表1所示,可以看出,Word0是固定的0x13EC,起同步作用。Word1控電源模式并包含幀丟失和舒適噪音插入信息。Word2~Word6用以調(diào)節(jié)碼率(2.0kb/s~9.6kb/s)。Word7~Word9為未用字,全為"0"。Wordl0為雙音多頻的控制信息。WoM11含有語(yǔ)音激活探測(cè)、休眠狀態(tài)、回音消除等控制信息。word 12~word 23是真正的話音數(shù)據(jù)(40 bit~192bit)。

2)輸出幀格式

輸出格式如表2所示,輸出幀格式與輸入幀格式基本相同,只是將Word7作為位錯(cuò)誤率信息字,用以報(bào)告位錯(cuò)誤信息。Word8用于報(bào)告軟件決定距離信息。Word9用于報(bào)告最近解碼幀探測(cè)到的位錯(cuò)誤數(shù)。
 



4 AMBE-2000TM在系統(tǒng)中的應(yīng)用

4.1 A/D-D/A接口的選擇

從模擬語(yǔ)音信號(hào)到AMBE-2000TM的接口是A/D及D/A轉(zhuǎn)換器,其選擇很重要,將影響系統(tǒng)語(yǔ)音的質(zhì)量,可以是標(biāo)準(zhǔn)的8位/4率或A率壓擴(kuò)量化的PCM信號(hào),也可以是16位線性量化的PCM信號(hào),使用16位線性量化的PCM編碼器能獲得更好的語(yǔ)音效果。本系統(tǒng)采用Analog Devices公司的AD73311AR,它是16位線性量化PCM編解碼器,采樣率為32kHz,可同時(shí)進(jìn)行A/D轉(zhuǎn)換和D/A轉(zhuǎn)換。

4.2 AMBE-2000TM的傳輸信道接口

AMBE-2000TM的輸出數(shù)據(jù)在信道中傳輸?shù)倪^(guò)程如圖3所示。
 



從圖3可以清楚地看到,從編碼器輸出的一幀數(shù)據(jù)并不全部送到信道上傳給接收方的解碼器,而是在本地將前192bit的數(shù)據(jù)幀頭抽取掉,只發(fā)送后面的192個(gè)語(yǔ)音數(shù)據(jù)比特,到達(dá)接收端后,再由系統(tǒng)完成在這192bit的前面加上數(shù)據(jù)幀頭的工作,組成一幀完整的數(shù)據(jù)幀后送給接收端的解碼器進(jìn)行解碼。必須注意的是,語(yǔ)音數(shù)據(jù)在信道上傳輸時(shí)必須加上系統(tǒng)幀頭,否則無(wú)法在接收端實(shí)現(xiàn)同步。此外,當(dāng)碼率為9600b/s時(shí),這192bit才全部為有效的壓縮語(yǔ)音數(shù)據(jù),當(dāng)?shù)陀? 600b/s時(shí),只有一部分為有效壓縮語(yǔ)音數(shù)據(jù),其余的補(bǔ)"0",這些"0"仍需通過(guò)信道傳輸給接收方的解碼器進(jìn)行解碼。

4.3 系統(tǒng)設(shè)計(jì)

本系統(tǒng)采用AD73311AR實(shí)現(xiàn)模/數(shù)、數(shù)/模轉(zhuǎn)換,用xilinx公司的FPGA實(shí)現(xiàn)對(duì)AMBE-2000TM的數(shù)據(jù)幀頭的抽取和合成的控制處理。如上所述,AMBE-2000TM的一幀數(shù)據(jù)只將語(yǔ)音數(shù)據(jù)和加上的系統(tǒng)幀頭送入信道,發(fā)送給接收端,在接收端收到的語(yǔ)音數(shù)據(jù)必須去掉系統(tǒng)幀頭再加上數(shù)據(jù)幀頭后才能送給解碼器進(jìn)行解碼。FPGA完成幀頭的控制功能。整個(gè)系統(tǒng)框圖如圖4所示。在本系統(tǒng)中,AMBE-2000TM是設(shè)置為主幀格式模式。在整個(gè)系統(tǒng)工作之前,要對(duì)AMBE-2000TM復(fù)位,低電平有效,復(fù)位時(shí)間不少于50μs,在復(fù)位信號(hào)出現(xiàn)上升沿后95ms,電路才開(kāi)始處理AD73311的PCM信號(hào)。信道的傳輸率為4 kb/s。
 



5 仿真結(jié)果

圖5是從AMBE-2000TM出來(lái)的壓縮數(shù)據(jù)的幀頭,192位幀頭只仿真了前面的16位,以后的全設(shè)為"0"。圖6是送給AMBE-2000TM解碼的數(shù)據(jù)(只顯示了幀頭)。圖7是去掉幀頭只加上系統(tǒng)幀頭Oxl3EC作為同步用的信道數(shù)據(jù),為了方便,仿真時(shí)將有效數(shù)據(jù)設(shè)定為"1001......"(一幀有效數(shù)據(jù)共40bit)。傳輸率為4kb/s.
 


6 結(jié)束語(yǔ)

本系統(tǒng)進(jìn)行了30個(gè)小時(shí)的長(zhǎng)時(shí)間實(shí)驗(yàn),一直保持著良好的工作狀態(tài)。在4kb/s的傳輸率下,保持了較高的語(yǔ)音質(zhì)量,并具有較強(qiáng)的語(yǔ)音識(shí)別能力。該系統(tǒng)的語(yǔ)音信號(hào)經(jīng)過(guò)調(diào)制后可用于無(wú)線通信,我們用FSK進(jìn)行調(diào)制傳輸取得了滿意的語(yǔ)音效果。

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。