TMS320C54X(以下簡稱'C54X)是TI公司于1996年推出的新一代高性能定點(diǎn)DSP。該系列芯片具有很高的性能價(jià)格比、體積小、功耗低、功能強(qiáng),已成為通信、計(jì)算機(jī)、消費(fèi)類電子產(chǎn)品等領(lǐng)域的重要器件。數(shù)字濾器的設(shè)計(jì)是數(shù)字信號處理領(lǐng)域的一個(gè)重要部分。在用定點(diǎn)DSP器件設(shè)計(jì)數(shù)字濾波器時(shí),一個(gè)重要的問題就是由于硬件字長精度有限,運(yùn)算會出現(xiàn)溢出。IIR濾波器可以用較少的階數(shù)獲得很高的選擇特性,所用的存儲單元少、運(yùn)算次數(shù)少,具經(jīng)濟(jì)、高效的特點(diǎn)。在相位要求不敏感的場合,如語音通信等,很適合用IIR濾波器;但是在有限精度的運(yùn)算中,可能出現(xiàn)不穩(wěn)定現(xiàn)象。因此,有必要討論一下如何在定點(diǎn)的DSP芯片'C54X上實(shí)現(xiàn)擴(kuò)展精度的IIR濾波器。
1 'C54X DSP上擴(kuò)展精度乘法的實(shí)現(xiàn)
'C54X芯片的CP內(nèi)含有2個(gè)40bit的累加器(ACC A和ACC B)、1個(gè)17×17bit乘法器以及1個(gè)40 bit加法器。這就使得該乘法器可以實(shí)現(xiàn)2個(gè)無符號數(shù)、2個(gè)有符號數(shù)或無符號數(shù)和有符號數(shù)的乘法。
累加器ACC A和ACC B存放從ALU或乘法器/加法器單元輸出的數(shù)據(jù),也能輸出到ALU或乘法器/加法器中。累加器包括3部分(見圖1):
?、俦Wo(hù)位(bits 39~32),用來作為計(jì)算的前部留空(headmargin),防止在迭代運(yùn)算(如自相關(guān))中產(chǎn)生溢出;
?、诟呶蛔郑╞its 31~16);
?、鄣臀蛔郑╞its 15~0)。
'C54X芯片內(nèi)部的特點(diǎn),使得擴(kuò)展精度計(jì)算行之有效。其中一個(gè)就是進(jìn)位的處理。算術(shù)邏輯單元ALU執(zhí)行大多數(shù)指令操作,如循環(huán)與移位操作都會影響進(jìn)位。進(jìn)位操作通過調(diào)用ST0,設(shè)置或重設(shè)狀態(tài)寄存器來修改。正常操作中,為了使累加器不至于裝入飽和值,溢出模式應(yīng)該設(shè)置為OVM=0。
'C54x內(nèi)部的2條數(shù)據(jù)總線(CB和DB)允許一些指令在其周期內(nèi)操作32bit操作碼。長字節(jié)操作指令和雙精度加減指令使用了32bit操作數(shù),能夠高效地實(shí)現(xiàn)多精度算術(shù)操作。硬件乘法器能夠?qū)τ蟹柡蜔o符號數(shù)進(jìn)行操作,可以乘2個(gè)有符號數(shù)和2個(gè)無符號數(shù)。這樣,32bit的乘法就能有地進(jìn)行。
2個(gè)32bit整數(shù)的乘法,需要有1次乘法、3次乘法/累加和2次移位運(yùn)算。其結(jié)果是1個(gè)64bit的整數(shù),實(shí)現(xiàn)程序如下(假設(shè)事先已設(shè)好SXM=1,OVM=0)。
數(shù)據(jù)存儲如下:H1,L1存32bit操作數(shù);H2,L2存32bit操作數(shù);R3,R2,R1,R0存64bit乘積
STM #L1,AR1 ;AR2→L1
STM #L2,AR3 ;AR3→L2
LD *AR2,T ;T=L1
MPYU *AR3+,A ;A=L1*L2
STL A,@R0 ;保存R0
LD A,-16,A ;A=A>>16
MACSU *AR2+,*AR3-,A;A=L1*L2>>16+L1*H2+H1*L2
MACSU *AR3+,*AR2,A;A=L1*L2>>
;16+L1*H2+H1*L2+H1*L2
STL A,@R1 ;保存R1
LD A,-16,A ;A=A>>16
MAC *AR2,*AR3,A ;A=(L1*L2+H1*H2)>>16+H1*H2
STL A,@R2 ;保存R2
STH A,@R3 ;保存R3
2 IIR濾波器的基本原理及編程實(shí)現(xiàn)
N級IIR濾波器的脈沖傳遞數(shù)表達(dá)式為
它的差分方程表達(dá)式為
由上式可見,y(n)由2部分構(gòu)成;第1部分是一個(gè)對x(n)的M節(jié)延時(shí)結(jié)構(gòu)。每節(jié)延時(shí)后加權(quán)相加,也就是一個(gè)橫向結(jié)構(gòu)網(wǎng)絡(luò)。第2部分也是一個(gè)N節(jié)延時(shí)的橫向網(wǎng)絡(luò)結(jié)構(gòu),不過它是對y(n)延時(shí),因此也是個(gè)反饋網(wǎng)絡(luò)。
數(shù)字濾波器運(yùn)算結(jié)構(gòu)的不同,將會影響系統(tǒng)運(yùn)算的精度、誤差、速度和經(jīng)濟(jì)性等性能指標(biāo)。在一般情況下,都要求使用盡可能少的常數(shù)乘法器和延遲器來實(shí)現(xiàn)系統(tǒng),并要求運(yùn)算誤差盡可能小。然而,這些要求有時(shí)是互相矛盾的,例如,為了獲得個(gè)有較小運(yùn)算誤差的結(jié)構(gòu),使用的乘法器和延遲器的數(shù)目往往并不是最少的。IIR濾波器有以下幾種基本網(wǎng)絡(luò)結(jié)構(gòu):直接I型、直接II型、級聯(lián)型和并聯(lián)型。各種結(jié)構(gòu)都有其優(yōu)缺點(diǎn)。鑒于級聯(lián)型常用于均衡器中,而且優(yōu)點(diǎn)比較突出,所以,以級聯(lián)型為便詳細(xì)介紹其算法實(shí)現(xiàn)。
IIR濾波器在采用級聯(lián)實(shí)現(xiàn)的,將傳遞函數(shù)分解為二階傳遞函數(shù)的乘積,即
H(z)=H1(Z)H2(Z)…HM(Z)
每一級的子濾波器Hk(z)常取以下的形式:
一般級聯(lián)實(shí)現(xiàn)都采用直接II型結(jié)構(gòu)作為子濾波器的網(wǎng)絡(luò)結(jié)構(gòu)。使用直接II型的子濾波器的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
二級級聯(lián)IIR濾波器的主要實(shí)現(xiàn)程序如下:
?。?**已初始化了PMST=FFA0H,ST1=2300H,
;SWWSR=0,OVM=1,F(xiàn)RCT=1,SXM=1
STM #X,AR1
STM #Y,AR2
STM #d,AR3 ;AR3:d(n),d(n-1),d(n-2)
RPT A,#5 ;初始化d(n),d(n-1),d(n-2)=0
STL A,*AR3+
STM #2,AR0 ;初始化Arn是地址偏移量為常數(shù)
INLOOP:
STM #d+5,AR3 ;AR3:d(n),d(n-1),d(n-2)
STM #table,AR4 ;AR4:IIR的系數(shù)A2,A1,B2,B1,B0
PORTR 100H,*AR1 ;從端口讀入數(shù)據(jù)
LD *AR1,7,A
STM #N-1,BRC ;計(jì)算IIR的節(jié)數(shù)N
RPT ELOOP
LOOP:
********反饋通道**************
MAC *AR4+,*AR3-,A ;input+d(n-2)*A2
MAC *AR4,*AR3,A-;input+d(n-2)*A2+d(n-1)*A1
MAC *AR4+,*AR3-,A
STH A,*AR3+0;d(n)=input+d(n-2)*A2+d(n-1)*A1
********前向通道*************
MPY *AR4+,*AR3-,A ;d(n-2)*B2
MAC *AR4+,*AR3,A;d(n-2)*B2+d(n-1)*B1
DELAY *AR3- ;d(n-2)=d(n-1)
MAC *AR4+,*AR3,A;d(n-2)*B2+d(n-1)*B1+d(n)*B0
DELAY *AR3-;d(n-1)=d(n)
ELOOP:
STH A,*AR2;output=d(n-2)*B2+d(n-1)*B1+d(n)*B0
PORTW *AR2,200h ;將結(jié)果寫入文件中
BINLOOP ;計(jì)算下一個(gè)輸出
3 均衡器用擴(kuò)展精度IIR濾波器的編程實(shí)現(xiàn)
IIR濾波器的一個(gè)典型應(yīng)用,就是用作均衡器。在級聯(lián)型的結(jié)構(gòu)中,可以用極點(diǎn)和零點(diǎn)配對的方法,把共軛的零、極點(diǎn)或相近的零、極點(diǎn)組合在一個(gè)二階濾波器中,這對于降低有限字長系數(shù)的敏感程度十分有效。另外,交換級聯(lián)次序也是減少有限字長效應(yīng)的一個(gè)行之有效的方法。本文給出用二階級聯(lián)擴(kuò)展精度IIR濾波器實(shí)現(xiàn)時(shí)域均衡器的程序。
本程序中使用了一個(gè)循環(huán)緩沖區(qū)用來存放數(shù)據(jù),要求計(jì)算出的系數(shù)均循在-12~12dB。為了防止溢出,使最大增益為4,通常要結(jié)果右移2bit(相當(dāng)于結(jié)果除4)。這樣就范圍變成了-24~0dB(因?yàn)?0log(1/4)=-12dB)。每個(gè)濾波器的通帶頻率集中在某個(gè)比較感興趣的頻率段。濾波器系數(shù)的絕對值可能比1大。當(dāng)用Q15格式表示時(shí),必須除2的整次冪來滿足限定的范圍[-1,1~2 -15]。所以系數(shù)在存入存儲器之前要右移,那么與此對應(yīng)的在存入每個(gè)濾波器輸出系數(shù)時(shí)要左移。32×32bit直接II型的級聯(lián)結(jié)構(gòu)運(yùn)算量如下:周期數(shù)為29,RAM為16字。寄存器數(shù)為6。
系數(shù)緩沖區(qū)和數(shù)據(jù)緩沖區(qū)的長度不同,且僅數(shù)據(jù)緩沖區(qū)是循環(huán)緩沖。32×32bit級聯(lián)結(jié)構(gòu)的存儲器結(jié)構(gòu)如圖3所示。