文獻標識碼: A
文章編號: 0258-7998(2012)10-0106-03
PCCCTurbo碼又稱為并行級聯(lián)碼(Parallel Concatenated Convolutional Code),在TD-LTE系統(tǒng)發(fā)送端編碼過程中引入隨機交織器,充分考慮Shannon編碼定理而獲得接近理論極限的性能[1]。故在接收端可以采用一種軟輸入軟輸出迭代譯碼算法,充分利用譯碼輸出的軟信息來逼近最大似然譯碼性能[2]。TD-LTE系統(tǒng)要求高速數(shù)據(jù)業(yè)務,傳輸數(shù)據(jù)業(yè)務量大,而軟迭代譯碼的計算復雜度隨著數(shù)據(jù)量的增加而快速增大。目前Turbo譯碼器中的分量譯碼器的實現(xiàn)算法有Log-Map算法和Max-Log-Map算法。前者能獲得最好的譯碼性能,但是其實現(xiàn)復雜度過高;后者對其進行改進,但是實現(xiàn)復雜度仍然很高。本文在Max-Log-Map算法的基礎上進行改進,提出一種簡化的Log-Map算法,該算法在滿足系統(tǒng)性能要求的前提下,大大降低了實現(xiàn)復雜度。
TMS320C64x最初主要是為移動通信基站的信號處理而推出的超級處理芯片,該芯片屬于高速定點DSP,最高時鐘頻率為1 GHz,處理性能達8 000 MIPS,比傳統(tǒng)DSPs要快一個數(shù)量級,因此在測試儀表的開發(fā)領域有廣闊的應用前景[3]。該系列DSP最主要的特點是在體系結構上采用了甚長指令集VLIW(Very Long Instruction Word),由一個超長的機器指令字來驅(qū)動內(nèi)部的多個功能單元。由于每條指令的字段之間相互獨立,故可單周期發(fā)射多條指令,從而實現(xiàn)更高的指令級并行效率。該系列DSP芯片的大容量、高運算能力等優(yōu)點使其在無線基站、終端等場合廣泛應用,特別是運算精度能滿足測試儀表的開發(fā)條件。所以本文重點研究Turbo譯碼算法在TMS320C64x上的軟件實現(xiàn)。
1 傳統(tǒng)的Turbo譯碼算法
針對Turbo譯碼,目前的軟輸入軟輸出迭代譯碼算法都是基于BCJR算法的推導過程,用于Turbo譯碼的MAP譯碼器就是求解下面的似然信息[4]。
導過程可以看出,本文所提的簡化算法的計算復雜度性能明顯優(yōu)于Max-Log-Map算法。
3 DSP實現(xiàn)及測試性能分析
3.1本文簡化算法的DSP實現(xiàn)
輸入到Turbo譯碼模塊的是解子塊交織后的三路數(shù)據(jù),且以軟信息的形式存放在內(nèi)存當中(每個軟信息占據(jù)8 bit的內(nèi)存空間)。具體函數(shù)調(diào)用如表1所示。
(2)迭代譯碼:將組裝得到的rec_s1和初始化為全零的L_a1調(diào)用Log-Map子函數(shù)計算得到該譯碼器的輸出對數(shù)似然比L_ma1,并對其進行交織處理得到L_a2,然后將rec_s2和L_a2調(diào)用Log-Map子函數(shù)計算得到第二個譯碼器的輸出對數(shù)似然比L_ma2,再將其進行解交織處理得到L_a1。判斷是否達到總的迭代次數(shù),若未達到預設的迭代次數(shù),則繼續(xù)進行該步驟;否則轉至(3)。
(3)譯碼判決:將迭代之后的對數(shù)似然信息進行判決,大于0則判為1;小于0則判為0。
3.2 CCS3.3環(huán)境下性能分析
在進行DSP軟件設計時,需要對程序進行優(yōu)化,盡量減少或者消除程序中的“NOP”指令,特別是循環(huán)體內(nèi)的“NOP”指令。通過在CCS3.3上進行程序的仿真運行,從中頻接收數(shù)據(jù),統(tǒng)計得到各種情況下譯碼過程的執(zhí)行結果,如表2所示。
表2僅列舉了幾種典型的數(shù)據(jù)長度,且不失一般性,總體性能基本不會受輸入數(shù)據(jù)長度的約束。通過分析可以看出,在相同的譯碼輸出長度的情況下,處理時間的耗費量與迭代次數(shù)是正相關的,迭代次數(shù)越大,譯碼性能越好,但處理時延越長;在相同的譯碼迭代次數(shù)的情況下,根據(jù)標準規(guī)定的傳輸塊大小與調(diào)制階數(shù)有關(本文僅以兩種不同調(diào)制方式下的傳輸塊大小為例),16 QAM調(diào)制方式下的處理時間耗費明顯高于QPSK調(diào)制方式,這是由于16 QAM用于處理大傳輸塊,占用的內(nèi)存空間也相應地增加。TMS320C64x芯片的主頻為1 GHz,一個指令周期耗時1 ns,故本文提出的譯碼算法DSP實現(xiàn)可以達到一定的譯碼速率,且誤比特率相當?shù)?,滿足TD-LTE綜合測試系統(tǒng)的性能要求。
本文從Turbo譯碼理論出發(fā),為適合TD-LTE綜合測試系統(tǒng)的傳輸數(shù)據(jù)業(yè)務量大且譯碼時延特性要求高的特點,針對傳統(tǒng)Turbo譯碼算法實現(xiàn)復雜度高的缺陷,提出一種簡化的Turbo譯碼算法。通過Matlab鏈路級仿真比較,所提簡化Turbo譯碼算法保證了良好的譯碼性能,同時對所提簡化算法在TMS320C64xDSP中進行實現(xiàn)。從譯碼程序運行的結果來看,該算法具有較低的誤碼率和較高的譯碼運行速率,能夠滿足TD-LTE系統(tǒng)的性能需求。由于其實現(xiàn)具有可行性和高效性,該實現(xiàn)方案已應用于TD-LTE無線綜合測試儀器的開發(fā)當中,效果良好。
參考文獻
[1] (美)林舒,科斯特洛.差錯控制編碼(原書第二版)[M].晏堅,何元智等,譯.北京:機械工業(yè)出版社,2004:515- 543.
[2] BERROU C, GLAVIEUX A, THITIMAJSHIMA P. Near shannon limit error-correcting coding and decoding: Turbo code[C]. in Proc. IEEE International Conference Communications, 1993:1064-1070.
[3] Texas Instruments Incorporated.TMS320C6000系列DSP編程工具與指南[M].田黎育,何佩琨,朱夢宇,譯.北京:清華大學出版社,2006:32-50
[4] 陳發(fā)堂,李小文,王丹,等.移動通信接收機設計理論與實現(xiàn)[M].北京:科學出版社,2011:121-135.
[5] LEE S J, SHANBHAG N R. Area-efficient high-thrughput MAP Decoder Architectures[J]. IEEE Transaction on Very Large Scale Integration(VLSI) Systems,2005,13(8):921-931.
[6] 冉靜, 廖艷, 鄭建宏. Turbo譯碼算法研究及其性能分析[J].重慶郵電學院學報,2001,13(3):17-21.
[7] 3GPP TS 36.212 v9.0.0 Evolved Universal Terrestrial Radio Access (E-UTRA) Multiplexing and channel coding (Release 9)[S]. 2009-12:9-18.