123,123,123

基于CMMB系统的同步设计与实现

日期： 2009-06-05

作者：毛剑慧, 黑勇，乔树山

關(guān)鍵詞： 乘法器频偏估计实部多径同步信号

　　摘要： 同步實現(xiàn)對于OFDM基帶接收系統(tǒng)而言至關(guān)重要，對于面向移動多媒體的基帶芯片設(shè)計，同步的性能和低功耗設(shè)計更是很大的挑戰(zhàn)。結(jié)合中國移動多媒體廣播系統(tǒng)（CMMB）幀結(jié)構(gòu)、調(diào)制及其傳輸信道的特征，提出了適用于多徑衰落信道、高載波頻偏環(huán)境下的OFDM系統(tǒng)時間和載波頻率同步方案，并在硬件實現(xiàn)中從算法優(yōu)化、硬件構(gòu)架設(shè)計兩個方面進(jìn)一步降低同步功耗。
　　關(guān)鍵詞： CMMB； OFDM；同步；低功耗

　　中國的CMMB(中國移動多媒體廣播)規(guī)范以中國的自有技術(shù)STiMi為基礎(chǔ)，現(xiàn)已成為中國手機(jī)電視的行業(yè)標(biāo)準(zhǔn)。CMMB系統(tǒng)幀結(jié)構(gòu)^[1]如圖1所示，物理層信號為1 S/s，劃分為40個時隙，每個時隙的長度為25 ms，包括一個信標(biāo)和53個OFDM符號，其中信標(biāo)由發(fā)射機(jī)標(biāo)識信號以及兩個相同的同步信號序列組成。該系統(tǒng)載波頻率為2.6 GHz，帶寬10 MHz，每個OFDM符號包括4 096個子載波，其中包含82個連續(xù)導(dǎo)頻信號和384個離散導(dǎo)頻信號。CMMB系統(tǒng)物理層調(diào)制方式采用正交頻分復(fù)用(OFDM)結(jié)構(gòu)，OFDM調(diào)制利用許多并行的、傳輸?shù)退俾蕯?shù)據(jù)的子載波來實現(xiàn)高速率的通信，它具有能有效抵抗信道的頻率選擇性衰落和脈沖噪聲的優(yōu)點(diǎn)。然而，OFDM系統(tǒng)對于多普勒(Doppler)頻移以及載波振蕩器的不穩(wěn)定引起的頻率偏移十分敏感，由于頻率偏移將破壞OFDM系統(tǒng)子載波之間的正交性，引起載波間干擾（ICI），并且，隨著頻率偏移的增加，誤碼率（BER）性能惡化加劇。此外，多徑衰落也將使傳輸信號發(fā)生畸變，從而惡化系統(tǒng)性能。因此，系統(tǒng)的時間同步、頻率同步成為CMMB數(shù)字接收機(jī)設(shè)計的關(guān)鍵。

　　由于基帶芯片面向移動手持終端，因此在同步的算法選擇和硬件框架結(jié)構(gòu)上必須考慮功耗的影響，應(yīng)該盡量選擇低功耗算法和低復(fù)雜度硬件結(jié)構(gòu)；本文在同步設(shè)計中為了進(jìn)一步降低同步功耗，將優(yōu)化傳統(tǒng)算法和硬件結(jié)構(gòu)。
1 CMMB系統(tǒng)同步設(shè)計概述
　　本系統(tǒng)設(shè)計的幀同步及頻率同步均在時域中完成^[2]，算法利用信標(biāo)中的兩個相同長度的同步序列的相關(guān)性。由于系統(tǒng)的載波頻率較高，接收端與發(fā)射端晶振微小的不匹配將引入較大的頻率偏差，這會影響同步的性能，因此在設(shè)計幀同步時使用無數(shù)據(jù)輔助(粗同步)+數(shù)據(jù)輔助（精同步）的方案^[3]，同步結(jié)構(gòu)算法框圖如圖2所示。

　　(1) 利用無數(shù)據(jù)輔助的方法，利用信標(biāo)中兩個相同重復(fù)的2 048點(diǎn)OFDM同步信號之間的相關(guān)性，以4 096點(diǎn)為窗長，窗內(nèi)的前2 048點(diǎn)與后2 048點(diǎn)做相關(guān)運(yùn)算，搜索峰值可以求出OFDM符號開始的位置，并且利用所求出的峰值可以求出小數(shù)倍載波間隔頻率的頻偏估計；
　　(2) 在時間域中完成小數(shù)倍頻偏^[4]和整數(shù)倍頻偏的估計并通過NCO進(jìn)行補(bǔ)償；
　　(3) 利用本地已知的2 048點(diǎn)同步信號，與接收到的數(shù)據(jù)在小范圍(一個保護(hù)間隔長度)搜索滑窗求相關(guān)，用閾值方法找到多徑的第一徑，從而找到FFT窗的精確位置。
2 CMMB系統(tǒng)粗同步設(shè)計
2.1 常規(guī)滑窗相關(guān)硬件結(jié)構(gòu)
　　在CMMB系統(tǒng)中，需要同步信號間卷積相關(guān)：
　　
　　這樣需要一塊2 048×26(實部虛部各13位存儲在同一地址中)的RAM存儲接收到的信號，以延遲2 048后和新進(jìn)入數(shù)據(jù)做相關(guān)運(yùn)算；此外還需要一塊2 048×40的RAM存儲卷積后結(jié)果的實部和虛部以進(jìn)行相關(guān)運(yùn)算結(jié)果的累加運(yùn)算，前2 048個相關(guān)運(yùn)算結(jié)果存儲在RAM中，第2 049個相關(guān)運(yùn)算結(jié)果存儲在第0地址前，先將和減去第0地址中原有的相關(guān)運(yùn)算結(jié)果，再加上新的相關(guān)運(yùn)算結(jié)果，并將新的相關(guān)運(yùn)算結(jié)果存儲在第0地址中^[5]，RAM的其他地址讀寫以此類推，即:
　　

　　new即新進(jìn)入的相關(guān)運(yùn)算結(jié)果。
　　RTL設(shè)計完后采用0.13 μm SMIC庫進(jìn)行Design Compiler綜合，工作時鐘為80 MHz，綜合結(jié)果如表1所示。

　　由表1中的結(jié)果可以看出,RAM讀寫功耗占整個粗同步模塊的功耗的比例很大，因此需要用新的算法以減少粗同步模塊RAM的大小，從而減小系統(tǒng)粗同步的功耗。
2.2 改進(jìn)的粗同步硬件結(jié)構(gòu)
　　參考文獻(xiàn)[5]提出了設(shè)計一個低通濾波器代替圖3中相關(guān)運(yùn)算結(jié)果的累加運(yùn)算部分，見圖4所示。

　　該算法用一個乘法器代替了傳統(tǒng)算法中的RAM，系數(shù)w經(jīng)仿真選為1－2^-9。仿真以估計位置和理想位置的距離作為評價標(biāo)準(zhǔn)，即(delta=pos-pos_ideal)，系統(tǒng)仿真如圖5所示，仿真環(huán)境：典型動態(tài)多徑，0.001%載波頻偏，150 Hz多普勒頻移。

　　由圖5可以看出，當(dāng)信噪比下降到6 dB以下，即delta<0，粗同步位置進(jìn)入symbol內(nèi)，引起ISI干擾，會造成系統(tǒng)性能的惡化，因此同步失?。划?dāng)信噪比大于6 dB時同步位置在CP內(nèi)，雖然該算法與傳統(tǒng)累加運(yùn)算算法相比，誤差比較大，但是完全可以容忍，不會造成系統(tǒng)惡化（最終誤碼率在10^－6以下）。RTL設(shè)計中，傳統(tǒng)方法的2 048×40的RAM由兩個20×10的乘法器替代，完成后RTL設(shè)計后采用0.13 μm SMIC庫進(jìn)行Design Compiler綜合，工作時鐘為80 MHz，綜合結(jié)果如表2所示。對比表2和表1，可以得出結(jié)論：改進(jìn)的算法硬件比傳統(tǒng)的累加結(jié)構(gòu)的硬件的功耗降低3.2 mW，這樣可以降低系統(tǒng)在粗同步時所消耗的功耗，這對于面向手持設(shè)備的基帶芯片而言是極其重要的。

3 CMMB系統(tǒng)整數(shù)倍頻偏估計和精同步硬件設(shè)計
　　由于整數(shù)倍頻偏估計和精同步都需要用到本地已知同步序列，因此將這兩個算法放入同一硬件模塊中，復(fù)用存儲本地已知同步序列的ROM。
3.1 整數(shù)倍頻偏估計
　　CMMB系統(tǒng)整數(shù)倍頻偏估計在時域中完成，其算法主要應(yīng)用同步序列：
　　

　　但是在實際硬件設(shè)計中，需要計算e^-j2πmfk，可以說給硬件設(shè)計帶來了很大的麻煩，尤其是K在0～2 048中變化，這樣每完成一次m的計算，需要計算ee^-j2πmfk共2048次，需要耗費(fèi)大量功耗與時間，本文設(shè)計該硬件模塊時，將計算公式打開，首先假設(shè)m固定：

　　這樣可以發(fā)現(xiàn)，式中惟一的指數(shù)為e^-j2πmfk，而不再隨著k的變化而變化了，這就是該模塊設(shè)計的核心思想。
　　從公式中可以得出所需要的硬件代價：
　　(1)RASP2048X26M16，RAM用來存儲收到的同步信號的實部和虛部；
　　(2)DROM2048X24M8，ROM用來存儲已知的同步序列實部和虛部；
　　(3)e^-j2πmfk值在該模塊設(shè)計中采用查找表的方式，用ROM存儲e^-j2πmfk(m=-max,…max),因為e^-j2πmfk的值比較小，所以需要較大位寬進(jìn)行存儲,實部和虛部分別用22 bit表示，本模塊設(shè)計中max=5，因此需要DROM64X44M8(0.13 μm SMIC庫ROM地址只能是2ⁿ，該DROM可以擴(kuò)展存儲到－32～32掃頻范圍);
　　(4)另外還需要開銷乘法器：2個13×12的乘法器和2個22×22的乘法器分別計算實部和虛部。
硬件結(jié)構(gòu)如圖6所示。

　　插入兩個寄存器，進(jìn)行兩級pipeline結(jié)構(gòu)，即13×12乘法器和22×22乘法器流水運(yùn)算，從而加快整數(shù)倍頻偏估計的速度并且減小硬件功耗。
3.2 精同步硬件實現(xiàn)
　　精同步的算法即如何尋找多徑的第一徑。其算法是利用完成頻偏補(bǔ)償后的同步序列和已知同步序列相關(guān)求峰值的思想。
　　假設(shè)粗同步誤差為2，即同步位置偏移實際位置兩個子載波，仿真環(huán)境為典型動態(tài)多徑信道，利用精同步算法可以得到圖7所示的峰值。

　　可以清楚地看出多徑間徑的關(guān)系，本文算法和硬件實現(xiàn)時將搜索范圍定為[-100,100]，在該范圍內(nèi)所有相關(guān)值求平均后，用64*mean作為閾值進(jìn)行判斷，可以找出位置2處的峰值，從而找到幀起始的精確位置。
在硬件設(shè)計上，該模塊與整數(shù)倍頻偏估計算法共用一個模塊，該模塊中有兩塊RAM：
　　(1)RASP2272X26:該RAM首先使用前2 048 X26存儲粗同步和小數(shù)倍頻偏補(bǔ)償后的同步序列的實部和虛部，該序列與本地已知同步序列相關(guān)求出整數(shù)倍頻偏估計；
　　完成整數(shù)倍頻偏補(bǔ)償后，將使用2 248 X26存儲粗同步序列位置前后100子載波范圍內(nèi)的數(shù)據(jù)的實部和虛部，存儲后該序列以2 048為窗與本地已知序列求相關(guān)運(yùn)算。
　　(2)RASP224X24M16:該RAM用來存儲精同步相關(guān)運(yùn)算后的201個相關(guān)值的能量，用來求均值和判斷精同步位置。
此外模塊中還有兩塊ROM:
　　(1)DROM64X44M8:存儲e^-j2πmfk，用來計算整數(shù)倍頻偏估計，這在上一小節(jié)中有詳細(xì)說明，該方法可以降低RASP2272X26的讀寫次數(shù)，提高整數(shù)倍頻偏估計的速度。
　　(2)DROM2048X24M8: 存儲本地已知同步序列。
　　此外乘法器也共用13×12乘法器和22×22乘法器。
　　完成RTL設(shè)計后采用0.13 μm SMIC庫進(jìn)行Design Compiler綜合，工作時鐘為80 MHz，綜合結(jié)果如表3所示。
4 NCO硬件設(shè)計
　　NCO硬件為了補(bǔ)償載波頻偏給系統(tǒng)帶來的惡化，該模塊硬件主要由16級流水的cordic算法^[6]實現(xiàn),綜合結(jié)果見表4。

　　本文提出了適用于多徑衰落信道、高載波頻偏環(huán)境下的CMMB基帶接收系統(tǒng)時間和載波頻率同步方案，并在硬件實現(xiàn)中從算法優(yōu)化、硬件構(gòu)架設(shè)計兩個方面進(jìn)一步降低同步硬件功耗。

參考文獻(xiàn)
[1]?CMMB廣播信道幀結(jié)構(gòu)、信道編碼和調(diào)制.
[2] ZHAO Xiang, LIM M S. A novel cyclic-shifted preamble scheme for symbol synchronization based on OFDM?WLANs.ICACT,2006:919-922.
[3] FORT A, WEIJERS J W, DERUDDER V, et al. A?performance and complexity comparison of auto-correlation?and across-correlation for OFDM burst synchronization.?ICASSP 2003: 341-344.
[4]?YU Zh.H.,CHEN Kai,HUANG Yu Mei, et al. OFDM?timing and frequency offset estimation based on repeated?training sequence. Wireless Communications, Networking?and Mobile Computing, 2007. WiCom 2007. International?Conference on Volume,Issue,21-25 Sept. 2007:264-266.
[5] ZHENG Hua Rong,TANG Jue, SHEN Bo. Low-complexity
?joint synchronization of symbol timing and carrier frequency
?for OFDM systems. IEEE Transaction on Consumer
?Electronics,2006,52:317-320.
[6] ?DAWID H, MEYR H. VLSI implementation of the cordic
?algorithm using redundant arithmetic.1992 IEEE:1089-1092.

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

基于CMMB系统的同步设计与实现

日期： 2009-06-05

作者：毛剑慧, 黑 勇， 乔树山

相關(guān)內(nèi)容

作者：毛剑慧, 黑勇，乔树山