分布式無線通信系統(tǒng)(Distributed Wireless Communication System,縮寫為DWCS)采用分布式天線、分布式處理控制、聯(lián)合信號處理等技術(shù),提高了系統(tǒng)頻譜效率和功率效率,增強了系統(tǒng)靈活性和擴展性。
DWCS中采用了網(wǎng)絡(luò)無線電(network radio)的設(shè)計思想。網(wǎng)絡(luò)無線電是通用處理器單元通過光纖互連,構(gòu)成高性能的計算集群,完成系統(tǒng)信號處理及控制功能,與軟件無線電類似,其結(jié)構(gòu)靈活,具有很強的系統(tǒng)擴展性,并具有更快的計算速率、可支持更高的網(wǎng)絡(luò)吞吐量。
軟件無線電系統(tǒng)中的通用處理器通常是DSP/FPGA等專用器件,本文所設(shè)計的軟基站系統(tǒng)中則采用了PC機工作站作為信號處理單元。表1詳細比較DSP/FPGA和PC工作站的優(yōu)缺點。
表1 DSP與PC工作站性能比較
本文結(jié)構(gòu)如下:首先將介紹軟基站的系統(tǒng)結(jié)構(gòu),以及所需要的軟硬件;其次重點探討軟基站設(shè)計及實現(xiàn)中所面臨的難點問題,包括:網(wǎng)絡(luò)吞吐量、子模塊運行速率以及系統(tǒng)運行速率;最后給出實際解決方案和系統(tǒng)實測性能分析。
1.軟基站系統(tǒng)設(shè)計
1.1系統(tǒng)框圖
系統(tǒng)整體框架如圖1,為單發(fā)六收結(jié)構(gòu)。移動臺由視頻終端和發(fā)射機構(gòu)成,基站端由六臺接收機以及PC工作站集群構(gòu)成。攝像頭實時采集圖像,經(jīng)發(fā)射機處理后,送至無線信道;基站六路接收機收到信號后,把信號傳至工作站處理,最后在終端輸出顯示。實際上,該系統(tǒng)對業(yè)務(wù)是透明的,不但可以傳輸視頻,也可以傳輸其他業(yè)務(wù)數(shù)據(jù)。
圖1 系統(tǒng)結(jié)構(gòu)圖
1.2計算集群配置
計算集群由兩臺PC機工作站組成,配置基本相同:cup AMD sempron2500+(64位);內(nèi)存512MB,DDR400;網(wǎng)絡(luò)接口適配器100Mbps;網(wǎng)絡(luò)交換機100Mbps。
軟件平臺是Redhat 9.0,內(nèi)核版本2.4.20-8。為了提高信號處理速度,有些信號處理模塊采用intel的SSE和SSE2指令集優(yōu)化,須用高版本編譯器,本系統(tǒng)使用的gcc3.3.1。
2 關(guān)鍵問題分析及性能測試
2.1 A/D吞吐量瓶頸
射頻信號經(jīng)過A/D采樣之后的數(shù)據(jù)量非常龐大,例如采用8bit,50MHz A/D,采樣之后輸出數(shù)據(jù)率達400Mbps;如果同時處理六路接收信號,則最高速率將達到400Mbps×6=2.4Gbps,現(xiàn)有網(wǎng)絡(luò)中很難支持如此高的數(shù)據(jù)傳輸。
本系統(tǒng)設(shè)計中在A/D采樣數(shù)據(jù)發(fā)送給PC之前,首先把數(shù)據(jù)率降下來。因此,為每一路接收天線配備接收機,用于對A/D采樣之后的信號預(yù)處理,把射頻信號轉(zhuǎn)化成基帶信號,以降低數(shù)據(jù)率。接收機基于FPGA實現(xiàn),其功能包括:數(shù)字下變頻、幀同步、AGC、AFC等。
接收機的引入,把接收信號分兩級處理,解決了A/D吞吐量瓶頸。8bit,50MHzA/D采樣數(shù)據(jù)速率是400Mbps,通過接收機,轉(zhuǎn)變成基帶信號速率降至3.25MB/s. 六路信號總速率最高到19.50MB/s,能夠在現(xiàn)有的網(wǎng)絡(luò)條件中傳輸。
圖2是信號處理模塊的邏輯圖,接收機首先對信號預(yù)處理,做A/D采樣、下變頻、幀同步;而信號處理的其他模塊在計算集群PC工作站中完成。
2.2子模塊吞吐能力優(yōu)化
在上述軟基站結(jié)構(gòu)中,PC工作站承擔(dān)的信號處理模塊包括:信道質(zhì)量估計、單載波頻域均衡、解擾、解交織以及TPC譯碼等。因為PC機的計算能力相對較弱,有可能使某子模塊運算速率過低,影響系統(tǒng)性能,所以設(shè)計時必須優(yōu)化各子模塊的計算吞吐速率。
表2是主要模塊在當(dāng)前系統(tǒng)中能達到的最高速率。為準(zhǔn)確測出峰值,測試時只運行單個模塊。從表中可以得出:以太網(wǎng)接收、信道質(zhì)量估計以及單載波頻域均衡計算速度比較高,能達到12MB/s;TPC譯碼比較慢,只能到3.5MB/s左右??梢灶A(yù)測,當(dāng)各模塊連在一起時,TPC譯碼會成為系統(tǒng)的瓶頸。
表2 各子模塊最高速率(MB/s)
雖然TPC譯碼速率比別的模塊慢,但仍比chip速率1.625MB/s高。每個模塊的速率均比chip速率要高,能滿足設(shè)計需要。
對于速率過低的模塊,有兩種解決方法:
1. 通過改進程序來提高模塊效率,例如,對于數(shù)據(jù)流處理,用奔騰指令集SSE和SSE2進行優(yōu)化。
2. 通過拆分模塊來降低模塊運行時間。將特別耗時的模塊拆分成多個模塊,然后分配到多臺PC機上運算。合理拆分模塊能夠提升模塊運行速度。
2.3系統(tǒng)工作速率
系統(tǒng)的工作速率雖然受限于各子模塊的最高速率,但通常比子模塊速率低。這是因為,各模塊在運行時會搶占CPU、內(nèi)存等有限物理資源;同時,各模塊之間數(shù)據(jù)傳遞以及同步也會降低模塊運行效率。
表3是各模塊一起工作時,測得的系統(tǒng)吞吐量。系統(tǒng)主要包括四個模塊:信道質(zhì)量估計、單載波頻域均衡、TPC譯碼。測試時,將四個模塊按不同組合分別分配到兩臺PC機。其中,PC1、PC2是這兩臺PC機編號。
表3 工作站吞吐量測試
模塊的最佳分配策略:TPC譯碼單獨在一臺PC機上運行,其余模塊都分配到另一臺PC上。這種分配方法能使系統(tǒng)速率達到3.01MB/s。TPC譯碼在所有模塊中計算量最大,占用硬件資源最多,給它單獨分配一臺PC機能盡可能的滿足計算需要,因而能提高系統(tǒng)運行速度。
為了使系統(tǒng)達到最佳速率,調(diào)度模塊時,應(yīng)該為計算比較復(fù)雜的模塊提供盡可能多的資源;相鄰模塊應(yīng)盡量安置在同一PC機內(nèi),減少系統(tǒng)在網(wǎng)絡(luò)上傳遞數(shù)據(jù)帶來的開銷。
總結(jié)與展望本文詳細討論了DWCS軟基站設(shè)計中所面臨的問題,提出了解決方法,并且對設(shè)計系統(tǒng)進行測試,分析系統(tǒng)整體性能,最終得出該系統(tǒng)具有比較高的信號處理速率,能達到3.0MB/s,滿足系統(tǒng)設(shè)計的需要。
本文作者創(chuàng)新點:研究新型無線通信系統(tǒng)DWCS的特性,并首次實現(xiàn)將PC工作站應(yīng)用在DWCS基站中;研究并探討軟基站設(shè)計及實現(xiàn)的關(guān)鍵問題.設(shè)計并實現(xiàn)了一套完整DWCS通信系統(tǒng),并對軟基站系統(tǒng)進行實際性能測試,對DWCS系統(tǒng)的發(fā)展具有比較重要的意義。