《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 一種基于PPO算法的低空基站優(yōu)化模型
一種基于PPO算法的低空基站優(yōu)化模型
電子技術(shù)應(yīng)用
薄云鵬1,2,亢抗3,潘桂新3,汪敏1
1.中國(guó)科學(xué)院云南天文臺(tái);2.中國(guó)科學(xué)院大學(xué);3.中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司廣東省分公司
摘要: 通過(guò)優(yōu)化現(xiàn)有地面網(wǎng)絡(luò)基站來(lái)實(shí)現(xiàn)低空網(wǎng)絡(luò)服務(wù)具有成本低、建設(shè)快等優(yōu)點(diǎn),面對(duì)低空基站優(yōu)化過(guò)程中存在的無(wú)線環(huán)境復(fù)雜、配置參數(shù)多樣、優(yōu)化目標(biāo)互相影響等問(wèn)題,提出了一種基于近端策略優(yōu)化算法的多維低空網(wǎng)絡(luò)基站優(yōu)化模型:通過(guò)射線追蹤技術(shù)計(jì)算不同類型、不同角度基站的低空覆蓋能力,并構(gòu)建支持多目標(biāo)優(yōu)化和多參數(shù)配置的低空網(wǎng)絡(luò)基站優(yōu)化模型,利用PPO算法得到基站配置策略。在仿真環(huán)境中進(jìn)行訓(xùn)練與結(jié)果驗(yàn)證,證明該模型可有效生成基站優(yōu)化方案,且相較于基于A2C方法的模型具有更快的收斂速度和更好的基站優(yōu)化效果。
中圖分類號(hào):TN929.5 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.256278
中文引用格式: 薄云鵬,亢抗,潘桂新,等. 一種基于PPO算法的低空基站優(yōu)化模型[J]. 電子技術(shù)應(yīng)用,2025,51(7):60-64.
英文引用格式: Bo Yunpeng,Kang Kang,Pan Guixin,et al. A low-altitude base station optimization model based on PPO algorithm[J]. Application of Electronic Technique,2025,51(7):60-64.
A low-altitude base station optimization model based on PPO algorithm
Bo Yunpeng1,2,Kang Kang3,Pan Guixin3,Wang Min1
1.Yunnan Observatories, Chinese Academy of Sciences;2.University of Chinese Academy of Sciences;3.China United Network Communications Co., Ltd., Guangdong Branch
Abstract: Optimizing existing terrestrial network base stations to provide low-altitude network services offers advantages such as cost-effectiveness and rapid deployment. Facing challenges in the optimization process of low-altitude base stations, including complex wireless environments, diverse configuration parameters, and interrelated optimization objectives, this paper proposes a multidimensional low-altitude network base station optimization model based on the Proximal Policy Optimization (PPO) algorithm. By employing ray tracing technology, the model calculates the low-altitude coverage capability of base stations with different types and angles. It constructs an optimization model that supports multiple objectives and parameter configurations for low-altitude network base stations. The PPO algorithm is utilized to derive base station configuration strategies, which are then trained and validated in a simulated environment. This demonstrates that the model can effectively generate optimization schemes for base stations and exhibits faster convergence speed and better optimization results compared to models based on the Actor-Critic (A2C) method.
Key words : low-altitude base station;low-altitude communication;PPO;reinforcement learning

引言

近年來(lái),隨著低空經(jīng)濟(jì)的發(fā)展,無(wú)人機(jī)的數(shù)量和應(yīng)用急劇增加,無(wú)人機(jī)的通信需求也隨之快速擴(kuò)張[1]。而傳統(tǒng)的基于地面站的無(wú)人機(jī)通信方式受地面站性能和所用的非授權(quán)頻段的限制,存在易受干擾、通信范圍受限、安全性差等問(wèn)題,難以滿足新應(yīng)用場(chǎng)景的需求,因此,人們認(rèn)為利用蓬勃發(fā)展的5G及以上蜂窩網(wǎng)絡(luò)支持無(wú)人機(jī)通信是最有前途和成本效益的方法[2-6]。

然而,現(xiàn)有的蜂窩網(wǎng)絡(luò)以服務(wù)地面用戶為主[7],據(jù)此開(kāi)展的網(wǎng)絡(luò)規(guī)劃和優(yōu)化也主要面向地面目標(biāo),并且由于天線自身存在零位、旁瓣等問(wèn)題,低空?qǐng)鼍爸行盘?hào)覆蓋不全、鄰區(qū)關(guān)系雜亂、切換頻繁、信號(hào)干擾嚴(yán)重等現(xiàn)象極為突出,使得目前的蜂窩網(wǎng)絡(luò)難以滿足無(wú)人機(jī)低空通信的需要[2, 5, 8]。因此,亟需通過(guò)建立專門的低空網(wǎng)絡(luò)來(lái)開(kāi)展對(duì)低空無(wú)人機(jī)應(yīng)用場(chǎng)景的通信服務(wù)。

當(dāng)前的低空通信組網(wǎng)方案主要有同站空地同頻組網(wǎng)、同站空地異頻組網(wǎng)、異站空地同頻組網(wǎng)、異站空地異頻組網(wǎng)等[2, 9],其中,同站組網(wǎng)方案通過(guò)在地面蜂窩網(wǎng)絡(luò)站址上對(duì)現(xiàn)有設(shè)備進(jìn)行調(diào)整優(yōu)化或新增少量AAU設(shè)備等方式實(shí)現(xiàn)低空網(wǎng)絡(luò)的建立,具有成本低、建設(shè)方便等優(yōu)點(diǎn)。對(duì)于具體的低空網(wǎng)絡(luò)建設(shè)方案,已有很多關(guān)于低空基站的選址[10]以及對(duì)天線的仰角[11-12]的調(diào)整方面的研究,然而上述研究往往只聚焦于站址或仰角等單一配置的調(diào)整,對(duì)于實(shí)際應(yīng)用中通過(guò)優(yōu)化已有地面基站建立低空網(wǎng)絡(luò)過(guò)程中的對(duì)合適基站進(jìn)行選擇以及對(duì)高度、天線角度、設(shè)備選型等多方面配置策略的聯(lián)合設(shè)計(jì)而言,其實(shí)用價(jià)值有限,需要設(shè)計(jì)一種多要素聯(lián)合的低空基站優(yōu)化方法,實(shí)現(xiàn)低成本、高效率的低空網(wǎng)絡(luò)建設(shè)。

傳統(tǒng)的蜂窩網(wǎng)絡(luò)的基站規(guī)劃方法往往根據(jù)經(jīng)驗(yàn)?zāi)P凸烙?jì)信號(hào)的傳播,而已有研究證實(shí),城市環(huán)境內(nèi)的復(fù)雜建筑物的遮擋和反射會(huì)極大地改變空對(duì)地信道特性[13-15],因此統(tǒng)計(jì)性信道模型往往難以準(zhǔn)確描述信道特征。而射線追蹤技術(shù)可通過(guò)計(jì)算無(wú)線電波與場(chǎng)景之間的電磁相互作用,模擬真實(shí)的信號(hào)傳播過(guò)程,具有更高的靈活性[15]。然而射線追蹤作為一種確定性傳播工具,其所需計(jì)算量往往遠(yuǎn)大于統(tǒng)計(jì)性模型,因而在應(yīng)用時(shí)需采取實(shí)時(shí)計(jì)算等措施降低計(jì)算量,提升效率。

強(qiáng)化學(xué)習(xí)是一種通過(guò)智能體與環(huán)境的交互來(lái)積累信息、改進(jìn)策略的機(jī)器學(xué)習(xí)方法,該方法通過(guò)環(huán)境對(duì)智能體動(dòng)作的反饋來(lái)進(jìn)行智能體的訓(xùn)練與學(xué)習(xí),具有無(wú)需提前獲取先驗(yàn)信息的優(yōu)點(diǎn)。對(duì)低空基站優(yōu)化問(wèn)題而言,使用強(qiáng)化學(xué)習(xí)方法可免于提前進(jìn)行各基站不同優(yōu)化方案的覆蓋效果的繁雜計(jì)算,提升優(yōu)化速度,降低計(jì)算量與時(shí)間成本。


本文詳細(xì)內(nèi)容請(qǐng)下載:

http://ihrv.cn/resource/share/2000006596


作者信息:

薄云鵬1,2,亢抗3,潘桂新3,汪敏1

(1.中國(guó)科學(xué)院云南天文臺(tái),云南 昆明 650200;

2.中國(guó)科學(xué)院大學(xué),北京 100049;

3.中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司廣東省分公司,廣東 廣州 510700)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。