尤物92午夜福利视频,午夜AV影院久久中文无码

一种基于PPO算法的低空基站优化模型

电子技术应用

薄云鹏1，2，亢抗3，潘桂新3，汪敏1

1.中国科学院云南天文台；2.中国科学院大学；3.中国联合网络通信有限公司广东省分公司

摘要： 通过优化现有地面网络基站来实现低空网络服务具有成本低、建设快等优点，面对低空基站优化过程中存在的无线环境复杂、配置参数多样、优化目标互相影响等问题，提出了一种基于近端策略优化算法的多维低空网络基站优化模型：通过射线追踪技术计算不同类型、不同角度基站的低空覆盖能力，并构建支持多目标优化和多参数配置的低空网络基站优化模型，利用PPO算法得到基站配置策略。在仿真环境中进行训练与结果验证，证明该模型可有效生成基站优化方案，且相较于基于A2C方法的模型具有更快的收敛速度和更好的基站优化效果。

關(guān)鍵詞： 低空基站低空通信近端策略优化强化学习

中圖分類(lèi)號(hào)：TN929.5 文獻(xiàn)標(biāo)志碼：A DOI: 10.16157/j.issn.0258-7998.256278
中文引用格式： 薄云鵬，亢抗，潘桂新，等. 一種基于PPO算法的低空基站優(yōu)化模型[J]. 電子技術(shù)應(yīng)用，2025，51(7)：60-64.
英文引用格式： Bo Yunpeng，Kang Kang，Pan Guixin，et al. A low-altitude base station optimization model based on PPO algorithm[J]. Application of Electronic Technique，2025，51(7)：60-64.

A low-altitude base station optimization model based on PPO algorithm

Bo Yunpeng1，2，Kang Kang3，Pan Guixin3，Wang Min1

1.Yunnan Observatories， Chinese Academy of Sciences；2.University of Chinese Academy of Sciences；3.China United Network Communications Co.， Ltd.， Guangdong Branch

Abstract： Optimizing existing terrestrial network base stations to provide low-altitude network services offers advantages such as cost-effectiveness and rapid deployment. Facing challenges in the optimization process of low-altitude base stations, including complex wireless environments, diverse configuration parameters, and interrelated optimization objectives, this paper proposes a multidimensional low-altitude network base station optimization model based on the Proximal Policy Optimization (PPO) algorithm. By employing ray tracing technology, the model calculates the low-altitude coverage capability of base stations with different types and angles. It constructs an optimization model that supports multiple objectives and parameter configurations for low-altitude network base stations. The PPO algorithm is utilized to derive base station configuration strategies, which are then trained and validated in a simulated environment. This demonstrates that the model can effectively generate optimization schemes for base stations and exhibits faster convergence speed and better optimization results compared to models based on the Actor-Critic (A2C) method.

Key words : low-altitude base station；low-altitude communication；PPO；reinforcement learning

引言

近年來(lái)，隨著低空經(jīng)濟(jì)的發(fā)展，無(wú)人機(jī)的數(shù)量和應(yīng)用急劇增加，無(wú)人機(jī)的通信需求也隨之快速擴(kuò)張[1]。而傳統(tǒng)的基于地面站的無(wú)人機(jī)通信方式受地面站性能和所用的非授權(quán)頻段的限制，存在易受干擾、通信范圍受限、安全性差等問(wèn)題，難以滿足新應(yīng)用場(chǎng)景的需求，因此，人們認(rèn)為利用蓬勃發(fā)展的5G及以上蜂窩網(wǎng)絡(luò)支持無(wú)人機(jī)通信是最有前途和成本效益的方法[2-6]。

然而，現(xiàn)有的蜂窩網(wǎng)絡(luò)以服務(wù)地面用戶為主[7]，據(jù)此開(kāi)展的網(wǎng)絡(luò)規(guī)劃和優(yōu)化也主要面向地面目標(biāo)，并且由于天線自身存在零位、旁瓣等問(wèn)題，低空?qǐng)鼍爸行盘?hào)覆蓋不全、鄰區(qū)關(guān)系雜亂、切換頻繁、信號(hào)干擾嚴(yán)重等現(xiàn)象極為突出，使得目前的蜂窩網(wǎng)絡(luò)難以滿足無(wú)人機(jī)低空通信的需要[2, 5, 8]。因此，亟需通過(guò)建立專(zhuān)門(mén)的低空網(wǎng)絡(luò)來(lái)開(kāi)展對(duì)低空無(wú)人機(jī)應(yīng)用場(chǎng)景的通信服務(wù)。

當(dāng)前的低空通信組網(wǎng)方案主要有同站空地同頻組網(wǎng)、同站空地異頻組網(wǎng)、異站空地同頻組網(wǎng)、異站空地異頻組網(wǎng)等[2, 9]，其中，同站組網(wǎng)方案通過(guò)在地面蜂窩網(wǎng)絡(luò)站址上對(duì)現(xiàn)有設(shè)備進(jìn)行調(diào)整優(yōu)化或新增少量AAU設(shè)備等方式實(shí)現(xiàn)低空網(wǎng)絡(luò)的建立，具有成本低、建設(shè)方便等優(yōu)點(diǎn)。對(duì)于具體的低空網(wǎng)絡(luò)建設(shè)方案，已有很多關(guān)于低空基站的選址[10]以及對(duì)天線的仰角[11-12]的調(diào)整方面的研究，然而上述研究往往只聚焦于站址或仰角等單一配置的調(diào)整，對(duì)于實(shí)際應(yīng)用中通過(guò)優(yōu)化已有地面基站建立低空網(wǎng)絡(luò)過(guò)程中的對(duì)合適基站進(jìn)行選擇以及對(duì)高度、天線角度、設(shè)備選型等多方面配置策略的聯(lián)合設(shè)計(jì)而言，其實(shí)用價(jià)值有限，需要設(shè)計(jì)一種多要素聯(lián)合的低空基站優(yōu)化方法，實(shí)現(xiàn)低成本、高效率的低空網(wǎng)絡(luò)建設(shè)。

傳統(tǒng)的蜂窩網(wǎng)絡(luò)的基站規(guī)劃方法往往根據(jù)經(jīng)驗(yàn)?zāi)Ｐ凸烙?jì)信號(hào)的傳播，而已有研究證實(shí)，城市環(huán)境內(nèi)的復(fù)雜建筑物的遮擋和反射會(huì)極大地改變空對(duì)地信道特性[13-15]，因此統(tǒng)計(jì)性信道模型往往難以準(zhǔn)確描述信道特征。而射線追蹤技術(shù)可通過(guò)計(jì)算無(wú)線電波與場(chǎng)景之間的電磁相互作用，模擬真實(shí)的信號(hào)傳播過(guò)程，具有更高的靈活性[15]。然而射線追蹤作為一種確定性傳播工具，其所需計(jì)算量往往遠(yuǎn)大于統(tǒng)計(jì)性模型，因而在應(yīng)用時(shí)需采取實(shí)時(shí)計(jì)算等措施降低計(jì)算量，提升效率。

強(qiáng)化學(xué)習(xí)是一種通過(guò)智能體與環(huán)境的交互來(lái)積累信息、改進(jìn)策略的機(jī)器學(xué)習(xí)方法，該方法通過(guò)環(huán)境對(duì)智能體動(dòng)作的反饋來(lái)進(jìn)行智能體的訓(xùn)練與學(xué)習(xí)，具有無(wú)需提前獲取先驗(yàn)信息的優(yōu)點(diǎn)。對(duì)低空基站優(yōu)化問(wèn)題而言，使用強(qiáng)化學(xué)習(xí)方法可免于提前進(jìn)行各基站不同優(yōu)化方案的覆蓋效果的繁雜計(jì)算，提升優(yōu)化速度，降低計(jì)算量與時(shí)間成本。

本文詳細(xì)內(nèi)容請(qǐng)下載：

http://ihrv.cn/resource/share/2000006596

作者信息：

薄云鵬1，2，亢抗3，潘桂新3，汪敏1

（1.中國(guó)科學(xué)院云南天文臺(tái)，云南昆明 650200；

2.中國(guó)科學(xué)院大學(xué)，北京 100049；

3.中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司廣東省分公司，廣東廣州 510700）

Magazine.Subscription.jpg

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容