文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.211934
中文引用格式: 馬子杰,高杰,武沛羽,等. 用于巡航導(dǎo)彈突防航跡規(guī)劃的改進(jìn)深度強(qiáng)化學(xué)習(xí)算法[J].電子技術(shù)應(yīng)用,2021,47(8):11-14,19.
英文引用格式: Ma Zijie,Gao Jie,Wu Peiyu,et al. An improved deep reinforcement learning algorithm for cruise missile penetration path planning[J]. Application of Electronic Technique,2021,47(8):11-14,19.
0 引言
巡航導(dǎo)彈是一種能機(jī)動(dòng)發(fā)射、命中精度高、隱蔽性強(qiáng)、機(jī)動(dòng)性能強(qiáng)的戰(zhàn)術(shù)打擊武器,但近年來(lái)由海陸空防御武器整合得到的體系化信息化反導(dǎo)防御系統(tǒng)態(tài)勢(shì)感知能力和區(qū)域拒止能力都得到了極大的提升,巡航導(dǎo)彈的戰(zhàn)場(chǎng)生存能力受到威脅,提升巡航導(dǎo)彈規(guī)避動(dòng)態(tài)威脅的能力成為其能否成功打擊目標(biāo)的關(guān)鍵[1-3]。傳統(tǒng)的巡航導(dǎo)彈航跡規(guī)劃方法中將雷達(dá)威脅建模為一個(gè)靜態(tài)的雷達(dá)檢測(cè)區(qū)域,這難以適應(yīng)對(duì)決策實(shí)時(shí)性要求較高的動(dòng)態(tài)戰(zhàn)場(chǎng)環(huán)境,而且其缺乏探索先驗(yàn)知識(shí)以外的突防策略的能力,需要研究能應(yīng)對(duì)動(dòng)態(tài)對(duì)抗的巡航導(dǎo)彈智能航跡規(guī)劃算法。
深度強(qiáng)化學(xué)習(xí)是人工智能領(lǐng)域新的研究熱點(diǎn)[4-6]。隨著深度強(qiáng)化學(xué)習(xí)研究的深入,其開(kāi)始被應(yīng)用于武器裝備智能突防,文獻(xiàn)[7]利用深度強(qiáng)化學(xué)習(xí)提出了一種新的空空導(dǎo)彈制導(dǎo)律,提高了打擊目標(biāo)的能力。文獻(xiàn)[8]針對(duì)目標(biāo)、打擊導(dǎo)彈、攔截導(dǎo)彈作戰(zhàn)問(wèn)題,探究了是否發(fā)射攔截導(dǎo)彈、攔截導(dǎo)彈的最佳發(fā)射時(shí)間和發(fā)射后的最佳導(dǎo)引律。文獻(xiàn)[9]利用深度價(jià)值網(wǎng)絡(luò)算法探究了靜態(tài)預(yù)警威脅下的無(wú)人機(jī)航跡規(guī)劃問(wèn)題,提升了航跡規(guī)劃的時(shí)間。文獻(xiàn)[10]將雷達(dá)威脅建模為一個(gè)靜態(tài)的雷達(dá)檢測(cè)區(qū)域,在二維平面探究了巡飛彈動(dòng)態(tài)突防控制決策問(wèn)題,提高了巡飛彈的自主突防能力。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003690。
作者信息:
馬子杰,高 杰,武沛羽,謝擁軍
(北京航空航天大學(xué) 電子信息工程學(xué)院,北京100191)

