近端策略優(yōu)化算法在任務(wù)規(guī)劃中的應(yīng)用 | |
所屬分類:技術(shù)論文 | |
上傳者:wwei | |
文檔大小:670 K | |
標(biāo)簽: 近端策略優(yōu)化 博弈對抗 任務(wù)規(guī)劃 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:近端策略優(yōu)化算法本質(zhì)是一種強(qiáng)化學(xué)習(xí)算法,被認(rèn)為是強(qiáng)化學(xué)習(xí)目前適用性最廣的算法之一。對任務(wù)規(guī)劃及任務(wù)規(guī)劃系統(tǒng)進(jìn)行了理解和認(rèn)識,分析了未來戰(zhàn)場博弈對抗性帶來的難題,探索研究了應(yīng)用近端策略優(yōu)化算法解決博弈對抗問題的可行性。結(jié)合深度強(qiáng)化學(xué)習(xí)技術(shù)優(yōu)勢,立足多源層次化的戰(zhàn)場態(tài)勢描述,提出面向智能博弈的戰(zhàn)場態(tài)勢表示方法。為滿足實(shí)際響應(yīng)高實(shí)時特點(diǎn),提出利用深度遷移學(xué)習(xí)提升模型泛化能力。解決任務(wù)規(guī)劃系統(tǒng)在戰(zhàn)場不確定性條件下的智能決策問題,核心是要構(gòu)建對抗策略建模與學(xué)習(xí)方法。 | |
現(xiàn)在下載 | |
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2