基于深度強(qiáng)化學(xué)習(xí)和社會力模型的移動機(jī)器人自主避障
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大?。?span>1912 K
標(biāo)簽: 深度強(qiáng)化學(xué)習(xí) 社會力模型 自主避障
所需積分:0分積分不夠怎么辦?
文檔介紹:深度強(qiáng)化學(xué)習(xí)在移動機(jī)器人自主避障領(lǐng)域已得到廣泛應(yīng)用,其基本原理是通過模擬環(huán)境中的不斷試錯,結(jié)合獎勵機(jī)制提升機(jī)器人的避障性能。然而,針對不同任務(wù)場景,網(wǎng)絡(luò)訓(xùn)練效率存在顯著差異。同時(shí),在人群密集的場景中,機(jī)器人的行為可能對人類造成干擾。為了應(yīng)對訓(xùn)練效率低下和機(jī)器人行為不符合社會規(guī)范的問題,提出了一種將社會力模型融入深度強(qiáng)化學(xué)習(xí)的自主避障策略。該策略首先將人類未來的運(yùn)動軌跡考慮進(jìn)獎勵函數(shù),以確保機(jī)器人理解人類意圖并避免闖入人類的舒適區(qū)。其次,在訓(xùn)練過程中引入先驗(yàn)的傳統(tǒng)控制器模型,并設(shè)計(jì)了一種基于概率的切換開關(guān),以隨機(jī)切換控制器輸出,提高機(jī)器人的探索效率。實(shí)驗(yàn)結(jié)果表明,所提出的方法能夠增加機(jī)器人與人類之間的安全距離,同時(shí)實(shí)現(xiàn)平穩(wěn)導(dǎo)航。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。