基于目標(biāo)的域隨機化方法在機器人操作方面的研究

打印
收藏

收藏成功

微博 QQ空間微信

打開文本圖片集

摘要：使用強化學(xué)習(xí)解決機器人操作問題有著諸多優(yōu)勢，然而傳統(tǒng)的強化學(xué)習(xí)算法面臨著獎勵稀疏的困難，且得到的策略難以直接應(yīng)用到現(xiàn)實環(huán)境中。為了提高策略從仿真到現(xiàn)實遷移的成功率，提出了基于目標(biāo)的域隨機化方法。使用基于目標(biāo)的強化學(xué)習(xí)算法對模型進(jìn)行訓(xùn)練，可以有效地應(yīng)對機器人操作任務(wù)獎勵稀疏的情況，得到的策略可以在仿真環(huán)境下良好運行。（剩余15860字）

試讀結(jié)束

購買全文6.00元下一篇考慮零件功能性削減的多目標(biāo)拆卸方案決策

計算機應(yīng)用研究

2022年10期

￥12.00/本

特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

基于目標(biāo)的域隨機化方法在機器人操作方面的研究