看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于混合采样深度Q网络的水面无人艇逃脱策略 收藏
基于混合采样深度Q网络的水面无人艇逃脱策略

基于混合采样深度Q网络的水面无人艇逃脱策略

作     者:杨远鹏 宋利飞 茅嘉琪 李一 陈侯京 YANG Yuanpeng;SONG Lifei;MAO Jiaqi;LI Yi;CHEN Houjing

作者机构:中国船舶集团有限公司系统工程研究院北京100094 武汉理工大学高性能船舶技术教育部重点实验室湖北武汉430063 中国舰船研究设计中心湖北武汉430064 

基  金:国家自然科学基金项目资助(51809203) 

出 版 物:《中国舰船研究》 (Chinese Journal of Ship Research)

年 卷 期:2024年第19卷第1期

页      码:256-263页

摘      要:[目的]针对敌方船舶采用合围战术,研究我方无人艇(USV)被敌方船舶包围情况下的逃跑策略规划问题。[方法]提出一种混合采样深度Q网络(HS-DQN)强化学习算法,逐步增加重要样本的回放频率,并保留一定的探索性,防止算法陷入局部最优。设计状态空间、动作空间和奖励函数,通过训练获得最优的USV逃跑策略,并从奖励值和逃脱成功率方面与DQN算法进行对比。[结果]仿真结果表明,使用HSDQN算法进行训练,逃脱成功率提高2%,算法的收敛速度提高了20%。[结论]HS-DQN算法可以减少USV无效探索的次数,并加快算法的收敛速度,仿真实验验证了USV逃跑策略的有效性。

主 题 词:无人艇 阿波罗尼奥斯圆 围捕-逃跑 深度强化学习 混合采样 

学科分类:08[工学] 081104[081104] 082402[082402] 0824[工学-林业工程类] 0811[工学-水利类] 

D O I:10.19693/j.issn.1673-3185.03105

馆 藏 号:203126692...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分