文献详情 >基于混合采样深度Q网络的水面无人艇逃脱策略收藏

基于混合采样深度Q网络的水面无人艇逃脱策略

作者：杨远鹏宋利飞茅嘉琪李一陈侯京 YANG Yuanpeng;SONG Lifei;MAO Jiaqi;LI Yi;CHEN Houjing

作者机构：中国船舶集团有限公司系统工程研究院北京100094 武汉理工大学高性能船舶技术教育部重点实验室湖北武汉430063 中国舰船研究设计中心湖北武汉430064

出版物：《中国舰船研究》 (Chinese Journal of Ship Research)

年卷期：2024年第19卷第1期

页码：256-263页

摘要：[目的]针对敌方船舶采用合围战术,研究我方无人艇(USV)被敌方船舶包围情况下的逃跑策略规划问题。[方法]提出一种混合采样深度Q网络(HS-DQN)强化学习算法,逐步增加重要样本的回放频率,并保留一定的探索性,防止算法陷入局部最优。设计状态空间、动作空间和奖励函数,通过训练获得最优的USV逃跑策略,并从奖励值和逃脱成功率方面与DQN算法进行对比。[结果]仿真结果表明,使用HSDQN算法进行训练,逃脱成功率提高2%,算法的收敛速度提高了20%。[结论]HS-DQN算法可以减少USV无效探索的次数,并加快算法的收敛速度,仿真实验验证了USV逃跑策略的有效性。

主题词：无人艇阿波罗尼奥斯圆围捕-逃跑深度强化学习混合采样

学科分类：08[工学] 081104[081104] 082402[082402] 0824[工学-林业工程类] 0811[工学-水利类]

D　O　I：10.19693/j.issn.1673-3185.03105

馆藏号：203126692...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于混合采样深度Q网络的水面无人艇逃脱策略

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于混合采样深度Q网络的水面无人艇逃脱策略

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：