看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于阶段诱导学习的多无人艇协同目标围捕策略 收藏
基于阶段诱导学习的多无人艇协同目标围捕策略

基于阶段诱导学习的多无人艇协同目标围捕策略

作     者:曲星儒 江雨泽 龙飞飞 张汝波 高颖 QU Xingru;JIANG Yuze;LONG Feifei;ZHANG Rubo;GAO Ying

作者机构:大连民族大学机电工程学院辽宁大连116600 

基  金:国家自然科学基金资助项目(61673084) 中央高校基本科研业务费资助项目(04442024046) 

出 版 物:《中国舰船研究》 (Chinese Journal of Ship Research)

年 卷 期:2025年第20卷第1期

页      码:162-171页

摘      要:[目的]针对海上目标无人艇智能逃逸问题,提出一种基于阶段诱导学习的多无人艇协同目标围捕策略。[方法]首先构建针对无人艇围捕逃逸的马尔科夫博弈模型,明确基于距离和角度的围捕成功判定条件。为提升智能逃逸下多无人艇的目标围捕性能,采用集中式训练-分布式执行框架和长短时记忆网络相结合的方法,基于多智能体柔性行动-评判(MASAC)算法开展协同围捕训练。同时,设计基于阶段诱导的协同围捕奖励机制,依据双方当前状态来优化训练进程,避免“惰性围捕艇”现象,提高围捕成功率,引导无人艇由易到难地完成围捕任务。[结果]仿真结果表明,与仅采用阶段诱导奖励的MASAC、仅采用长短时记忆网络的MASAC和MASAC围捕策略相比,所提策略的围捕成功率分别提高3.3%,6.1%和24.4%,验证了其可行性和有效性。[结论]所提策略为无人艇攻防对抗提供了有价值的技术参考,有助于推动无人艇技术在相关领域的应用与发展。

主 题 词:无人艇 协同目标围捕 多智能体柔性行动-评判 阶段诱导奖励 

学科分类:08[工学] 082402[082402] 0824[工学-林业工程类] 

D O I:10.19693/j.issn.1673-3185.04030

馆 藏 号:203155589...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分