文献详情 >基于强化学习的高超飞行器协同博弈制导方法收藏

基于强化学习的高超飞行器协同博弈制导方法

作者：倪炜霖王永海徐聪赤丰华梁海朝 NI Weilin;WANG Yonghai;XU Cong;CHI Fenghua;LIANG Haizhao

作者机构：中山大学航空航天学院深圳518107 空间物理重点实验室北京100076

基　　金：国家自然科学基金(62003375 62103452)

出版物：《航空学报》 (Acta Aeronautica et Astronautica Sinica)

年卷期：2023年第44卷第S2期

页码：55-66页

摘要：研究了多拦截场景下高超声速飞行器主动防御攻防对抗的智能协同博弈制导方法。针对高超声速飞行器与主动防御飞行器协同对抗多个拦截器攻击的博弈问题,提出了一种基于双延迟深度确定性策略梯度算法的高超声速飞行器智能协同博弈制导方法,该方法能够在高超声速飞行器与主动防御飞行器机动能力和响应速度不足的情况下实现对于多拦截器的高成功率博弈。通过构建一类启发式连续奖励函数,设计了一种自适应渐进式课程学习方法,提出了一种快速稳定收敛训练方法,解决深度强化学习训练过程中的稀疏奖励问题,实现智能博弈算法的稳定快速收敛。最后通过数值仿真对所提出方法的有效性进行验证,仿真结果表明,所提出的理论方法能够提高训练收敛效率与稳定性,且相比于传统博弈制导方法具有更高的博弈成功率。

主题词：博弈理论奖励函数塑造课程学习深度强化学习高超声速飞行器

学科分类：08[工学] 0825[工学-环境科学与工程类]

核心收录：

D　O　I：10.7527/S1000-6893.2023.29400

馆藏号：203127498...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于强化学习的高超飞行器协同博弈制导方法

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于强化学习的高超飞行器协同博弈制导方法

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：