看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于强化学习的高超飞行器协同博弈制导方法 收藏
基于强化学习的高超飞行器协同博弈制导方法

基于强化学习的高超飞行器协同博弈制导方法

作     者:倪炜霖 王永海 徐聪 赤丰华 梁海朝 NI Weilin;WANG Yonghai;XU Cong;CHI Fenghua;LIANG Haizhao

作者机构:中山大学航空航天学院深圳518107 空间物理重点实验室北京100076 

基  金:国家自然科学基金(62003375 62103452) 

出 版 物:《航空学报》 (Acta Aeronautica et Astronautica Sinica)

年 卷 期:2023年第44卷第S2期

页      码:55-66页

摘      要:研究了多拦截场景下高超声速飞行器主动防御攻防对抗的智能协同博弈制导方法。针对高超声速飞行器与主动防御飞行器协同对抗多个拦截器攻击的博弈问题,提出了一种基于双延迟深度确定性策略梯度算法的高超声速飞行器智能协同博弈制导方法,该方法能够在高超声速飞行器与主动防御飞行器机动能力和响应速度不足的情况下实现对于多拦截器的高成功率博弈。通过构建一类启发式连续奖励函数,设计了一种自适应渐进式课程学习方法,提出了一种快速稳定收敛训练方法,解决深度强化学习训练过程中的稀疏奖励问题,实现智能博弈算法的稳定快速收敛。最后通过数值仿真对所提出方法的有效性进行验证,仿真结果表明,所提出的理论方法能够提高训练收敛效率与稳定性,且相比于传统博弈制导方法具有更高的博弈成功率。

主 题 词:博弈理论 奖励函数塑造 课程学习 深度强化学习 高超声速飞行器 

学科分类:08[工学] 0825[工学-环境科学与工程类] 

核心收录:

D O I:10.7527/S1000-6893.2023.29400

馆 藏 号:203127498...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分