看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于APF-DQN的空战机动决策方法 收藏
基于APF-DQN的空战机动决策方法

基于APF-DQN的空战机动决策方法

作     者:张晓杰 周中良 ZHANG Xiaojie;ZHOU Zhongliang

作者机构:空军工程大学陕西西安710038 

出 版 物:《飞行力学》 (Flight Dynamics)

年 卷 期:2021年第39卷第5期

页      码:88-94页

摘      要:针对强化学习中奖励信号稀疏导致价值函数收敛慢的问题,提出结合人工势场(Artificial Potential Field, APF)法和深度Q学习网络(Deep Q-learning Network, DQN)的空战机动决策方法。描述了空战机动态势,建立了空战机动人工势场模型,设计了一阶APF奖励函数,构造了基于DQN的空战决策模型,提出了基于APF-DQN的空战机动决策方法,最后进行了仿真试验。仿真结果表明,所提方法能够解决奖励信号稀疏的问题,使我方战机能够很好地进行轨迹跟踪,占据有利态势。

主 题 词:空战机动 人工势场 奖励函数 强化学习 

学科分类:11[军事学] 08[工学] 082503[082503] 0825[工学-环境科学与工程类] 1109[1109] 

D O I:10.13645/j.cnki.f.d.20210809.001

馆 藏 号:203105053...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分