看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Double Deep Q Network的无人机隐蔽接敌策略 收藏
基于Double Deep Q Network的无人机隐蔽接敌策略

基于Double Deep Q Network的无人机隐蔽接敌策略

作     者:何金 丁勇 高振龙 HE Jin;DING Yong;GAO Zhenlong

作者机构:南京航空航天大学自动化学院南京211106 

基  金:国家自然科学基金面上项目(61473146) 

出 版 物:《电光与控制》 (Electronics Optics & Control)

年 卷 期:2020年第27卷第7期

页      码:52-57页

摘      要:基于深度强化学习的连续状态空间无人机隐蔽接敌问题,提出了基于马尔可夫决策过程的隐蔽接敌双深度Q网络(DDQN)方法。利用DDQN生成目标值函数的方法解决了传统DQN的过拟合问题;采用按优先级随机抽样的方法获取训练样本,加速了神经网络的训练速度;设定贪婪系数按照指数下降的方法,解决了传统强化学习的“探索利用窘境”;在势函数奖赏函数设计中引入角度因子,使其更加符合实际作战情况。仿真实验结果表明,DDQN具有较好的收敛性,能有效生成隐蔽接敌策略。

主 题 词:隐蔽接敌策略 空战决策 马尔可夫决策过程 双神经网络结构 DDQN算法 

学科分类:08[工学] 0825[工学-环境科学与工程类] 

D O I:10.3969/j.issn.1671-637X.2020.07.010

馆 藏 号:203956026...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分