看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进DQN算法的NPC行进路线规划研究 收藏
基于改进DQN算法的NPC行进路线规划研究

基于改进DQN算法的NPC行进路线规划研究

作     者:刘森 李玺 黄运 LIU Sen;LI Xi;HUANG Yun

作者机构:河北远东通信系统工程有限公司河北石家庄050200 陆军工程大学石家庄校区河北石家庄050000 中国人民解放军32620部队青海西宁810007 

基  金:国家自然科学基金(62071483) 国家社会科学基金军事学资助项目(15GJ003-184) 

出 版 物:《无线电工程》 (Radio Engineering)

年 卷 期:2022年第52卷第8期

页      码:1441-1446页

摘      要:在军事游戏或仿真训练系统中,非玩家角色(No-player Character,NPC)的行进路线规划是物理行为建模的重要组成部分。深度Q网络(Deep Q-Network,DQN)算法作为深度强化学习(Deep Reinforcement Learning,DEL)的经典算法,非常适合于路线规划这类策略选择的应用研究。针对该算法在收敛性和最优路线规划上存在的问题进行了优化,提出了改进算法PRDQN。基于TD-error和SumTree对经验回放机制进行了改进,实现了优先级经验回放;根据距离优先的原则,对奖励函数进行了重新设计,提高了对距离最近坐标点的奖励值。通过对比实验证明,该算法在收敛性和最优路线选择方面都优于传统的DQN算法。

主 题 词:深度Q网络 路线规划 优先级经验回放 最优路线 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1003-3106.2022.08.020

馆 藏 号:203113725...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分