看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进的DQN机器人路径规划 收藏
基于改进的DQN机器人路径规划

基于改进的DQN机器人路径规划

作     者:董永峰 杨琛 董瑶 屈向前 肖华昕 王子秋 DONG Yong-feng;YANG Chen;DONG Yao;QU Xiang-qian;XIAO Hua-xin;WANG Zi-qiu

作者机构:河北工业大学人工智能与数据科学学院天津300401 河北工业大学河北省大数据计算重点实验室天津300401 河北工业大学河北省数据驱动工业智能工程中心天津300401 

基  金:天津市自然科学基金重点基金项目(19JCZDJC40000) 天津市科技计划基金项目(18YFCZZC00060、18ZXZNGX00100) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2021年第42卷第2期

页      码:552-558页

摘      要:针对深度Q学习算法在机器人路径规划中的过估计问题,提出一种动态融合深度双Q算法(dynamic target double deep Q network,DTDDQN)。通过动态融合DDQN和平均DQN的先验知识进行网络参数训练,前期以较大权重的DDQN优化目标对估计网络进行网络训练和先验知识的积累,随着学习的深入,增大平均DQN的优化目标对网络训练的权重,使网络输出的Q值更加接近真实Q值,减少过估计对机器人在选择动作时的影响,达到所选策略最优。仿真对比结果表明,DTDDQN算法在路径规划中能更好解决过估计问题,在动作选择方面以及规划路径长度方面都有一定提升。

主 题 词:动态融合 机器人路径规划 过估计 深度强化学习 优化目标 

学科分类:080202[080202] 08[工学] 0804[工学-材料学] 0802[工学-机械学] 

D O I:10.16208/j.issn1000-7024.2021.02.037

馆 藏 号:203102045...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分