文献详情 >基于改进的DQN机器人路径规划收藏

基于改进的DQN机器人路径规划

作者：董永峰杨琛董瑶屈向前肖华昕王子秋 DONG Yong-feng;YANG Chen;DONG Yao;QU Xiang-qian;XIAO Hua-xin;WANG Zi-qiu

作者机构：河北工业大学人工智能与数据科学学院天津300401 河北工业大学河北省大数据计算重点实验室天津300401 河北工业大学河北省数据驱动工业智能工程中心天津300401

基　　金：天津市自然科学基金重点基金项目(19JCZDJC40000) 天津市科技计划基金项目(18YFCZZC00060、18ZXZNGX00100)

出版物：《计算机工程与设计》 (Computer Engineering and Design)

年卷期：2021年第42卷第2期

页码：552-558页

摘要：针对深度Q学习算法在机器人路径规划中的过估计问题,提出一种动态融合深度双Q算法(dynamic target double deep Q network,DTDDQN)。通过动态融合DDQN和平均DQN的先验知识进行网络参数训练,前期以较大权重的DDQN优化目标对估计网络进行网络训练和先验知识的积累,随着学习的深入,增大平均DQN的优化目标对网络训练的权重,使网络输出的Q值更加接近真实Q值,减少过估计对机器人在选择动作时的影响,达到所选策略最优。仿真对比结果表明,DTDDQN算法在路径规划中能更好解决过估计问题,在动作选择方面以及规划路径长度方面都有一定提升。

主题词：动态融合机器人路径规划过估计深度强化学习优化目标

学科分类：080202[080202] 08[工学] 0804[工学-材料学] 0802[工学-机械学]

D　O　I：10.16208/j.issn1000-7024.2021.02.037

馆藏号：203102045...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于改进的DQN机器人路径规划

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于改进的DQN机器人路径规划

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：