看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于MRD-DDPG的机械臂避障路径规划方法 收藏
基于MRD-DDPG的机械臂避障路径规划方法

基于MRD-DDPG的机械臂避障路径规划方法

作     者:付子强 郑威强 张立萍 何丽 袁亮 邵明明 FU Ziqiang;ZHENG Weiqiang;ZHANG Liping;HE Li;YUAN Liang;SHAO Mingming

作者机构:新疆大学机械工程学院乌鲁木齐830047 北京化工大学信息科学与技术学院北京100029 

基  金:国家自然科学基金项目(62063033) 新疆维吾尔自治区科技支疆项目计划(2021E02049) 

出 版 物:《组合机床与自动化加工技术》 (Modular Machine Tool & Automatic Manufacturing Technique)

年 卷 期:2023年第7期

页      码:41-45页

摘      要:提出将MRD-DDPG算法应用在机械臂避障路径规划上,解决了DDPG算法在训练过程中学习效率低、样本利用率低的问题。首先,在DDPG算法的基础上,通过改进经验池机制,提出多经验池延迟采样的深度确定性策略梯度(multi-replay buffer delay sampling-deep deterministic policy gradient,MRD-DDPG)算法,有效的缓解了样本利用率低的问题;其次,针对机械臂交互探索过程中奖励稀疏问题,设计了一种适用于避障路径规划的位置奖励函数,有效的提高了智能体的学习效率。实验结果表明,机械臂避障路径规划的平均成功率达97%左右;MRD-DDPG算法相比于DDPG算法的平均成功率提升了88%;机械臂的平均规划时间为0.638 s。

主 题 词:深度强化学习 DDPG 奖励函数 机械臂 路径规划 

学科分类:080202[080202] 08[工学] 0802[工学-机械学] 

D O I:10.13462/j.cnki.mmtamt.2023.07.010

馆 藏 号:203122624...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分