看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于指导轨迹加速的机械臂强化学习运动规划 收藏
基于指导轨迹加速的机械臂强化学习运动规划

基于指导轨迹加速的机械臂强化学习运动规划

作     者:刘哲 潘爱强 魏本刚 江安烽 张家维 白成超 Liu Zhe;Pan Aiqiang;Wei Bengang;Jiang Anfeng;Zhang Jiawei;Bai Chengchao

作者机构:国网上海市电力公司电力科学研究院上海200437 国网上海能源互联网研究院有限公司上海201210 哈尔滨工业大学航天学院黑龙江哈尔滨150001 

基  金:国家电网有限公司科技项目“人工智能带电作业机器人系统架构及选型研究”(52094019006Y) 

出 版 物:《电气自动化》 (Electrical Automation)

年 卷 期:2022年第44卷第5期

页      码:102-103,107页

摘      要:针对深度强化学习运动规划器训练速度慢的问题,基于软动作-评论家强化学习算法,研究了指导轨迹和奖励函数设计对运动规划成功率和收敛速度的影响。结果表明,在密集奖励函数的情况下,指导轨迹加快了训练速度,但对成功率的影响较小,在稀疏奖励的情况下只有使用指导轨迹才可以收敛。试验验证密集奖励函数和指导轨迹对强化学习运动规划器的训练效果提升起了重要作用。

主 题 词:运动规划 强化学习 机械臂 指导轨迹 奖励函数 

学科分类:0202[经济学-财政学类] 02[经济学] 020205[020205] 08[工学] 0802[工学-机械学] 

D O I:10.3969/j.issn.1000-3886.2022.05.031

馆 藏 号:203115400...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分