看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于强化学习的挖掘机时间最优轨迹规划 收藏
基于强化学习的挖掘机时间最优轨迹规划

基于强化学习的挖掘机时间最优轨迹规划

作     者:张韵悦 孙志毅 孙前来 王银 ZHANG Yun-yue;SUN Zhi-yi;SUN Qian-lai;WANG Yin

作者机构:太原科技大学电子信息工程学院太原030024 

基  金:山西省重点研发计划项目(201903D121130) 山西省自然科学基金项目(201901D111265) 山西省研究生创新项目(2021Y670) 太原科技大学科研启动基金项目(20192014) 

出 版 物:《控制与决策》 (Control and Decision)

年 卷 期:2024年第39卷第5期

页      码:1433-1440页

摘      要:针对挖掘机的自主作业场景,提出基于强化学习的时间最优轨迹规划方法.首先,搭建仿真环境用于产生数据,以动臂、斗杆和铲斗关节的角度、角速度为状态观测变量,以各关节的角加速度值为动作信息,通过状态观测信息实现仿真环境与自主学习算法的交互;然后,设计以动臂、斗杆和铲斗关节运动是否超出允许范围、完成任务总时间和目标相对距离为奖励函数对策略网络参数进行训练;最后,利用改进的近端策略优化算法(proximal policy optimization, PPO)实现挖掘机的时间最优轨迹规划.与此同时,与不同连续动作空间的强化学习算法进行对比,实验结果表明:所提出优化算法效率更高,收敛速度更快,作业轨迹更平滑,可有效避免各关节受到较大冲击,有助于挖掘机高效、平稳地作业.

主 题 词:挖掘机 自主作业 轨迹规划 多智能体 PPO算法 智能决策 

学科分类:080202[080202] 08[工学] 0804[工学-材料学] 0802[工学-机械学] 

核心收录:

D O I:10.13195/j.kzyjc.2022.0811

馆 藏 号:203127494...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分