文献详情 >基于强化学习的挖掘机时间最优轨迹规划收藏

基于强化学习的挖掘机时间最优轨迹规划

作者：张韵悦孙志毅孙前来王银 ZHANG Yun-yue;SUN Zhi-yi;SUN Qian-lai;WANG Yin

基　　金：山西省重点研发计划项目(201903D121130) 山西省自然科学基金项目(201901D111265) 山西省研究生创新项目(2021Y670) 太原科技大学科研启动基金项目(20192014)

出版物：《控制与决策》 (Control and Decision)

年卷期：2024年第39卷第5期

页码：1433-1440页

摘要：针对挖掘机的自主作业场景,提出基于强化学习的时间最优轨迹规划方法.首先,搭建仿真环境用于产生数据,以动臂、斗杆和铲斗关节的角度、角速度为状态观测变量,以各关节的角加速度值为动作信息,通过状态观测信息实现仿真环境与自主学习算法的交互;然后,设计以动臂、斗杆和铲斗关节运动是否超出允许范围、完成任务总时间和目标相对距离为奖励函数对策略网络参数进行训练;最后,利用改进的近端策略优化算法(proximal policy optimization, PPO)实现挖掘机的时间最优轨迹规划.与此同时,与不同连续动作空间的强化学习算法进行对比,实验结果表明:所提出优化算法效率更高,收敛速度更快,作业轨迹更平滑,可有效避免各关节受到较大冲击,有助于挖掘机高效、平稳地作业.

主题词：挖掘机自主作业轨迹规划多智能体 PPO算法智能决策

学科分类：080202[080202] 08[工学] 0804[工学-材料学] 0802[工学-机械学]

核心收录：

D　O　I：10.13195/j.kzyjc.2022.0811

馆藏号：203127494...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于强化学习的挖掘机时间最优轨迹规划

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于强化学习的挖掘机时间最优轨迹规划

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：