看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Sarsa(λ)强化学习的空间机械臂路径规划研究 收藏
基于Sarsa(λ)强化学习的空间机械臂路径规划研究

基于Sarsa(λ)强化学习的空间机械臂路径规划研究

作     者:徐帷 卢山 XU Wei;LU Shan

作者机构:上海航天控制技术研究所上海201109 上海市空间智能控制技术重点实验室上海201109 

基  金:上海市科技人才计划(17XD1420700) 上海市自然科学基金(16ZR1415600) 

出 版 物:《宇航学报》 (Journal of Astronautics)

年 卷 期:2019年第40卷第4期

页      码:435-443页

摘      要:针对目标特性未知的在轨操作环境,研究了典型空间操作机械臂的路径规划策略。采用Sarsa(λ)强化学习方法实现目标跟踪及避障的自主路径规划与智能决策,该方法将机械臂系统的每节臂视为一个决策智能体,通过感知由目标偏差和障碍距离程度组成的二维状态,设计符合人工经验的拟合奖赏函数,进行各臂转动动作的强化训练,最终形成各智能体的状态-动作值函数表,即可作为机械臂在线路径规划的决策依据。将本方法应用于多自由度空间机械臂路径规划任务,仿真结果表明新算法能在有限训练次数内实现对移动目标的稳定跟踪与避障,同时各智能体通过学习所得的状态-动作值函数表,具备较强的后期在线自主调整能力,从而验证了算法较强的鲁棒性和智能性。

主 题 词:强化学习 Sarsa方法 空间机械臂 路径规划 

学科分类:080202[080202] 08[工学] 0804[工学-材料学] 0802[工学-机械学] 

核心收录:

D O I:10.3873/j.issn.1000-1328.2019.04.008

馆 藏 号:203668102...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分