看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种面向空间非合作目标的强化学习多臂协同俘获策略研究 收藏
一种面向空间非合作目标的强化学习多臂协同俘获策略研究

一种面向空间非合作目标的强化学习多臂协同俘获策略研究

作     者:张柄汉 王琛 彭兆涛 张夷斋 张帆 ZHANG Binghan;WANG Chen;PENG Zhaotao;ZHANG Yizhai;ZHANG Fan

作者机构:长安大学工程机械学院西安710054 西北工业大学航天学院西安710072 

基  金:国家自然科学基金(62173275 62222313) 

出 版 物:《宇航学报》 (Journal of Astronautics)

年 卷 期:2023年第44卷第12期

页      码:1934-1943页

摘      要:针对空间非合作目标清除任务中的目标适应性以及俘获动作规划复杂性等问题,提出了一种基于强化学习方法并结合“多臂分组协同”机制的包络俘获策略。首先构建了多臂俘获机构的物理模型和运动学模型,之后利用SAC(soft actor-critic)算法并引入前演训练(PT)设计了强化学习控制器,接着基于“多臂分组协同”奖励机制设计奖励函数以训练得到最优俘获动作。为了验证俘获策略对单目标作业的高效性和对多目标作业的高适应性,对各种目标分别进行仿真实验。仿真结果表明:所得的俘获策略可以对多种构型的目标实现高效、高适应地俘获。

主 题 词:空间非合作目标 空间俘获策略 强化学习 包络俘获 多臂协同 

学科分类:080202[080202] 08[工学] 0804[工学-材料学] 0802[工学-机械学] 0825[工学-环境科学与工程类] 

核心收录:

D O I:10.3873/j.issn.1000-1328.2023.12.015

馆 藏 号:203125423...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分