看过本文的还看了

相关文献

该作者的其他文献

文献详情 >深空探测器多智能体强化学习自主任务规划 收藏
深空探测器多智能体强化学习自主任务规划

深空探测器多智能体强化学习自主任务规划

作     者:孙泽翼 王彬 胡馨月 熊新 金怀平 SUN Zeyi;WANG Bin;HU Xinyue;XIONG Xin;JIN Huaiping

作者机构:昆明理工大学信息工程与自动化学院昆明650500 云南省人工智能重点实验室昆明650500 

基  金:空间碎片专项(KJSP2020020302) 

出 版 物:《深空探测学报(中英文)》 (Journal Of Deep Space Exploration)

年 卷 期:2024年第11卷第3期

页      码:244-255页

摘      要:针对深空探测器执行附着任务时各子系统协同规划自主性、快速性和自适应性的要求,提出一种基于近端策略优化方法的多智能体强化学习协同规划,将单智能体近端策略优化算法与多智能体混合式协作机制相融合,设计了一种多智能体自主任务规划模型,并引入噪声正则化优势值解决多智能体集中训练中协同策略过拟合的问题。仿真结果表明,多智能体强化学习自主任务规划方法能根据实时环境变化,对智能自主优化小天体附着任务的协作策略适时调整,与改进前的算法相比提高了任务规划成功率和规划解的质量,缩短了任务规划的时间。

主 题 词:多智能体强化学习 深空探测自主任务规划 近端策略优化 小天体附着 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.15982/j.issn.2096-9287.2024.20230159

馆 藏 号:203132420...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分