文献详情 >喷气驱动航天器姿态控制强化学习算法及实验收藏

喷气驱动航天器姿态控制强化学习算法及实验

作者：杜德嵩刘延芳袁秋帆赵福友齐乃明 DU Desong;LIU Yanfang;YUAN Qiufan;ZHAO Fuyou;QI Naiming

作者机构：哈尔滨工业大学航天学院哈尔滨150001 上海宇航系统工程研究所上海201109

基　　金：国家重点研发计划(2022YFB3902701) 国家自然科学基金(52272390) 黑龙江省自然科学基金优秀青年项目(YQ2022A009)

出版物：《宇航学报》 (Journal of Astronautics)

年卷期：2024年第45卷第6期

页码：903-913页

摘要：针对喷气驱动航天器在推力幅值受限条件下的姿态控制问题,提出一种姿态控制强化学习算法。该算法包含两个神经网络,即控制策略网络和李雅普诺夫神经网络。其中,控制策略网络直接以喷气推力器的推力作为输出,训练数据中推力满足幅值约束条件,隐式地解决推力分配优化和控制量饱和问题;设计姿态控制强化学习算法,并引入基于样本数据的航天器姿态稳定性定理,保证学习得到的控制策略的稳定性。仿真结果表明,与主流的强化学习算法和传统姿态控制方法相比,所提出的姿态控制算法在敏捷性方面表现出显著优势。此外,将控制策略移植到半物理仿真平台,控制策略能够有效完成航天器的大角度机动任务,从而证明了通过所提出的姿态控制算法训练得到的控制策略具有良好的泛化性和鲁棒性。

主题词：强化学习姿态控制李雅普诺夫函数半物理仿真

学科分类：08[工学] 081105[081105] 0811[工学-水利类]

核心收录：

D　O　I：10.3873/j.issn.1000-1328.2024.06.009

馆藏号：203128780...

维普期刊资源

读者评论与其他读者分享你的观点

学校读者

正在加载...

FontfaceFontSizeBoldItalicUnderlineBackColorAlignListLinkImgEmot

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

喷气驱动航天器姿态控制强化学习算法及实验

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

喷气驱动航天器姿态控制强化学习算法及实验

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：