看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于鲁棒观测器的深度强化学习垂直起降运载器姿态稳定研究 收藏
基于鲁棒观测器的深度强化学习垂直起降运载器姿态稳定研究

基于鲁棒观测器的深度强化学习垂直起降运载器姿态稳定研究

作     者:李彦铃 罗飞舟 葛致磊 LI Yanling;LUO Feizhou;GE Zhilei

作者机构:西北工业大学航天学院陕西西安710072 中国运载火箭技术研究院北京100076 

出 版 物:《系统工程与电子技术》 (Systems Engineering and Electronics)

年 卷 期:2024年第46卷第3期

页      码:1038-1047页

摘      要:针对考虑弹性振动、模型不确定干扰下的垂直起降运载器姿态稳定问题,将鲁棒观测器和深度强化学习中的近端策略优化算法相结合,研究了一种基于鲁棒观测器的近端策略优化(robust observer-based proximal policy optimization,ROB-PPO)方法。该方法设计鲁棒观测器重构受弹性振动干扰的运载器姿态信息,将鲁棒观测器与运载器动力学模型组成环境,将鲁棒观测器得到的重构姿态作为深度强化学习算法的状态,使得深度强化学习智能体与之不断交互,从而训练智能体控制运载器姿态稳定。仿真结果表明,所研究的ROB-PPO算法相较于目前常用的自适应模糊比例-积分-微分(proportional-integral-derivative,PID)算法鲁棒性更强,收敛速度更快。最后,在自主研制的垂直起降运载器上验证了所提出算法有效性。

主 题 词:垂直起降运载器 姿态控制 鲁棒观测器 深度强化学习 

学科分类:08[工学] 081105[081105] 0811[工学-水利类] 

核心收录:

D O I:10.12305/j.issn.1001-506X.2024.03.30

馆 藏 号:203126122...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分