看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度强化学习与高度速率反馈的再入制导方法 收藏
基于深度强化学习与高度速率反馈的再入制导方法

基于深度强化学习与高度速率反馈的再入制导方法

作     者:武天才 王宏伦 刘一恒 任斌 余跃 WU Tiancai;WANG Honglun;LIU Yiheng;REN Bin;YU Yue

作者机构:北京航空航天大学自动化科学与电气工程学院北京100191 北京航空航天大学高等理工学院北京100191 北京航空航天大学飞行器控制一体化技术重点实验室北京100191 北京航天自动控制研究所北京100854 

基  金:航空基金(2018ZC51031) 北京航空航天大学未来空天技术学院/高等理工学院卓越研究基金(230121205) 

出 版 物:《无人系统技术》 (Unmanned Systems Technology)

年 卷 期:2022年第5卷第4期

页      码:1-13页

摘      要:为解决具有高升阻比的高超声速飞行器在再入制导中高度存在的周期性振荡现象,提出了一种基于深度强化学习和高度速率反馈的再入制导方法。所提方法以传统预测校正制导方法为基础,进行攻角、初始倾侧角幅值和倾侧角符号指令的求取。接着,引入高度速率反馈进行倾侧角幅值补偿量的求取,来抑制高度存在的周期性振荡现象。其中,针对反馈增益的设计问题,采用深度强化学习方法进行解决:首先,构建以所提制导算法为基础的深度强化学习训练环境;然后,采用深度确定性策略梯度算法进行离线训练;最后,提取出训练好的动作网络,与所提制导算法结合进行在线使用,实现反馈增益的实时调整与倾侧角幅值补偿量的实时求取。通过对比仿真和蒙特卡洛仿真可以发现飞行器终端位置、速度和高度误差分别保持在10 km、100 m/s和2 km范围内,验证所提方法的有效性。所提方法可为进一步研究复杂环境中深度强化学习方法直接生成指导指令提供参考。

主 题 词:高超声速飞行器 预测校正制导 平稳滑翔 深度强化学习 深度确定性策略梯度 

学科分类:08[工学] 081105[081105] 0811[工学-水利类] 

D O I:10.19942/j.issn.2096-5915.2022.4.033

馆 藏 号:203114472...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分