文献详情 >基于深度强化学习与高度速率反馈的再入制导方法收藏

基于深度强化学习与高度速率反馈的再入制导方法

作者：武天才王宏伦刘一恒任斌余跃 WU Tiancai;WANG Honglun;LIU Yiheng;REN Bin;YU Yue

作者机构：北京航空航天大学自动化科学与电气工程学院北京100191 北京航空航天大学高等理工学院北京100191 北京航空航天大学飞行器控制一体化技术重点实验室北京100191 北京航天自动控制研究所北京100854

基　　金：航空基金(2018ZC51031) 北京航空航天大学未来空天技术学院/高等理工学院卓越研究基金(230121205)

出版物：《无人系统技术》 (Unmanned Systems Technology)

年卷期：2022年第5卷第4期

页码：1-13页

摘要：为解决具有高升阻比的高超声速飞行器在再入制导中高度存在的周期性振荡现象,提出了一种基于深度强化学习和高度速率反馈的再入制导方法。所提方法以传统预测校正制导方法为基础,进行攻角、初始倾侧角幅值和倾侧角符号指令的求取。接着,引入高度速率反馈进行倾侧角幅值补偿量的求取,来抑制高度存在的周期性振荡现象。其中,针对反馈增益的设计问题,采用深度强化学习方法进行解决:首先,构建以所提制导算法为基础的深度强化学习训练环境;然后,采用深度确定性策略梯度算法进行离线训练;最后,提取出训练好的动作网络,与所提制导算法结合进行在线使用,实现反馈增益的实时调整与倾侧角幅值补偿量的实时求取。通过对比仿真和蒙特卡洛仿真可以发现飞行器终端位置、速度和高度误差分别保持在10 km、100 m/s和2 km范围内,验证所提方法的有效性。所提方法可为进一步研究复杂环境中深度强化学习方法直接生成指导指令提供参考。

主题词：高超声速飞行器预测校正制导平稳滑翔深度强化学习深度确定性策略梯度

学科分类：08[工学] 081105[081105] 0811[工学-水利类]

D　O　I：10.19942/j.issn.2096-5915.2022.4.033

馆藏号：203114472...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于深度强化学习与高度速率反馈的再入制导方法

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于深度强化学习与高度速率反馈的再入制导方法

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：