T=题名(书名、题名),A=作者(责任者),K=主题词,P=出版物名称,PU=出版社名称,O=机构(作者单位、学位授予单位、专利申请人),L=中图分类号,C=学科分类号,U=全部字段,Y=年(出版发行年、学位年度、标准发布年)
AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
范例一:(K=图书馆学 OR K=情报学) AND A=范并思 AND Y=1982-2016
范例二:P=计算机应用与软件 AND (U=C++ OR U=Basic) NOT K=Visual AND Y=2011-2016
摘要:针对再入过程中的禁飞区规避和拦截弹躲避问题,提出一种考虑规避与突防的高超声速飞行器智能容错制导控制一体化设计方法。首先,在纵向制导中,为了提升飞行器的制导性能,基于制导控制一体化设计思想,采用包含姿态容错控制系统的飞行器六自由度模型进行待飞航程的预测;针对随之产生的计算耗时问题,进一步采用深度网络进行预测环节的拟合,以提升算法的实时性;接着,在侧向制导中,为了解决禁飞区规避和拦截弹躲避问题,引入扰动流体动态系统(IFDS)算法进行考虑威胁因素的飞行器期望航向角计算,并结合航向角误差走廊和倾侧角翻转逻辑进行侧向制导指令的求取,使飞行器具备规避与突防能力;然后,考虑到飞行环境的复杂性、飞行器再入段机动能力的差异性和姿态容错控制系统动态特性对制导性能的影响,结合深度强化学习算法进行智能体训练,使其可根据飞行器实时状态进行扰动流体动态系统算法参数的在线决策,提升所提方法的有效性和适应能力。最后,由半物理对比仿真和蒙特卡罗仿真结果可知,所提方法具有较强的规避、突防与制导性能。
摘要:为解决具有高升阻比的高超声速飞行器在再入制导中高度存在的周期性振荡现象,提出了一种基于深度强化学习和高度速率反馈的再入制导方法。所提方法以传统预测校正制导方法为基础,进行攻角、初始倾侧角幅值和倾侧角符号指令的求取。接着,引入高度速率反馈进行倾侧角幅值补偿量的求取,来抑制高度存在的周期性振荡现象。其中,针对反馈增益的设计问题,采用深度强化学习方法进行解决:首先,构建以所提制导算法为基础的深度强化学习训练环境;然后,采用深度确定性策略梯度算法进行离线训练;最后,提取出训练好的动作网络,与所提制导算法结合进行在线使用,实现反馈增益的实时调整与倾侧角幅值补偿量的实时求取。通过对比仿真和蒙特卡洛仿真可以发现飞行器终端位置、速度和高度误差分别保持在10 km、100 m/s和2 km范围内,验证所提方法的有效性。所提方法可为进一步研究复杂环境中深度强化学习方法直接生成指导指令提供参考。
地址:宁波市钱湖南路8号浙江万里学院(315100)
Tel:0574-88222222
招生:0574-88222065 88222066
Email:yzb@zwu.edu.cn