看过本文的还看了

相关文献

该作者的其他文献

文献详情 >复杂环境下的飞行器在线航路规划决策方法 收藏
复杂环境下的飞行器在线航路规划决策方法

复杂环境下的飞行器在线航路规划决策方法

作     者:杨志鹏 陈子浩 曾长 林松 毛金娣 张凯 YANG Zhipeng;CHEN Zihao;ZENG Chang;LIN Song;MAO Jindi;ZHANG Kai

作者机构:湖北航天技术研究院总体设计所湖北武汉430040 

基  金:国家自然科学基金(62003267)资助课题 

出 版 物:《系统工程与电子技术》 (Systems Engineering and Electronics)

年 卷 期:2024年第46卷第9期

页      码:3166-3175页

摘      要:针对飞行器在线航路规划问题,提出一种基于深度强化学习(deep reinforcement learning,DRL)的飞行器在线自主决策方法。首先对飞行器运动模型、探测模型进行了说明,然后采用DRL深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法,对飞行器飞行控制策略模型框架进行了构建。在此基础上,提出了一种基于课程学习(curriculum learning,CL)的CL-DDPG算法,将在线航路规划任务进行分解,引导飞行器进行目标靠近、威胁规避、航路寻优策略学习,并设置相应的高斯噪声帮助飞行器对策略进行探索和优化,实现了复杂场景下的飞行器自适应学习和决策控制。仿真实验证明,CL-DDPG算法能够有效提升模型的训练效率,算法模型任务成功率更高,具有优秀的泛化性和鲁棒性,能够更好地应用于复杂动态环境下的在线航路规划任务中。

主 题 词:在线航路规划 深度强化学习 自主决策 课程学习 威胁规避 

学科分类:08[工学] 081105[081105] 0804[工学-材料学] 0811[工学-水利类] 

核心收录:

D O I:10.12305/j.issn.1001-506X.2024.09.28

馆 藏 号:203138919...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分