看过本文的还看了

相关文献

该作者的其他文献

文献详情 >深度确定性策略梯度算法用于无人飞行器控制 收藏
深度确定性策略梯度算法用于无人飞行器控制

深度确定性策略梯度算法用于无人飞行器控制

作     者:黄旭 柳嘉润 贾晨辉 王昭磊 张隽 HUANG Xu;LIU Jiarun;JIA Chenhui;WANG Zhaolei;ZHANG Jun

作者机构:北京航天自动控制研究所北京100854 宇航智能控制技术国家级重点实验室北京100854 

基  金:国家自然科学基金(61773341) 

出 版 物:《航空学报》 (Acta Aeronautica et Astronautica Sinica)

年 卷 期:2021年第42卷第11期

页      码:397-407页

摘      要:对深度确定性策略梯度算法训练智能体学习小型无人飞行器的飞行控制策略进行了探索研究。以多数据帧的速度、位置和姿态角等信息作为智能体的观察状态,舵摆角和发动机推力指令作为智能体的输出动作,飞行器的非线性模型和飞行环境作为智能体的学习环境。智能体在与环境交互过程中除了获得包含误差信息的密集惩罚外,也有达成一定目标的稀疏奖励,该设计有效提高了飞行数据的样本多样性,增强了智能体的学习效率。最后智能体实现了从位置、速度和姿态角等信息到控制量的端到端飞行控制,并进行了变航迹点、模型参数拉偏、注入扰动和故障条件下的飞行控制仿真,结果表明智能体除了能有效完成训练任务外,还能应对多种训练时未学习的飞行任务,具有优秀的泛化能力和鲁棒性,该方法具有一定的研究价值和工程参考价值。

主 题 词:深度确定性策略梯度 小型无人飞行器 飞行控制 端到端 稀疏奖励 

学科分类:08[工学] 081105[081105] 0811[工学-水利类] 

核心收录:

D O I:10.7527/S1000-6893.2020.24688

馆 藏 号:203106574...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分