文献详情 >深度确定性策略梯度算法用于无人飞行器控制收藏

深度确定性策略梯度算法用于无人飞行器控制

作者：黄旭柳嘉润贾晨辉王昭磊张隽 HUANG Xu;LIU Jiarun;JIA Chenhui;WANG Zhaolei;ZHANG Jun

作者机构：北京航天自动控制研究所北京100854 宇航智能控制技术国家级重点实验室北京100854

出版物：《航空学报》 (Acta Aeronautica et Astronautica Sinica)

年卷期：2021年第42卷第11期

页码：397-407页

摘要：对深度确定性策略梯度算法训练智能体学习小型无人飞行器的飞行控制策略进行了探索研究。以多数据帧的速度、位置和姿态角等信息作为智能体的观察状态,舵摆角和发动机推力指令作为智能体的输出动作,飞行器的非线性模型和飞行环境作为智能体的学习环境。智能体在与环境交互过程中除了获得包含误差信息的密集惩罚外,也有达成一定目标的稀疏奖励,该设计有效提高了飞行数据的样本多样性,增强了智能体的学习效率。最后智能体实现了从位置、速度和姿态角等信息到控制量的端到端飞行控制,并进行了变航迹点、模型参数拉偏、注入扰动和故障条件下的飞行控制仿真,结果表明智能体除了能有效完成训练任务外,还能应对多种训练时未学习的飞行任务,具有优秀的泛化能力和鲁棒性,该方法具有一定的研究价值和工程参考价值。

主题词：深度确定性策略梯度小型无人飞行器飞行控制端到端稀疏奖励

学科分类：08[工学] 081105[081105] 0811[工学-水利类]

核心收录：

D　O　I：10.7527/S1000-6893.2020.24688

馆藏号：203106574...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

深度确定性策略梯度算法用于无人飞行器控制

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

深度确定性策略梯度算法用于无人飞行器控制

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：