文献详情 >基于Q-Learning算法和神经网络的飞艇控制收藏

基于Q-Learning算法和神经网络的飞艇控制

作者：聂春雨祝明郑泽伟武哲 NIE Chunyu;ZHU Ming;ZHENG Zewei;WU Zhe

作者机构：北京航空航天大学航空科学与工程学院北京100083 北京航空航天大学自动化科学与电气工程学院北京100083

基　　金：国家自然科学基金(61503010) 中央高校基本科研业务费专项资金(YWF-14-RSC-103)

出版物：《北京航空航天大学学报》 (Journal of Beijing University of Aeronautics and Astronautics)

年卷期：2017年第43卷第12期

页码：2431-2438页

摘要：针对现代飞艇控制中动力学模型不确定性带来的系统建模和参数辨识工作较为复杂的问题,提出了一种基于自适应建模和在线学习机制的控制策略。设计了一种在分析实际运动的基础上建立飞艇控制马尔可夫决策过程(MDP)模型的方法,具有自适应性。采用Q-Learning算法进行在线学习并利用小脑模型关节控制器(CMAC)神经网络对动作值函数进行泛化加速。对本文方法进行仿真并与经过参数整定的PID控制器对比,验证了该控制策略的有效性。结果表明,在线学习过程能够在数小时内收敛,通过自适应方法建立的MDP模型能够满足常见飞艇控制任务的需求。本文所提控制器能够获得与PID控制器精度相当且更为智能的控制效果。

主题词：飞艇马尔可夫决策过程(MDP) 机器学习 Q-Learning 小脑模型关节控制器(CMAC)

学科分类：08[工学] 081105[081105] 082503[082503] 0825[工学-环境科学与工程类] 0811[工学-水利类]

核心收录：

D　O　I：10.13700/j.bh.1001-5965.2016.0903

馆藏号：203280956...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于Q-Learning算法和神经网络的飞艇控制

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于Q-Learning算法和神经网络的飞艇控制

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：