文献详情 >基于改进近端策略优化的空战自主决策研究收藏

基于改进近端策略优化的空战自主决策研究

作者：钱殿伟齐红敏刘振周志明易建强 Qian Dianwei;Qi Hongmin;Liu Zhen;Zhou Zhiming;Yi Jianqiang

作者机构：华北电力大学控制与计算机工程学院北京102206 中国科学院自动化研究所北京100190

出版物：《系统仿真学报》 (Journal of System Simulation)

年卷期：2024年第36卷第9期

页码：2208-2218页

摘要：针对传统强化学习在空战自主决策应用中信息冗余度高、收敛速度慢等问题,提出一种基于双重观测与复合奖励的近端策略优化空战自主决策算法。设计了以交互信息为主、个体特征信息为辅的双重观测信息,降低战场信息高度冗余对训练效率的影响;设计了结果奖励和过程奖励相结合的复合奖励函数,提高了训练过程收敛速度;采用广义优势函数估计,改进了近端策略优化算法,提高优势函数估计的准确性。仿真结果表明:在对战固定程控对手和矩阵博弈对手实验场景中,该算法决策模型均可根据战场态势准确进行自主决策,完成空战任务。

主题词：强化学习空战自主决策双重观测复合奖励广义优势函数估计

学科分类：08[工学] 080203[080203] 0802[工学-机械学]

核心收录：

D　O　I：10.16182/j.issn1004731x.joss.23-0584

馆藏号：203122604...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于改进近端策略优化的空战自主决策研究

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于改进近端策略优化的空战自主决策研究

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：