限定检索结果

检索条件"主题词=复合奖励"
1 条 记 录,以下是1-10 订阅
视图:
排序:
基于改进近端策略优化的空战自主决策研究
收藏 引用
《系统仿真学报》2024年 第9期36卷 2208-2218页
作者:钱殿伟 齐红敏 刘振 周志明 易建强华北电力大学控制与计算机工程学院北京102206 中国科学院自动化研究所北京100190 
针对传统强化学习在空战自主决策应用中信息冗余度高、收敛速度慢等问题,提出一种基于双重观测与复合奖励的近端策略优化空战自主决策算法。设计了以交互信息为主、个体特征信息为辅的双重观测信息,降低战场信息高度冗余对训练效率的影...
来源:详细信息评论
聚类工具 回到顶部