文献检索-宁波市创意产业特色资源库

限定检索结果

基于改进近端策略优化的空战自主决策研究: 收藏
分享
引用; 《系统仿真学报》2024年第9期36卷 2208-2218页; 作者：钱殿伟齐红敏刘振周志明易建强华北电力大学控制与计算机工程学院北京102206 中国科学院自动化研究所北京100190; 针对传统强化学习在空战自主决策应用中信息冗余度高、收敛速度慢等问题,提出一种基于双重观测与复合奖励的近端策略优化空战自主决策算法。设计了以交互信息为主、个体特征信息为辅的双重观测信息,降低战场信息高度冗余对训练效率的影...; 针对传统强化学习在空战自主决策应用中信息冗余度高、收敛速度慢等问题,提出一种基于双重观测与复合奖励的近端策略优化空战自主决策算法。设计了以交互信息为主、个体特征信息为辅的双重观测信息,降低战场信息高度冗余对训练效率的影响;设计了结果奖励和过程奖励相结合的复合奖励函数,提高了训练过程收敛速度;采用广义优势函数估计,改进了近端策略优化算法,提高优势函数估计的准确性。仿真结果表明:在对战固定程控对手和矩阵博弈对手实验场景中,该算法决策模型均可根据战场态势准确进行自主决策,完成空战任务。; 来源：详细信息评论

限定检索结果