限定检索结果

检索条件"主题词=追逃对抗"
3 条 记 录,以下是1-10 订阅
视图:
排序:
基于改进强化学习的多智能体追逃对抗
收藏 引用
《浙江大学学报(工学版)》2023年 第8期57卷 1479-1486,1515页
作者:薛雅丽 叶金泽 李寒雁南京航空航天大学自动化学院江苏南京211106 
针对多智能体问题,提出基于优先经验回放和解耦奖励函数的多智能体强化学习算法.将多智能体深度确定性策略梯度算法(MADDPG)和双延迟-确定策略梯度算法(TD3)相结合,提出多智能体双延迟-确定策略梯度算法(MATD3).针对多智能体问...
来源:详细信息评论
基于微分对策的追逃对抗仿真
收藏 引用
《飞行力学》2014年 第4期32卷 372-375页
作者:车竞 郑凤麒中国空气动力研究与发展中心计算空气动力研究所四川绵阳621000 
微分对策理论是建立空战决策的重要手段。建立了基于极小值原理的导弹、飞机纵向平面追逃对抗问题的微分对策数学模型,采用梯度迭代法数值求解该问题,针对两类性能指标下的微分对策模型,在双方不同的最大机动能力条件下进行了数值仿真...
来源:详细信息评论
基于DDPG的无人机捕任务泛化策略设计
收藏 引用
《西北工业大学学报》2022年 第1期40卷 47-55页
作者:符小卫 徐哲 王辉西北工业大学电子信息学院陕西西安710129 
无人机追逃对抗问题是当今空战领域的研究热点,传统解决方案对此问题存在诸多限制,如模型难以适应复杂动态环境从而快速做出决策、对不同任务场景泛化性较差等问题。基于DDPG(deep deterministic policy gradient)算法设计了无人机...
来源:详细信息评论
聚类工具 回到顶部