文献检索-宁波市创意产业特色资源库

限定检索结果

检索条件"主题词=追逃对抗"

共 3 条记录，以下是1-10 订阅

全选清除本页清除全部题录导出标记到"检索档案"

视图：

排序：

基于改进强化学习的多智能体追逃对抗: 收藏
分享
引用; 《浙江大学学报（工学版）》2023年第8期57卷 1479-1486,1515页; 作者：薛雅丽叶金泽李寒雁南京航空航天大学自动化学院江苏南京211106; 针对多智能体追逃问题,提出基于优先经验回放和解耦奖励函数的多智能体强化学习算法.将多智能体深度确定性策略梯度算法(MADDPG)和双延迟-确定策略梯度算法(TD3)相结合,提出多智能体双延迟-确定策略梯度算法(MATD3).针对多智能体追逃问...; 针对多智能体追逃问题,提出基于优先经验回放和解耦奖励函数的多智能体强化学习算法.将多智能体深度确定性策略梯度算法(MADDPG)和双延迟-确定策略梯度算法(TD3)相结合,提出多智能体双延迟-确定策略梯度算法(MATD3).针对多智能体追逃问题中奖励函数存在大量稀疏奖励的问题,提出利用优先经验回放方法确定经验优先度以及采样高价值经验.设计解耦奖励函数,将奖励函数分为个体奖励和联合奖励以最大化全局奖励和局部奖励,提出DEPER-MATD3算法.基于此算法设计仿真实验,并与其他算法对比,实验结果表明,该算法有效解决了过估计问题,且耗时相比MATD3算法有所减少.在解耦奖励函数环境下该算法训练的追击者的全局平均奖励升高,追击者有更大的概率追击到逃逸者.; 来源：详细信息评论

基于微分对策的追逃对抗仿真: 收藏
分享
引用; 《飞行力学》2014年第4期32卷 372-375页; 作者：车竞郑凤麒中国空气动力研究与发展中心计算空气动力研究所四川绵阳621000; 微分对策理论是建立空战决策的重要手段。建立了基于极小值原理的导弹、飞机纵向平面追逃对抗问题的微分对策数学模型,采用梯度迭代法数值求解该问题,针对两类性能指标下的微分对策模型,在双方不同的最大机动能力条件下进行了数值仿真...; 微分对策理论是建立空战决策的重要手段。建立了基于极小值原理的导弹、飞机纵向平面追逃对抗问题的微分对策数学模型,采用梯度迭代法数值求解该问题,针对两类性能指标下的微分对策模型,在双方不同的最大机动能力条件下进行了数值仿真。结果表明,为了尽快击中或摆脱对方,双方均以最大能力机动,其模型和仿真结果可用于空战双方武器性能、制导控制设计的评估,以及最优空战决策的研究。; 来源：详细信息评论

基于DDPG的无人机追捕任务泛化策略设计: 收藏
分享
引用; 《西北工业大学学报》2022年第1期40卷 47-55页; 作者：符小卫徐哲王辉西北工业大学电子信息学院陕西西安710129; 无人机追逃对抗问题是当今空战领域的研究热点,传统解决方案对此问题存在诸多限制,如模型难以适应复杂动态环境从而快速做出决策、对不同任务场景泛化性较差等问题。基于DDPG(deep deterministic policy gradient)算法设计了无人机追逃...; 无人机追逃对抗问题是当今空战领域的研究热点,传统解决方案对此问题存在诸多限制,如模型难以适应复杂动态环境从而快速做出决策、对不同任务场景泛化性较差等问题。基于DDPG(deep deterministic policy gradient)算法设计了无人机追逃对抗策略;在此基础上,设计多种逃逸无人机的对抗机动策略,利用课程学习思想,在DDPG的训练过程中逐步提高逃逸无人机的智能程度,从而递进式地训练追捕无人机的对抗策略。仿真结果表明,相较于直接进行训练,利用课程学习的方法所训练的追捕无人机的追捕策略能够更快收敛,并能更好地执行对敌机的追捕任务,且能够适用于具有多种对抗机动策略的敌机,有效地提升了无人机追逃对抗决策模型的泛化性。; 来源：详细信息评论

全选清除本页清除全部题录导出标记到“检索档案”

共1页<< <1> >>

聚类工具回到顶部