看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于解耦型MADDPG的无人机集群自主跟踪与避障 收藏
基于解耦型MADDPG的无人机集群自主跟踪与避障

基于解耦型MADDPG的无人机集群自主跟踪与避障

作     者:文超 董文瀚 解武杰 蔡鸣 胡多修 WEN Chao;DONG Wenhan;XIE Wujie;CAI Ming;HU Duoxiu

作者机构:空军工程大学陕西西安710038 

出 版 物:《飞行力学》 (Flight Dynamics)

年 卷 期:2022年第40卷第6期

页      码:24-31页

摘      要:考虑单无人机在复杂空域环境下对地面动目标执行跟踪任务的局限性,采用多智能体深度强化学习(MADRL)方法对无人机集群目标自主跟踪问题进行了研究。首先,基于随机博弈过程设计联合状态空间、动作空间和奖惩机制,并由此建立了无人机集群三维自主机动模型。其次,考虑MADRL的稀疏回报问题,设计了引导型奖励函数,增强了算法收敛性能。接着,为提高集群学习效率,设计了相应的解耦型奖励函数和神经网络结构,并采用解耦型多智能体深度确定性策略梯度(MADDPG)算法对模型进行自适应训练,以生成无人机集群自主跟踪与避障最优机动策略。最后,开展了仿真验证。结果表明:基于MADRL方法的无人机集群能更好地满足复杂空域环境下目标跟踪任务的需求;相比于MADDPG,解耦型MADDPG算法具有更强的准确性和实时性。

主 题 词:无人机集群 多智能体深度强化学习 自主跟踪 避障 随机博弈过程 

学科分类:08[工学] 081105[081105] 082503[082503] 0825[工学-环境科学与工程类] 0811[工学-水利类] 

D O I:10.13645/j.cnki.f.d.20220927.001

馆 藏 号:203115587...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分