文献详情 >基于MADDPG的多无人机协同任务决策收藏

基于MADDPG的多无人机协同任务决策

作者：李波越凯强甘志刚高佩忻 LI Bo;YUE Kai-qiang;GAN Zhi-gang;GAO Pei-xin

基　　金：国家自然科学基金(61573285,62003267) 陕西省自然科学基金(2020JQ-220) 航空科学基金(2017ZC53021) 数据链技术重点实验室开放基金(CLDL-20182101)

出版物：《宇航学报》 (Journal of Astronautics)

年卷期：2021年第42卷第6期

页码：757-765页

摘要：针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了MADDPG算法的模型结构。最后通过仿真实验,并对比深度确定性策略梯度(DDPG)算法,验证了本文提出的MADDPG算法在保证精度的基础上,学习速度大幅度提高,弥补了传统强化学习算法在多智能体领域的不足。

主题词：无人机任务决策深度强化学习策略梯度多智能体

学科分类：08[工学] 0826[工学-生物医学工程类] 0802[工学-机械学] 0825[工学-环境科学与工程类] 0704[理学-天文学类]

核心收录：

D　O　I：10.3873/j.issn.1000-1328.2021.06.009

馆藏号：203104523...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于MADDPG的多无人机协同任务决策

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于MADDPG的多无人机协同任务决策

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：