文献详情 >多智能体同时到达多目标点的协同强化学习算法收藏

多智能体同时到达多目标点的协同强化学习算法

作者：李瑞群王若冰田涛郑重张越 Li Ruiqun;Wang Ruobing;Tian Tao;Zheng Zhong;Zhang Yue

作者机构：中国航天系统科学与工程研究院北京100048 航天宏康智能科技(北京)有限公司北京100048

基　　金：广东省科技厅应用型研发基金专项“水资源大数据综合应用平台研发及产业化”(2016B010127005)

出版物：《计算机应用与软件》 (Computer Applications and Software)

年卷期：2021年第38卷第9期

页码：199-204页

摘要：针对动态未知环境下多智能体多目标协同问题,为实现在动态未知环境下多个智能体能够同时到达所有目标点,设计函数式奖励函数,对强化学习算法进行改进。智能体与环境交互,不断重复“探索-学习-决策”过程,在与环境的交互中积累经验并优化策略,在未预先分配目标点的情况下,智能体通过协同决策,能够避开环境中的静态障碍物和动态障碍物,同时到达所有目标点。仿真结果表明,该算法相比现有多智能体协同方法的学习速度平均提高约42.86%,同时智能体能够获得更多的奖励,可以做到自主决策自主分配目标,并且实现同时到达所有目标点的目标。

主题词：多智能体多目标同时到达协同避障强化学习

学科分类：12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类]

D　O　I：10.3969/j.issn.1000-386x.2021.09.031

馆藏号：203104880...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

多智能体同时到达多目标点的协同强化学习算法

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

多智能体同时到达多目标点的协同强化学习算法

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：