看过本文的还看了

相关文献

该作者的其他文献

文献详情 >多智能体同时到达多目标点的协同强化学习算法 收藏
多智能体同时到达多目标点的协同强化学习算法

多智能体同时到达多目标点的协同强化学习算法

作     者:李瑞群 王若冰 田涛 郑重 张越 Li Ruiqun;Wang Ruobing;Tian Tao;Zheng Zhong;Zhang Yue

作者机构:中国航天系统科学与工程研究院北京100048 航天宏康智能科技(北京)有限公司北京100048 

基  金:广东省科技厅应用型研发基金专项“水资源大数据综合应用平台研发及产业化”(2016B010127005) 

出 版 物:《计算机应用与软件》 (Computer Applications and Software)

年 卷 期:2021年第38卷第9期

页      码:199-204页

摘      要:针对动态未知环境下多智能体多目标协同问题,为实现在动态未知环境下多个智能体能够同时到达所有目标点,设计函数式奖励函数,对强化学习算法进行改进。智能体与环境交互,不断重复“探索-学习-决策”过程,在与环境的交互中积累经验并优化策略,在未预先分配目标点的情况下,智能体通过协同决策,能够避开环境中的静态障碍物和动态障碍物,同时到达所有目标点。仿真结果表明,该算法相比现有多智能体协同方法的学习速度平均提高约42.86%,同时智能体能够获得更多的奖励,可以做到自主决策自主分配目标,并且实现同时到达所有目标点的目标。

主 题 词:多智能体 多目标 同时到达 协同避障 强化学习 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1000-386x.2021.09.031

馆 藏 号:203104880...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分