限定检索结果

检索条件"机构=“高雄中山大学”电机系"
1 条 记 录,以下是1-10 订阅
视图:
排序:
基于自注意力机制和策略映射重组的多智能体强化学习算法
收藏 引用
《计算机学报》2022年 第9期45卷 1842-1858页
作者:李静晨 史豪斌 黄国胜西北工业大学计算机学院西安710072 “高雄中山大学”电机系中国高雄0008 
多智能体强化学习(Multi-Agent Reinforcement Learning,MARL)在群体控制领域中被广泛应用,但由于单个智能体的马尔可夫决策模型被破坏,现有的MARL算法难以学习到最优策略,且训练中智能体的随机性会导致策略不稳定.本文从状态空间到行...
来源:详细信息评论
聚类工具 回到顶部