看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于半马氏博弈模型的分层强化学习研究 收藏
基于半马氏博弈模型的分层强化学习研究

基于半马氏博弈模型的分层强化学习研究

作     者:李誌 胡坤 余雪丽 LI Zhi;HU Kun;YU Xue-li

作者机构:太原理工大学计算机科学与技术学院山西太原030024 

基  金:国家自然科学基金项目(60873139) 山西省自然科学基金项目(2008011040) 虚拟技术与系统国家重点实验室基金项目(SKVR-KF-09-04) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2012年第33卷第9期

页      码:3558-3562页

摘      要:针对多Agent强化学习研究中面临的非马尔可夫环境和维数灾难问题,提出了一种半马氏博弈模型和MAHRL(multi-agent hierarchical reinforcement learning)协同框架。该模型弱化了系统对外界环境的要求,引入了随机时间步和通信策略的概念,更符合MAHRL研究的实际情况;协同框架中分别用SMG和SMDP模型对不同子任务进行建模,明确了Agent之间的协同机制。通过实验证明了SMG模型和协同框架的有效性和优越性。

主 题 词:多Agent强化学习 分层强化学习 部分感知 半马氏博弈模型 协同框架 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1000-7024.2012.09.059

馆 藏 号:203903893...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分