看过本文的还看了

相关文献

该作者的其他文献

文献详情 >分层强化学习中的并行自动分层方法研究 收藏
分层强化学习中的并行自动分层方法研究

分层强化学习中的并行自动分层方法研究

作     者:沈晶 顾国昌 刘海波 SHEN Jing;GU Guo-chang;LIU Hai-bo

作者机构:哈尔滨工程大学计算机科学与技术学院黑龙江哈尔滨150001 

基  金:哈尔滨工程大学基础研究基金项目(HEUFT05021 HEUFT05068) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2007年第28卷第2期

页      码:422-424页

摘      要:为加快分层强化学习中任务层次结构的自动生成速度,提出了一种基于多智能体系统的并行自动分层方法,该方法以Sutton提出的Option分层强化学习方法为理论框架,首先由多智能体合作对状态空间进行并行探测并集中聚类产生状态子空间,然后多智能体并行学习生成各子空间上内部策略,最终生成Option。以二维有障碍栅格空间内两点间最短路径规划为任务背景给出了算法并进行了仿真实验和分析,结果表明,并行自动分层方法生成任务层次结构的速度明显快于以往的串行自动分层方法。本文的方法适用于空间探测、路径规划、追逃等类问题领域。

主 题 词:强化学习 免疫聚类 分层强化学习 并行自动分层 多智能体系统 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1000-7024.2007.02.058

馆 藏 号:203270685...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分