看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于组合神经网络的Sarsa(λ)学习算法 收藏
基于组合神经网络的Sarsa(λ)学习算法

基于组合神经网络的Sarsa(λ)学习算法

作     者:殷苌茗 付超红 薛丽华 李立云 YIN Chang-ming;FU Chao-hong;XUE Li-hua;LI Li-yun

作者机构:长沙理工大学计算机与通信工程学院湖南长沙410076 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2008年第29卷第22期

页      码:5817-5819,5823页

摘      要:标准的Sarsa(λ)算法对状态空间的要求是离散的且空间较小,而实际问题中很多系统的状态空间是连续的或尽管是离散的但空间较大,这就需要很大的内存来存储状态动作对。为此提出组合神经网络,首先用自组织映射(SOM)神经网络对状态空间进行自适应量化,然后在此基础上用BP网络拟合Q函数。该方法实现了Sarsa(λ)算法在连续和大规模状态空间的泛化。最后,实验结果表明了该方法的有效性。

主 题 词:组合神经网络 强化学习 自组织映射 BP网络 Sarsa算法 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2008.22.075

馆 藏 号:203357236...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分