看过本文的还看了

相关文献

该作者的其他文献

文献详情 >计算机博弈中估值算法与博弈训练的研究 收藏
计算机博弈中估值算法与博弈训练的研究

计算机博弈中估值算法与博弈训练的研究

作     者:吕艳辉 宫瑞敏 LV Yan-hui;GONG Rui-min

作者机构:沈阳理工大学信息科学与工程学院沈阳110159 

基  金:国家自然科学基金资助项目(60873010) 新世纪优秀人才支持计划基金资助项目(NCET-05-0288) 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2012年第38卷第11期

页      码:163-166页

摘      要:计算机博弈程序难以处理局面估值问题。为此,结合时间差分算法和反向传播神经网络,设计一种局面估值算法BP-TD(),实现估值函数参数的自动调整。为提高博弈训练的性能,针对开局和中局,提出分阶段设置参数值的策略。以五子棋为应用背景,实现博弈系统RenjuTD。实验结果表明,该算法可使程序的博弈水平得到较大提高。

主 题 词:计算机博弈 差分学习 反向传播神经网络 估值算法 增强学习 博弈训练 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1000-3428.2012.11.050

馆 藏 号:203633517...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分