看过本文的还看了

相关文献

该作者的其他文献

文献详情 >强化学习算法研究 收藏
强化学习算法研究

强化学习算法研究

作     者:刘忠 李海红 刘全 LIU Zhong;LI Hai-hong;LIU Quan

作者机构:苏州大学计算机科学与技术学院江苏苏州215006 浙江工业大学信息学院浙江杭州310014 南京大学软件新技术国家重点实验室江苏南京210093 

基  金:国家自然科学基金项目(60473003、60673092) 中国博士后科研基金项目(20060390919) 江苏省高校自然科学基金项目(06KJB520104) 江苏省博士后科研基金项目(060211C) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2008年第29卷第22期

页      码:5805-5809页

摘      要:针对智能Agent运动中普遍存在的避障问题,结合强化学习具有的试错和环境交互获得在某状态下选择动作的策略以及无导师在线学习等特性。在介绍强化学习的原理、分类以及主要算法(TD(λ)、Q_learning、Dyna、Prioritized Sweeping、Sarsa)的基础上,对TD(λ)、Q_learning的算法进行分析,并将其应用到实验中。实验结果表明,强化学习中的、TD(λ)Q_learning等算法在不同情况下都能高效地解决避障等问题。

主 题 词:强化学习 Q学习 Agent智能体 机器人控制 避障 搜索引擎 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2008.22.073

馆 藏 号:203732896...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分