文献详情 >强化学习算法研究收藏

强化学习算法研究

作者：刘忠李海红刘全 LIU Zhong;LI Hai-hong;LIU Quan

作者机构：苏州大学计算机科学与技术学院江苏苏州215006 浙江工业大学信息学院浙江杭州310014 南京大学软件新技术国家重点实验室江苏南京210093

基　　金：国家自然科学基金项目(60473003、60673092) 中国博士后科研基金项目(20060390919) 江苏省高校自然科学基金项目(06KJB520104) 江苏省博士后科研基金项目(060211C)

出版物：《计算机工程与设计》 (Computer Engineering and Design)

年卷期：2008年第29卷第22期

页码：5805-5809页

摘要：针对智能Agent运动中普遍存在的避障问题,结合强化学习具有的试错和环境交互获得在某状态下选择动作的策略以及无导师在线学习等特性。在介绍强化学习的原理、分类以及主要算法(TD(λ)、Q_learning、Dyna、Prioritized Sweeping、Sarsa)的基础上,对TD(λ)、Q_learning的算法进行分析,并将其应用到实验中。实验结果表明,强化学习中的、TD(λ)Q_learning等算法在不同情况下都能高效地解决避障等问题。

主题词：强化学习 Q学习 Agent智能体机器人控制避障搜索引擎

学科分类：12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类]

D　O　I：10.16208/j.issn1000-7024.2008.22.073

馆藏号：203732896...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

强化学习算法研究

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

强化学习算法研究

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：