文献详情 >伯克利AI研究院利用反向课程学习,改善强化学习智能体收藏

伯克利AI研究院利用反向课程学习,改善强化学习智能体

作者：Wieland Brendel Jonas Rauber Matthias Bethge

出版物：《机器人产业》 (Robot Industry)

年卷期：2018年第1期

页码：58-62页

摘要：众所周知,强化学习（RL）是一种强大的技术,它能够解决诸如移动（locomotion）、Atari游戏、赛车游戏以及机器人操作等复杂的任务,而这些全部是通过在一个奖励函数上训练智能体以其优化行为实现的。但是,对于许多任务来说,我们很难设计一个既容易训练又能产生理想行为的奖励函数。

主题词：智能体起始位置强化学习 AI 奖励函数

学科分类：12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类]

D　O　I：10.3969/j.issn.2096-0182.2018.01.011

馆藏号：203282374...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

伯克利AI研究院利用反向课程学习,改善强化学习智能体

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

伯克利AI研究院利用反向课程学习,改善强化学习智能体

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：