看过本文的还看了

相关文献

该作者的其他文献

文献详情 >伯克利AI研究院利用反向课程学习,改善强化学习智能体 收藏
伯克利AI研究院利用反向课程学习,改善强化学习智能体

伯克利AI研究院利用反向课程学习,改善强化学习智能体

作     者:Wieland Brendel Jonas Rauber Matthias Bethge 

出 版 物:《机器人产业》 (Robot Industry)

年 卷 期:2018年第1期

页      码:58-62页

摘      要:众所周知,强化学习(RL)是一种强大的技术,它能够解决诸如移动(locomotion)、Atari游戏、赛车游戏以及机器人操作等复杂的任务,而这些全部是通过在一个奖励函数上训练智能体以其优化行为实现的。但是,对于许多任务来说,我们很难设计一个既容易训练又能产生理想行为的奖励函数。

主 题 词:智能体 起始位置 强化学习 AI 奖励函数 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.3969/j.issn.2096-0182.2018.01.011

馆 藏 号:203282374...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分