文献详情 >基于逆向强化学习的纵向自动驾驶决策方法收藏

基于逆向强化学习的纵向自动驾驶决策方法

作者：高振海闫相同高菲 Gao Zhenhai;Yan Xiangtong;Gao Fei

作者机构：吉林大学汽车仿真与控制国家重点实验室长春130022

基　　金：国家重点研发计划项目(2017YFB0102601) 国家自然科学基金(51775236,U1564214)资助

出版物：《汽车工程》 (Automotive Engineering)

年卷期：2022年第44卷第7期

页码：969-975页

摘要：基于人类驾驶员数据获得自动驾驶决策策略是当前自动驾驶技术研究的热点。经典的强化学习决策方法大多通过设计安全性、舒适性、经济性相关公式人为构建奖励函数,决策策略与人类驾驶员相比仍然存在较大差距。本文中使用最大边际逆向强化学习算法,将驾驶员驾驶数据作为专家演示数据,建立相应的奖励函数,并实现仿驾驶员的纵向自动驾驶决策。仿真测试结果表明:相比于强化学习方法,逆向强化学习方法的奖励函数从驾驶员的数据中自动化的提取,降低了奖励函数的建立难度,得到的决策策略与驾驶员的行为具有更高的一致性。

主题词：自动驾驶决策算法强化学习逆向强化学习

学科分类：08[工学] 082304[082304] 080204[080204] 0802[工学-机械学] 0811[工学-水利类] 0812[工学-测绘类] 0823[工学-农业工程类]

核心收录：

D　O　I：10.19562/j.chinasae.qcgc.2022.07.003

馆藏号：203113755...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于逆向强化学习的纵向自动驾驶决策方法

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于逆向强化学习的纵向自动驾驶决策方法

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：