文献详情 >基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型收藏

基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型

作者：张明恒吕新飞万星吴增文 ZHANG Mingheng;Lü Xinfei;WAN Xing;WU Zengwen

作者机构：大连理工大学工业装备结构分析国家重点实验室辽宁大连116024 大连理工大学汽车工程学院辽宁大连116024

基　　金：国家自然科学基金资助项目(51675077) 中国博士后科学基金资助项目(2015M581329,2017T100178)

出版物：《大连理工大学学报》 (Journal of Dalian University of Technology)

年卷期：2022年第62卷第1期

页码：77-84页

摘要：优良的可靠性、学习效率和模型泛化能力是车辆自动驾驶系统研究的基本要求.基于深度强化学习理论框架提出了一种用于车辆自动驾驶决策的WGAIL-DDPG(λ)(Wasserstein generative adversarial nets-deep deterministic policy gradient(λ))模型.其中,基于驾驶安全性、稳定性的车辆行驶性能要求,对强化学习模型中的奖励函数进行了针对性设计;通过引入模仿学习有效提升了强化学习过程中的学习效率;通过合理的增益调度器设计,保证了从模仿学习到强化学习的平稳过渡.实验结果表明,在稳定性上,智能体偏离道路中线的程度一直在30%内波动;在安全性上,智能体与周边其他车辆的安全距离基本保持在10 m以上;在模型泛化性方面,智能体在许多未训练过的复杂弯道也能很好地完成安全、平稳的驾驶任务;与原始DDPG(deep deterministic policy gradient)算法相比,该模型在学习速度上提升了约3.4倍,说明所提出的模型在保证自动驾驶系统可靠决策的同时有效提升了强化学习的效率,进一步实验证明其适用于不同的驾驶条件.

主题词：自动驾驶决策深度强化学习模仿学习深度确定性策略梯度算法

学科分类：08[工学] 082304[082304] 080204[080204] 0802[工学-机械学] 0823[工学-农业工程类]

核心收录：

D　O　I：10.7511/dllgxb202201010

馆藏号：203107176...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：