看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型 收藏
基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型

基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型

作     者:张明恒 吕新飞 万星 吴增文 ZHANG Mingheng;Lü Xinfei;WAN Xing;WU Zengwen

作者机构:大连理工大学工业装备结构分析国家重点实验室辽宁大连116024 大连理工大学汽车工程学院辽宁大连116024 

基  金:国家自然科学基金资助项目(51675077) 中国博士后科学基金资助项目(2015M581329,2017T100178) 

出 版 物:《大连理工大学学报》 (Journal of Dalian University of Technology)

年 卷 期:2022年第62卷第1期

页      码:77-84页

摘      要:优良的可靠性、学习效率和模型泛化能力是车辆自动驾驶系统研究的基本要求.基于深度强化学习理论框架提出了一种用于车辆自动驾驶决策的WGAIL-DDPG(λ)(Wasserstein generative adversarial nets-deep deterministic policy gradient(λ))模型.其中,基于驾驶安全性、稳定性的车辆行驶性能要求,对强化学习模型中的奖励函数进行了针对性设计;通过引入模仿学习有效提升了强化学习过程中的学习效率;通过合理的增益调度器设计,保证了从模仿学习到强化学习的平稳过渡.实验结果表明,在稳定性上,智能体偏离道路中线的程度一直在30%内波动;在安全性上,智能体与周边其他车辆的安全距离基本保持在10 m以上;在模型泛化性方面,智能体在许多未训练过的复杂弯道也能很好地完成安全、平稳的驾驶任务;与原始DDPG(deep deterministic policy gradient)算法相比,该模型在学习速度上提升了约3.4倍,说明所提出的模型在保证自动驾驶系统可靠决策的同时有效提升了强化学习的效率,进一步实验证明其适用于不同的驾驶条件.

主 题 词:自动驾驶决策 深度强化学习 模仿学习 深度确定性策略梯度算法 

学科分类:08[工学] 082304[082304] 080204[080204] 0802[工学-机械学] 0823[工学-农业工程类] 

核心收录:

D O I:10.7511/dllgxb202201010

馆 藏 号:203107176...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分