看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进深度强化学习算法的行为决策方法 收藏
基于改进深度强化学习算法的行为决策方法

基于改进深度强化学习算法的行为决策方法

作     者:贾瑞豪 JIA Ruihao

作者机构:长安大学汽车学院陕西西安710064 

出 版 物:《汽车实用技术》 (Automobile Applied Technology)

年 卷 期:2025年第50卷第1期

页      码:25-30页

摘      要:针对传统深度强化学习算法因训练时探索策略差导致在自动驾驶决策任务中同时出现行驶效率低、收敛慢和决策成功率低的问题,提出了结合专家评价的深度竞争双Q网络的决策方法。提出离线专家模型和在线模型,在两者间引入自适应平衡因子;引入自适应重要性系数的优先经验回放机制在竞争深度Q网络的基础上搭建在线模型;设计了考虑行驶效率、安全性和舒适性的奖励函数。结果表明,该算法相较于D3QN、PERD3QN在收敛速度上分别提高了25.93%和20.00%,决策成功率分别提高了3.19%和2.77%,平均步数分别降低了6.40%和0.14%,平均车速分别提升了7.46%与0.42%。

主 题 词:自动驾驶 行为决策 深度强化学习 模仿学习 改进DQN算法 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 082304[082304] 08[工学] 080204[080204] 0835[0835] 0802[工学-机械学] 0811[工学-水利类] 0812[工学-测绘类] 0823[工学-农业工程类] 

D O I:10.16638/j.cnki.1671-7988.2025.001.005

馆 藏 号:203156534...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分