看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于柔性演员-评论家算法的决策规划协同研究 收藏
基于柔性演员-评论家算法的决策规划协同研究

基于柔性演员-评论家算法的决策规划协同研究

作     者:唐斌 刘光耀 江浩斌 田宁 米伟 王春宏 TANG Bin;LIU Guangyao;JIANG Haobin;TIAN Ning;MI Wei;WANG Chunhong

作者机构:江苏大学汽车工程研究院江苏镇江212013 江苏罡阳转向系统有限公司江苏泰州225318 

基  金:国家自然科学基金(52225212) 江苏省六大人才高峰项目(2019-GDZB-084) 泰州市科技支撑计划项目(TG202307) 

出 版 物:《交通运输系统工程与信息》 (Journal of Transportation Systems Engineering and Information Technology)

年 卷 期:2024年第24卷第2期

页      码:105-113,187页

摘      要:为了解决基于常规深度强化学习(Deep Reinforcement Learning, DRL)的自动驾驶决策存在学习速度慢、安全性及合理性较差的问题,本文提出一种基于柔性演员-评论家(Soft Actor-Critic,SAC)算法的自动驾驶决策规划协同方法,并将SAC算法与基于规则的决策规划方法相结合设计自动驾驶决策规划协同智能体。结合自注意力机制(Self Attention Mechanism, SAM)和门控循环单元(Gate Recurrent Unit, GRU)构建预处理网络;根据规划模块的具体实现方式设计动作空间;运用信息反馈思想设计奖励函数,给智能体添加车辆行驶条件约束,并将轨迹信息传递给决策模块,实现决策规划的信息协同。在CARLA自动驾驶仿真平台中搭建交通场景对智能体进行训练,并在不同场景中将所提出的决策规划协同方法与常规的基于SAC算法的决策规划方法进行比较,结果表明,本文所设计的自动驾驶决策规划协同智能体学习速度提高了25.10%,由其决策结果生成的平均车速更高,车速变化率更小,更接近道路期望车速,路径长度与曲率变化率更小。

主 题 词:智能交通 自动驾驶 柔性演员-评论家算法 决策规划协同 深度强化学习 

学科分类:08[工学] 082303[082303] 082302[082302] 0823[工学-农业工程类] 

核心收录:

D O I:10.16097/j.cnki.1009-6744.2024.02.011

馆 藏 号:203126121...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分