文献详情 >基于柔性演员-评论家算法的决策规划协同研究收藏

基于柔性演员-评论家算法的决策规划协同研究

作者：唐斌刘光耀江浩斌田宁米伟王春宏 TANG Bin;LIU Guangyao;JIANG Haobin;TIAN Ning;MI Wei;WANG Chunhong

作者机构：江苏大学汽车工程研究院江苏镇江212013 江苏罡阳转向系统有限公司江苏泰州225318

基　　金：国家自然科学基金(52225212) 江苏省六大人才高峰项目(2019-GDZB-084) 泰州市科技支撑计划项目(TG202307)

出版物：《交通运输系统工程与信息》 (Journal of Transportation Systems Engineering and Information Technology)

年卷期：2024年第24卷第2期

页码：105-113,187页

摘要：为了解决基于常规深度强化学习(Deep Reinforcement Learning, DRL)的自动驾驶决策存在学习速度慢、安全性及合理性较差的问题,本文提出一种基于柔性演员-评论家(Soft Actor-Critic,SAC)算法的自动驾驶决策规划协同方法,并将SAC算法与基于规则的决策规划方法相结合设计自动驾驶决策规划协同智能体。结合自注意力机制(Self Attention Mechanism, SAM)和门控循环单元(Gate Recurrent Unit, GRU)构建预处理网络;根据规划模块的具体实现方式设计动作空间;运用信息反馈思想设计奖励函数,给智能体添加车辆行驶条件约束,并将轨迹信息传递给决策模块,实现决策规划的信息协同。在CARLA自动驾驶仿真平台中搭建交通场景对智能体进行训练,并在不同场景中将所提出的决策规划协同方法与常规的基于SAC算法的决策规划方法进行比较,结果表明,本文所设计的自动驾驶决策规划协同智能体学习速度提高了25.10%,由其决策结果生成的平均车速更高,车速变化率更小,更接近道路期望车速,路径长度与曲率变化率更小。

主题词：智能交通自动驾驶柔性演员-评论家算法决策规划协同深度强化学习

学科分类：08[工学] 082303[082303] 082302[082302] 0823[工学-农业工程类]

核心收录：

D　O　I：10.16097/j.cnki.1009-6744.2024.02.011

馆藏号：203126121...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于柔性演员-评论家算法的决策规划协同研究

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于柔性演员-评论家算法的决策规划协同研究

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：