限定检索结果

检索条件"主题词=TORCS"
4 条 记 录,以下是1-10 订阅
视图:
排序:
改进DDPG算法在自动驾驶中的应用
收藏 引用
《计算机工程与应用》2019年 第10期55卷 264-270页
作者:张斌 何明 陈希亮 吴春晓 刘斌 周波中国人民解放军陆军工程大学指挥控制工程学院南京210002 军事科学院系统工程研究院网络信息研究所北京100071 
深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)作为深度强化学习中的经典算法,在连续控制问题上有着较大的优势,被应用于自动驾驶领域。针对DDPG缺少策略动作过滤导致的非法策略比例较高引起的训练效率低、收敛速...
来源:详细信息评论
DDPG算法在实现无人车快速控制的研究
收藏 引用
《自动化与仪表》2021年 第1期36卷 31-35页
作者:朱坚 宋晓茹 高嵩 高泽鹏西安工业大学电子信息工程学院西安710021 
大多传统的无人车控制算法需要人为调整参数,需要算法设计精确规则,无法快速适应多种情况。针对上述问题,该文采用深度强化学习对无人车的方向、速度和刹车三方面进行控制,让无人车自主学习,自主调参。该文重点通过改进OU噪声信号和设...
来源:详细信息评论
基于深度递归强化学习的无人自主驾驶策略研究
收藏 引用
《工业控制计算机》2020年 第4期33卷 61-63页
作者:李志航广东工业大学自动化学院广东广州510006 
提出了一种基于递深度递归强化学习的自动驾驶策略模型学习方法,并在torcs虚拟驾驶引擎进行仿真验真。针对Actor-Critic框架过估计和更新缓慢的问题,结合clipped double DQN,通过取最小估计值的方法缓解过估计的情况。为了获取多时刻状...
来源:详细信息评论
基于强化学习的无人驾驶仿真研究
收藏 引用
《农业装备与车辆工程》2020年 第6期58卷 102-106页
作者:孙嘉浩 陈劲杰上海理工大学机械电子学院上海市200093 
提出一种基于强化学习的无人驾驶仿真方案,采用Deep Q-Learning算法,设置经验池来对驾驶策略进行学习,设计了控制策略和动作策略来控制虚拟环境下的驾驶仿真。在无人驾驶仿真平台torcs上进行了仿真实验,对无人驾驶进行训练,训练结果验...
来源:详细信息评论
聚类工具 回到顶部