限定检索结果

检索条件"主题词=DDPG"
22 条 记 录,以下是11-20 订阅
视图:
排序:
燃料电池电动汽车改进深度强化学习能量管理
收藏 引用
《河南科技大学学报(自然科学版)》2023年 第4期44卷 41-48,I0003页
作者:付主木 龚慧贤 宋书中 陶发展 孙昊琛河南科技大学信息工程学院河南洛阳471023 河南科技大学河南省机器人与智能系统重点实验室河南洛阳471023 
针对配置有燃料电池、锂电池和超级电容3能量源的混合动力汽车,提出一种基于改进深度确定性策略梯度(ddpg)算法的分层能量管理策略,以降低氢耗、提高燃料电池工作效率及维持锂电池荷电状态(SoC)。首先,采用基于模糊规则的自适应低通滤...
来源:详细信息评论
基于深度强化学习的移动机器人路径规划优化
收藏 引用
《组合机床与自动化加工技术》2023年 第4期 36-39,45页
作者:罗国攀 张国良 李德胜四川轻化工大学自动化与信息工程学院宜宾644000 四川轻化工大学人工智能四川省重点实验室宜宾644000 
针对动态环境下深度确定性策略梯度学习(ddpg)的路径规划算法收敛速度慢、避障策略不佳等问题,提出了使用基于多步期望时序差分法的深度确定性策略梯度学习改进优化方案。首先,采用n步期望时序差分法求解最优策略,解决训练决策函数不佳...
来源:详细信息评论
基于ddpg的柔性伺服系统级联陷波器设计
收藏 引用
《微电机》2022年 第5期55卷 40-44,61页
作者:钟靖龙 宋宝 刘永兴 徐必业华中科技大学机械科学与工程学院武汉430074 广东拓斯达科技股份有限公司广东东莞523822 
针对柔性伺服系统的多频谐振抑制问题,提出一种基于ddpg的级联陷波器参数整定方法。以系统速度环开环bode图及陷波器bode图预处理结果作为训练数据,并以相位裕度作为奖励函数训练神经网络,实现所设计的伺服系统级联陷波器深度及宽度参...
来源:详细信息评论
基于ddpg算法的混动铲运机能量管理策略研究
收藏 引用
《有色金属(矿山部分)》2023年 第6期75卷 116-127页
作者:姜华 战凯 郭鑫 姜勇 赵晓燕北矿机电科技有限责任公司北京100160 北京矿冶研究总院北京100160 北京科技大学机械工程学院北京100083 
目前混合动力铲运机能量管理策略通常为基于规则的策略,为了进一步优化铲运机的燃油经济性与系统能量稳定性,首次将深度确定性策略梯度(ddpg)算法应用于混合动力铲运机的能量管理策略,针对铲运机高频率循环、短时大功率输出的特点,协调...
来源:详细信息评论
基于ddpg的爬塔机器人越障决策控制方法研究
收藏 引用
《传动技术》2023年 第4期37卷 7-13页
作者:宁涵雪 张伟军上海交通大学机械与动力工程学院上海200240 
使用爬塔机器人完成高压输电铁塔的检修维护任务,要求机器人具有适应不同障碍环境的自动爬塔能力。不同铁塔的障碍大小、分布存在差异,传统预设逻辑的控制方法难以适应这种多样性,因此,提出了基于ddpg的越障控制方法。ddpg算法会根据机...
来源:详细信息评论
基于深度强化学习的无人机飞行控制训练系统构建研究
收藏 引用
《自动化技术与应用》2023年 第10期42卷 20-23,166页
作者:李延波 李光天津七一二通信广播股份有限公司天津300462 
无人机智能化训练过程需要与实际环境进行交互,设计基于X-Plane的深度强化学习训练系统,可以实现无人机飞行控制、空战仿真推演、智能算法评估功能,同时系统实现采用ddpg算法的F-18战斗机平稳飞行试验,形成一套完整的无人机智能化训练...
来源:详细信息评论
基于深度确定性策略梯度算法的四旋翼控制器自主导航方法研究
收藏 引用
《机电工程技术》2022年 第10期51卷 149-152页
作者:阚亚雄 赵飞镇江高等专科学校现代装备制造学院江苏镇江212028 镇江高等专科学校电气与信息学院江苏镇江212028 
自主导航作为四旋翼无人机飞行导航的核心问题,为了更好地优化四旋翼无人机自主导航路径规划和路径跟踪能力,采用了一种基于改进的深度确定性策略梯度算法的机器学习算法(ddpg)的四旋翼无人机自主导航跟踪控制器,算法中增加了对动作探...
来源:详细信息评论
基于深度强化学习的追逃博弈算法
收藏 引用
《航天控制》2018年 第6期36卷 3-8,19页
作者:谭浪 巩庆海 王会霞北京航天自动控制研究所北京100854 宇航智能控制技术国家级重点实验室北京100854 
在未来的局部战争中,导弹攻防对抗将成为一个重要的作战样式。用智能小车的追逃来模拟导弹攻防对抗过程,并以深度确定性策略梯度(Deep Deterministic Policy Gradient,ddpg)算法为原型,以视距和视线角为状态,借鉴PID控制思想设计回报函...
来源:详细信息评论
一种深度强化学习的机械臂控制方法
收藏 引用
《河南科技大学学报(自然科学版)》2021年 第3期42卷 19-24,M0003页
作者:姬周珂 徐巧玉 王军委 李坤鹏河南科技大学机电工程学院河南洛阳471003 洛阳银杏科技有限公司河南洛阳471003 
针对工业液压机械臂末端控制精度受惯性和摩擦等因素影响的问题,提出了一种基于深度强化学习的机械臂控制方法。首先,在机器人操作系统环境下搭建仿真机械臂并进行控制和通信模块设计。然后,对深度确定性策略梯度(ddpg)算法中的Actor-Cr...
来源:详细信息评论
基于ddpg算法的无人车辆防碰撞控制策略
收藏 引用
《武汉理工大学学报》2021年 第10期43卷 68-76页
作者:赖金萍 李浩 石英 徐腊梅 闫浩武汉理工大学自动化学院武汉430070 天津港信息技术发展有限公司天津3004563 
目前,强化学习在无人驾驶领域得到了广泛应用,但是如何提高无人车辆的稳定性并满足在不同工况中同时完成路径跟踪和车辆避障的要求依旧是一个难题。针对无人车辆路径跟踪与避障功能需求,提出一种基于深度确定梯度策略(Deep Deterministi...
来源:详细信息评论
聚类工具 回到顶部