限定检索结果

检索条件"主题词=DDPG"
22 条 记 录,以下是1-10 订阅
视图:
排序:
ddpg方法在抖振约束下变弯度翼型/机翼设计的应用研究
收藏 引用
《应用数学和力学》2024年 第1期45卷 45-60页
作者:周思历 孙刚 王聪复旦大学航空航天系上海200433 
变弯度技术可以提升巡航多升力系数工况下的升阻性能,对于提高整段巡航的经济效益具有重要意义.构造了光滑连续的流动分离函数约束翼型抖振性能,结合变弯度技术与人工神经网络代理模型搭建了某机翼截面翼型的巡航多升力系数工况优化模型...
来源:详细信息评论
基于深度强化学习的SCR脱硝系统协同控制策略研究
收藏 引用
《动力工程学报》2024年 第5期44卷 802-809页
作者:赵征 刘子涵华北电力大学控制与计算机工程学院河北保定071003 
针对选择性催化还原(SCR)脱硝系统大惯性、多扰动等特点,提出了一种基于多维状态信息和分段奖励函数优化的深度确定性策略梯度(ddpg)协同比例积分微分(PID)控制器的控制策略。针对SCR脱硝系统中存在部分可观测马尔可夫决策过程(POMDP),...
来源:详细信息评论
低压配电台区柔性互联系统多目标ddpg优化调度
收藏 引用
《智慧电力》2024年 第6期52卷 62-70页
作者:刘文军 李帅虎 马瑞 何书耘国网湖南省电力有限公司经济技术研究院湖南长沙410007 能源互联网供需运营湖南省重点实验室湖南长沙410007 长沙理工大学电气与信息工程学院湖南长沙410114 
针对配电台区柔性互联系统(DSAFIS)中源、荷、设备强不确定性,及台区间功率互济特性,提出基于深度确定性策略梯度(ddpg)的台区运行成本、新能源消纳、负载均衡目标协调优化调度方法。构建系统模型与物理系统自动联动的深度强化学习日前...
来源:详细信息评论
基于ddpg的四旋翼无人机姿态控制
收藏 引用
《指挥控制与仿真》2024年 第2期46卷 115-121页
作者:黄希杰陆军指挥学院江苏南京210045 
针对未知环境下四旋翼无人机姿态控制实现难、鲁棒性差等问题,提出了基于深度确定性策略(ddpg)算法的智能姿态控制方法。首先,基于欧拉-庞卡莱方程,利用计算机符号推导,建立四旋翼的动力学模型;其次,基于ddpg算法设计四旋翼的姿态控制器...
来源:详细信息评论
基于强化学习的智能车避障决策算法
收藏 引用
《电子设计工程》2024年 第12期32卷 181-186页
作者:宋倩 蓝俊欢 罗富贵 李明珍河池学院大数据与计算机学院广西河池546300 广西电网有限责任公司河池供电局广西河池546300 
针对当下智能车避障多采用建立地图模型和路径规划方法,其建模参数契合度较低的问题,提出一种基于强化学习的智能车避障决策算法。在未知动态环境中,构建了智能车自主避障决策的网络模型,考虑优先级的相互避障决策行为。在TORCS仿真平...
来源:详细信息评论
基于深度强化学习的投资组合构建方法
收藏 引用
《智能计算机与应用》2024年 第8期14卷 85-90页
作者:李彬 潘乔 阎希平东华大学计算机科学与技术学院上海201620 上海兆前投资有限公司上海201107 
传统基于数据分析的投资组合构建方法使用简单的统计学模型,不仅难以发现市场规律,且在处理大量数据时效率不高。而深度强化学习算法具备强大的数据处理和分析能力,能够通过学习自适应调整策略,从海量金融数据中提取出有效信息,处理复...
来源:详细信息评论
基于ddpg的无人机追捕任务泛化策略设计
收藏 引用
《西北工业大学学报》2022年 第1期40卷 47-55页
作者:符小卫 徐哲 王辉西北工业大学电子信息学院陕西西安710129 
无人机追逃对抗问题是当今空战领域的研究热点,传统解决方案对此问题存在诸多限制,如模型难以适应复杂动态环境从而快速做出决策、对不同任务场景泛化性较差等问题。基于ddpg(deep deterministic policy gradient)算法设计了无人机追逃...
来源:详细信息评论
航母甲板上舰载机的混合避障和仿真
收藏 引用
《系统仿真学报》2023年 第3期35卷 592-603页
作者:薛均晓 孔祥燕 董博威 陶浩 管海洋 石磊 徐明亮郑州大学网络空间安全学院河南郑州450002 郑州大学计算机与人工智能学院河南郑州450001 中国船舰研究设计中心湖北武汉430064 
针对航母甲板上舰载机混合避障随机性强、实时性差、规划速度慢等问题,结合最小二乘法与ddpg(deep deterministic policy gradient)算法提出一种Pddpg(predictive depth deterministic policy gradient)算法。该方法利用最小二乘法预测...
来源:详细信息评论
一种基于ddpg算法的6轴机械臂控制研究
收藏 引用
《重庆理工大学学报:自然科学》2023年 第9期37卷 134-140页
作者:何联格 李天华 聂远航 妥吉英重庆理工大学汽车零部件先进制造技术教育部重点实验室重庆400054 北京信息科技大学现代测控技术教育部重点实验室北京100192 重庆青山工业有限责任公司重庆402761 
针对传统控制算法在复杂环境下,精度低、稳定性不足等问题,提出了一种基于深度确定策略梯度算法(deep deterministic policy gradient,ddpg)的控制算法,以更好地解决6轴机械臂在三维空间中的控制难题。在MuJoCo平台上建立仿真环境,引入...
来源:详细信息评论
基于MRD-ddpg的机械臂避障路径规划方法
收藏 引用
《组合机床与自动化加工技术》2023年 第7期 41-45页
作者:付子强 郑威强 张立萍 何丽 袁亮 邵明明新疆大学机械工程学院乌鲁木齐830047 北京化工大学信息科学与技术学院北京100029 
提出将MRD-ddpg算法应用在机械臂避障路径规划上,解决了ddpg算法在训练过程中学习效率低、样本利用率低的问题。首先,在ddpg算法的基础上,通过改进经验池机制,提出多经验池延迟采样的深度确定性策略梯度(multi-replay buffer delay samp...
来源:详细信息评论
聚类工具 回到顶部