限定检索结果

检索条件"主题词=TD3算法"
13 条 记 录,以下是1-10 订阅
视图:
排序:
基于td3算法的多智能体协作缓存策略
收藏 引用
《计算机工程》2025年 第2期51卷 365-374页
作者:曾建州 李泽平 张素勤贵州大学计算机科学与技术学院公共大数据国家重点实验室贵州贵阳550025 
为了降低移动边缘网络中的内容获取时延和传输开销,提出一种基于双延迟深度确定性策略梯度(td3)的多智能体协作缓存策略(MACC)。首先构建多智能体边缘缓存模型,将多节点缓存替换问题建模为部分可观测马尔可夫决策过程(POMDP),把相邻节...
来源:详细信息评论
基于改进型td3算法的车载边缘计算任务卸载决策
收藏 引用
《电子测量技术》2024年 第6期47卷 64-70页
作者:李亚 王卫岗 张原 刘瑞鹏河南理工大学物理与电子信息学院焦作454000 
为满足复杂车辆任务在时延、能耗和计算性能方面的要求,同时减少网络资源的竞争和消耗,设计了一种基于车载边缘计算(VEC)的任务卸载策略,以最小化任务处理延迟和能源消耗之间平衡的长期成本为目标,将车联网中的任务卸载问题建模为马尔...
来源:详细信息评论
td3算法在热电站温度调节中的研究与应用
收藏 引用
《现代工业经济和信息化》2024年 第12期14卷 123-125页
作者:刘欣中国核动力研究设计院四川成都610000 
针对某热电站在调控供热时的温度调节能力不佳的问题,设计了基于调整一次侧管网供水流量的热电站温度调节方案,研究了td3算法相较于DDPG算法的优越性,设计了基于td3算法的热力站温度调节控制流程。通过工业应用发现热电站的温度调节的...
来源:详细信息评论
基于td3算法的热管堆功率控制算法优化研究
收藏 引用
《舰船电子工程》2023年 第8期43卷 104-109页
作者:宋霄森 余刃 毛伟 殷少轩海军工程大学武汉430033 
核反应堆功率控制仍多采用PID控制算法,但其控制参数往往难以选择,也难以在不同功率水平下均保持最优的控制效果。论文针对热管冷却核反应堆的功率控制设计PID控制算法,并基于深度强化学习td3算法来实现对PID控制器的参数寻优。对比基...
来源:详细信息评论
低地球轨道下基于td3算法的通用轨道转移控制
收藏 引用
《软件工程》2024年 第9期27卷 6-9页
作者:曹海涛 邱鹏鹏 蔡霞浙江理工大学计算机科学与技术学院浙江杭州310018 
为应对低地球轨道下潜在的航天器脉冲式轨道转移任务挑战,提出一种用深度强化学习算法建立轨道转移通用控制模型的方法,以减少人工干预,解决反应不及时等问题。通过对轨道动力学的建模和对马尔可夫决策过程的设计,成功将td3(Twin Delaye...
来源:详细信息评论
改进td3算法在电机PID控制器中的应用
收藏 引用
《计算机系统应用》2024年 第5期33卷 262-270页
作者:张梦杰 陈姚节 邓江武汉科技大学计算机科学与技术学院武汉430081 
本文针对永磁同步电机(PMSM)在工业领域中的多变量、非线性和强耦合特性以及传统PID控制在应对其变化时可能导致参数调整困难、响应延迟、鲁棒性差以及适应性问题,提出一种结合双延迟深度确定性策略梯度(td3)算法和PID控制的创新方案,...
来源:详细信息评论
基于深度强化学习td3的PID参数自整定算法
收藏 引用
《武汉大学学报(工学版)》2024年 第11期57卷 1635-1643页
作者:梁杰 专祥涛 严家政武汉大学电气与自动化学院湖北武汉430072 武汉大学深圳研究院广东深圳518057 
传统的PID(proportional integral differential)算法在用于控制一些模型复杂、参数时变的对象时存在参数整定过程繁琐、控制性能不佳、无法解决控制对象实时变化状态的影响等问题。针对上述问题,提出了一种基于双延迟深度确定性策略梯...
来源:详细信息评论
基于改进td3的四足机器人非结构化地形运动控制
收藏 引用
《现代制造工程》2025年 第1期 33-41页
作者:谢子健 秦建军 曹钰北京建筑大学机电与车辆工程学院北京100044 北京市建筑安全监测工程技术研究中心北京100044 
四足机器人在非结构化地形的运动控制高度依赖于复杂的动力学模型和控制器设计,利用深度强化学习方法设计四足机器人控制器已成为趋势。针对在深度强化学习训练过程中收敛较慢、容易陷入局部最优解及计算资源消耗较大等问题,提出一种融...
来源:详细信息评论
基于深度强化学习的智能空战决策与仿真
收藏 引用
《航空学报》2023年 第4期44卷 94-107页
作者:周攀 黄江涛 章胜 刘刚 舒博文 唐骥罡中国空气动力研究与发展中心空天技术研究所绵阳621000 中国空气动力研究与发展中心绵阳621000 西北工业大学航空学院西安710072 
飞行器空战智能决策是当今世界各军事强国的研究热点。为解决近距空战博弈中无人机的机动决策问题,提出一种基于深度强化学习方法的无人机近距空战格斗自主决策模型。决策模型中,采取并改进了一种综合考虑攻击角度优势、速度优势、高度...
来源:详细信息评论
基于改进深度强化学习的HEV能量分配策略研究
收藏 引用
《计量学报》2023年 第12期44卷 1863-1871页
作者:吴忠强 马博岩燕山大学工业计算机控制工程河北省重点实验室河北秦皇岛066004 
以并联式混合动力汽车(HEV)为研究对象,建立整车需求功率及动力系统模型,提出一种基于改进深度强化学习(DRL)的能量分配策略。通过改进DRL中的双延迟深度确定性策略梯度(td3)算法,引入双重回放缓冲区,提出DRB-td3算法以提升原算法的采...
来源:详细信息评论
聚类工具 回到顶部