限定检索结果

检索条件"主题词=指数移动平均"
1 条 记 录,以下是1-10 订阅
视图:
排序:
基于多重指数移动平均评估的DDPG算法
收藏 引用
《计算机工程与设计》2021年 第11期42卷 3084-3090页
作者:范晶晶 陈建平 傅启明 陆悠 吴宏杰苏州科技大学电子与信息工程学院江苏苏州215009 苏州科技大学江苏省建筑智慧节能重点实验室江苏苏州215009 苏州科技大学苏州市移动网络技术与应用重点实验室江苏苏州215009 苏州科技大学苏州市虚拟现实智能交互及应用技术重点实验室江苏苏州215009 珠海米枣智能科技有限公司科研部广东珠海519000 
针对深度确定性策略梯度算法中双网络结构的不稳定及单评论家评估不准确的问题,提出基于多重指数移动平均评估的DDPG算法。介绍EMA-Q网络和目标Q网络合作得出目标更新值,对多个评论家给出的Q值求平均,降低单评论家评估的不准确性。样本...
来源:详细信息评论
聚类工具 回到顶部