限定检索结果

检索条件"主题词=对话策略优化"
1 条 记 录,以下是1-10 订阅
视图:
排序:
改进的DDPG对话策略优化算法
收藏 引用
《计算机工程与设计》2021年 第2期42卷 411-418页
作者:赵崟江 李艳玲 林民内蒙古师范大学计算机科学技术学院内蒙古呼和浩特010022 
针对任务型对话系统缺少大规模真实训练数据的问题,提出一种结合规划的离散深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法来优化对话策略。在代理方面,改进经典DDPG训练算法中actor网络的输出结构和损失函数,使其...
来源:详细信息评论
聚类工具 回到顶部