限定检索结果

检索条件"主题词=A2C"
2 条 记 录,以下是1-10 订阅
视图:
排序:
结合a2c和手牌估值方法的麻将博弈研究
收藏 引用
《重庆理工大学学报(自然科学)》2024年 第5期38卷 154-161页
作者:衣御寒 王亚杰 吴燕燕 刘松 张兴慧 蒋传禹沈阳航空航天大学工程训练中心沈阳110136 
针对大众麻将中对手牌信息利用不充分的问题,提出了手牌估值方法,并设计了基础麻将程序(MJE)。为进一步提升麻将AI的博弈能力,使用深度强化学习方法设计了麻将AI(MJE-RL)。首先,通过MJE自对弈生成深度学习的训练数据。其次,根据训练集...
来源:详细信息评论
基于注意力时空卷积和a2c的虚拟机主动容错优先迁移决策
收藏 引用
《计算机应用研究》2023年 第12期40卷 3606-3613页
作者:党伟超 武婷玉太原科技大学计算机科学与技术学院太原030024 
针对边缘云环境的自动化和分布式特性、高度不可靠性及易变的工作负载问题,提出基于注意力时空卷积和a2c的虚拟机主动容错优先迁移决策模型AST-a2c。首先,采用带有注意力机制的长短期记忆网络(LSTM)提取各主机的时序特征,根据时序特征...
来源:详细信息评论
聚类工具 回到顶部