限定检索结果

检索条件"主题词=奖励设计"
6 条 记 录,以下是1-10 订阅
视图:
排序:
面向动态三维迷宫的综合奖励设计
收藏 引用
《计算机应用研究》2024年 第6期41卷 1699-1703页
作者:焦昌成 王少威武汉科技大学计算机科学与技术学院 武汉科技大学机器人与智能系统研究院武汉430065 智能信息处理与实时工业系统湖北省重点实验室武汉430065 
动态三维迷宫是较为困难的、具有不确定性和不完全信息的强化学习任务环境,使用常规奖励函数在此环境中训练任务,速度缓慢甚至可能无法完成。为解决利用强化学习在动态迷宫中寻找多目标的问题,提出一种基于事件触发的综合奖励方案。该...
来源:详细信息评论
基于奖励设计视角的激励负效应国外研究述评与展望
收藏 引用
《领导科学》2017年 第1Z期 31-34页
作者:张威振 杜立之兰州理工大学经济管理学院 
激励措施可以激发员工的工作热情,但也可能产生挤出效应、策略博弈和社会比较成本等负面效应,与管理者初衷背道而驰。对国外研究成果进行整理、分析激励负效应表现形式及产生原因可以发现,产生负效应的根源在于奖励设计不合理,奖励设计...
来源:详细信息评论
弹性光网络中基于DRL的RMSA算法
收藏 引用
《光通信技术》2024年 第3期48卷 57-63页
作者:侯临风 何荣希 吴梓敬大连海事大学信息科学技术学院辽宁大连116026 
为了更好地解决弹性光网络(EON)的路由、调制格式与频谱分配(RMSA)问题,进一步降低网络阻塞率,提出一种基于深度强化学习(DRL)的RMSA算法。该算法在奖励设计中将考虑影响RMSA决策的资源占用度和频谱邻接度这2个指标,以鼓励智能体优先选...
来源:详细信息评论
基于深度强化学习的C+L波段弹性光网络频谱分配算法
收藏 引用
《光通信技术》2024年 第3期48卷 23-29页
作者:晏丹 冯楠 左晓博 沈凌飞 任丹萍 胡劲华 赵继军河北工程大学信息与电气工程学院河北邯郸056038 河北工程大学河北省安防信息感知与处理重点实验室河北邯郸056038 中国电子科技集团公司第五十四研究所石家庄050081 河北省光子信息技术与应用重点实验室石家庄050081 
针对C+L波段弹性光网络中受激喇曼散射(SRS)效应导致物理层损伤加剧的问题,提出一种基于深度强化学习(DRL)自适应调制格式的频谱分配算法,在路由阶段,采用K最短路由算法为业务请求预计算K条最短备选路径;在波段、调制格式与频谱分配阶段...
来源:详细信息评论
国家治理进程中激励机制的转型与建构
收藏 引用
《南京师大学报(社会科学版)》2017年 第6期 39-46页
作者:成婧南京大学政府管理学院 江苏省社会科学院 
国家治理过程中激励机制是解释发展的重要变量。我国激励机制的建构是以体制、制度、文化为支撑的,结合国家发展目标与个人理性诉求的利益兼容性激励模式。这一模式中,国家维度的目标设定与官员维度的奖励设计是激励机制的核心。从以魅...
来源:详细信息评论
科研生产企业短期奖励体系研究——以某通讯产品研发生产企业为例
收藏 引用
《中国人力资源开发》2006年 第7期23卷 76-80页
作者:张光进 廖建桥华中科技大学 
奖励是调动员工工作积极性的常用方法。本文在对CE公司短期奖励效果不佳原因分析的基础上,设计了短期奖励菜单并对菜单中各奖励项目进行了阐述,以充分体现短期奖励的可操作性和激励性。
来源:详细信息评论
聚类工具 回到顶部