文献检索-宁波市创意产业特色资源库

面向动态三维迷宫的综合奖励设计: 收藏
分享
引用; 《计算机应用研究》2024年第6期41卷 1699-1703页; 作者：焦昌成王少威武汉科技大学计算机科学与技术学院武汉科技大学机器人与智能系统研究院武汉430065 智能信息处理与实时工业系统湖北省重点实验室武汉430065; 动态三维迷宫是较为困难的、具有不确定性和不完全信息的强化学习任务环境,使用常规奖励函数在此环境中训练任务,速度缓慢甚至可能无法完成。为解决利用强化学习在动态迷宫中寻找多目标的问题,提出一种基于事件触发的综合奖励方案。该...; 动态三维迷宫是较为困难的、具有不确定性和不完全信息的强化学习任务环境,使用常规奖励函数在此环境中训练任务,速度缓慢甚至可能无法完成。为解决利用强化学习在动态迷宫中寻找多目标的问题,提出一种基于事件触发的综合奖励方案。该方案将三维迷宫中各种行为状态表达为各种事件,再由事件驱动奖励。奖励分为环境奖励和内部奖励,其中环境奖励与三维迷宫任务直接相关,含有体现任务目标的节点奖励和任务约束的约束奖励。内部奖励与智能体学习过程中的状态感受相关,含有判断奖励和心情奖励。在实验中,综合奖励的性能均值相较于改进奖励提升54.66%。结果表明,综合奖励方案在提高完成任务满意度、增强探索能力、提升训练效率方面具有优势。; 来源：详细信息评论

基于奖励设计视角的激励负效应国外研究述评与展望: 收藏
分享
引用; 《领导科学》2017年第1Z期 31-34页; 作者：张威振杜立之兰州理工大学经济管理学院; 激励措施可以激发员工的工作热情,但也可能产生挤出效应、策略博弈和社会比较成本等负面效应,与管理者初衷背道而驰。对国外研究成果进行整理、分析激励负效应表现形式及产生原因可以发现,产生负效应的根源在于奖励设计不合理,奖励设计...; 激励措施可以激发员工的工作热情,但也可能产生挤出效应、策略博弈和社会比较成本等负面效应,与管理者初衷背道而驰。对国外研究成果进行整理、分析激励负效应表现形式及产生原因可以发现,产生负效应的根源在于奖励设计不合理,奖励设计维度的特点及其与激励负效应之间的关系值得深入探讨。企业在构建自己的奖励方案时,可结合自身特点选取合理的奖励维度,进而降低产生激励负效应的可能性。; 来源：详细信息评论

弹性光网络中基于DRL的RMSA算法: 收藏
分享
引用; 《光通信技术》2024年第3期48卷 57-63页; 作者：侯临风何荣希吴梓敬大连海事大学信息科学技术学院辽宁大连116026; 为了更好地解决弹性光网络(EON)的路由、调制格式与频谱分配(RMSA)问题,进一步降低网络阻塞率,提出一种基于深度强化学习(DRL)的RMSA算法。该算法在奖励设计中将考虑影响RMSA决策的资源占用度和频谱邻接度这2个指标,以鼓励智能体优先选...; 为了更好地解决弹性光网络(EON)的路由、调制格式与频谱分配(RMSA)问题,进一步降低网络阻塞率,提出一种基于深度强化学习(DRL)的RMSA算法。该算法在奖励设计中将考虑影响RMSA决策的资源占用度和频谱邻接度这2个指标,以鼓励智能体优先选择资源占用度低、频谱邻接度高的路径来建立光路,并对比该算法与其它算法在不同网络中的性能。仿真结果表明:与几种典型的DRL算法相比,所提算法的网络阻塞率更低。; 来源：详细信息评论

基于深度强化学习的C+L波段弹性光网络频谱分配算法: 收藏
分享
引用; 《光通信技术》2024年第3期48卷 23-29页; 作者：晏丹冯楠左晓博沈凌飞任丹萍胡劲华赵继军河北工程大学信息与电气工程学院河北邯郸056038 河北工程大学河北省安防信息感知与处理重点实验室河北邯郸056038 中国电子科技集团公司第五十四研究所石家庄050081 河北省光子信息技术与应用重点实验室石家庄050081; 针对C+L波段弹性光网络中受激喇曼散射(SRS)效应导致物理层损伤加剧的问题,提出一种基于深度强化学习(DRL)自适应调制格式的频谱分配算法,在路由阶段,采用K最短路由算法为业务请求预计算K条最短备选路径;在波段、调制格式与频谱分配阶段...; 针对C+L波段弹性光网络中受激喇曼散射(SRS)效应导致物理层损伤加剧的问题,提出一种基于深度强化学习(DRL)自适应调制格式的频谱分配算法,在路由阶段,采用K最短路由算法为业务请求预计算K条最短备选路径;在波段、调制格式与频谱分配阶段,采用DRL进行智能化决策,并结合了2种奖励函数,以降低网络阻塞率并提高频谱使用效率。仿真结果表明,该算法能够有效降低阻塞率并提高频谱利用率。; 来源：详细信息评论

国家治理进程中激励机制的转型与建构: 收藏
分享
引用; 《南京师大学报（社会科学版）》2017年第6期 39-46页; 作者：成婧南京大学政府管理学院江苏省社会科学院; 国家治理过程中激励机制是解释发展的重要变量。我国激励机制的建构是以体制、制度、文化为支撑的,结合国家发展目标与个人理性诉求的利益兼容性激励模式。这一模式中,国家维度的目标设定与官员维度的奖励设计是激励机制的核心。从以魅...; 国家治理过程中激励机制是解释发展的重要变量。我国激励机制的建构是以体制、制度、文化为支撑的,结合国家发展目标与个人理性诉求的利益兼容性激励模式。这一模式中,国家维度的目标设定与官员维度的奖励设计是激励机制的核心。从以魅力型权威为依托的政治忠诚到以科层制理性为依托的绩效追求再到多元激励目标的形成,激励机制的目标设定是随着治理环境和治理语境的改变而转型的;而从精神奖励到财政奖励再到晋升奖励的转型,激励机制中的奖励设计则为国家治理中不同历史时期的官员行为提供了不同的策略性动机和动力。; 来源：详细信息评论

科研生产企业短期奖励体系研究——以某通讯产品研发生产企业为例: 收藏
分享
引用; 《中国人力资源开发》2006年第7期23卷 76-80页; 作者：张光进廖建桥华中科技大学; 奖励是调动员工工作积极性的常用方法。本文在对CE公司短期奖励效果不佳原因分析的基础上,设计了短期奖励菜单并对菜单中各奖励项目进行了阐述,以充分体现短期奖励的可操作性和激励性。; 奖励是调动员工工作积极性的常用方法。本文在对CE公司短期奖励效果不佳原因分析的基础上,设计了短期奖励菜单并对菜单中各奖励项目进行了阐述,以充分体现短期奖励的可操作性和激励性。; 来源：详细信息评论

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

限定检索结果

保存检索档案

请选择保存的检索档案：

收藏书架

请选择收藏分类：

检索条件订阅

申请转借

引用

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

限定检索结果

保存检索档案

请选择保存的检索档案： 新增检索档案 确定 取消

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

检索条件订阅

申请转借

引用

高级检索表达式检索

高级检索表达式检索

请选择保存的检索档案：

请选择收藏分类：