限定检索结果

检索条件"主题词=值函数"
5 条 记 录,以下是1-10 订阅
视图:
排序:
一种状态自动划分的模糊小脑模型关节控制器值函数拟合方法
收藏 引用
《控制理论与应用》2011年 第2期28卷 256-260页
作者:闵华清 曾嘉安 罗荣华 朱金辉华南理工大学软件学院广东广州510006 华南理工大学计算机科学与技术学院广东广州510006 
在庞大离散状态空间或连续状态空间中,强化学习(RL)需要进行值函数拟合以寻找最优策略.但函数拟合器的结构往往由设计者预先设定,在学习过程中不能动态调整缺乏自适应性.为了自动构建函数拟合器的结构,提出一种可以进行状态自动划分的...
来源:详细信息评论
基于联合Q分解的强化学习网约车订单派送
收藏 引用
《计算机工程》2022年 第12期48卷 296-303,311页
作者:黄晓辉 张雄 杨凯铭 熊李艳华东交通大学信息工程学院南昌330013 
因网约车订单派送不合理,导致资源利用率和出行效率降低。基于联合Q值函数分解的框架,提出两种订单派送方法ODDRL和LF-ODDRL,高效地将用户订单请求派送给合适的网约车司机,尽可能缩短乘客等待时间。为捕获网约车订单派送场景中随机需求...
来源:详细信息评论
卫星自主运行任务调度问题的优化算法
收藏 引用
《计算机工程与设计》2005年 第2期26卷 461-464页
作者:孙雅茹 王凤阳 韩月平 刘泳山东航天电子技术研究所山东烟台264000 
针对卫星自主运行任务调度问题的特点,设计了一种基于遗传的新的调度算法。以卫星对地拍照任务作为仿 真实例,对算法的编码方式和解码规则、初始群体的产生方法、适值函数、遗传算子进行了详细的描述。计算结果表 明,同精确算法相比,该...
来源:详细信息评论
基于模糊K均聚类和Sarsa(λ)算法的自适应爬壁机器人路径规划
收藏 引用
《计算机测量与控制》2014年 第9期22卷 2879-2881,2885页
作者:李静静河北工程大学科信学院河北邯郸056038 
针对现有爬壁机器人规划算法难以实现在线自适应高效规划的问题,设计了一种基于模糊K-Means算法和经典Sarsa(λ)算法自适应爬壁机器人规划算法;首先,对爬壁机器人的动力学模型进行了建模和分析,然后,对爬壁机器人规划中的状态进行自适...
来源:详细信息评论
品味max/min最值函数 感悟数学核心素养——2017年高考数学最值函数问题之思考
收藏 引用
《福建中学数学》2017年 第10期 3-8页
作者:练冬兰 廖运章广州大学数学与信息科学学院 
2017年,北京市高考数学试卷出现了一道含max最值函数的试题,这类含有max或min最值函数问题近年常出现在高考甚至竞赛中,因其设计新颖、表达抽象、内容涉及面广、难度较大、多数学生难于正确解答而著称.探索如何有效开展这类最值函数的...
来源:详细信息评论
聚类工具 回到顶部