限定检索结果

检索条件"主题词=Q网络"
4 条 记 录,以下是1-10 订阅
视图:
排序:
基于q网络的磁悬浮自学习控制系统设计
收藏 引用
《电机与控制学报》2021年 第9期25卷 132-139页
作者:黄涛 班晓军 吴奋 黄显林哈尔滨工业大学控制理论与制导技术研究中心哈尔滨150001 Department of Mechanical and Aerospace EngineeringNorth Carolina State UniversityRaleigh 27695-7910USA 
针对现有磁悬浮控制系统设计方法依赖动力学模型的问题,利用q网络强化学习方法,在不依赖系统模型的条件下,训练得到基于q网络的自学习控制器;基于系统运动方向设计奖励函数,提高了强化学习训练的收敛速度;提出了基于系统加权平均状态(we...
来源:详细信息评论
强化学习和矩阵补全引导的多目标试卷生成
收藏 引用
《计算机应用》2025年 第1期45卷 48-58页
作者:邢长征 梁浚锋 金海波 徐佳玉 乌海荣辽宁工程技术大学电子与信息工程学院辽宁葫芦岛125105 阜新市大数据管理中心辽宁阜新123000 
针对现有的试卷生成技术存在过多关注生成试卷的难易程度,而忽略了其他相关目标,例如质量、分数分布和技能覆盖范围的问题,提出一种强化学习和矩阵补全引导的多目标试卷生成方法,以优化试卷生成领域的特定目标。首先,运用深度知识追踪...
来源:详细信息评论
复杂环境下基于推抓协同操作的目标物体抓取
收藏 引用
《控制理论与应用》2023年 第10期40卷 1713-1720页
作者:孙先涛 唐思宇 陈文杰 贺春东 智亚丽 陈伟海安徽大学电气工程与自动化学院安徽合肥230601 北京航空航天大学自动化科学与电气工程学院北京100191 
针对现有抓取技术在复杂环境下难以进行有效的目标导向性抓取的问题,本文提出了一种基于深度强化学习的推动和抓取协同操作的方法.相对于以往的抓取方法,本方法使用深度学习来处理Intel-D435i相机所获得的RGB-D图像数据,同时又在视觉网...
来源:详细信息评论
基于多路口车辆感知预测的协同信号配时技术
收藏 引用
《科技创新导报》2021年 第6期18卷 113-115,123页
作者:赵晋芳西安汽车职业大学陕西西安710600 
为了缓解大城市的交通拥堵现状,交叉口信号灯配时的研究越来越有必要。普遍的交通信号配时技术,是基于单路口、传统车辆检测方法而设计的,没有考虑影响实际交通状况的流量,存在配时不准确、不智能的局限性。通过基于强化学习的深度q网络...
来源:详细信息评论
聚类工具 回到顶部