限定检索结果

检索条件"主题词=DQN"
14 条 记 录,以下是1-10 订阅
视图:
排序:
基于深度强化学习的作业车间节能调度研究
收藏 引用
《制造技术与机床》2024年 第6期 161-169页
作者:李子晨 苑明海 黄涵钰 裴凤雀河海大学机电工程学院江苏常州213000 
针对绿色制造背景下的作业车间调度问题,提出一种基于析取图的调度框架,该框架可以应对复杂多变的生产调度环境,并实时反映车间生产状态和机床能耗。在将调度问题转化为马尔可夫决策过程中,定义2个静态矩阵和5个动态矩阵作为状态空间,...
来源:详细信息评论
基于数字孪生和深度强化学习的矿井超前液压支架自适应抗冲支护方法
收藏 引用
《工矿自动化》2024年 第6期50卷 23-29,45页
作者:张帆 邵光耀 李昱翰 李玉雪中国矿业大学(北京)人工智能学院北京100083 煤矿智能化与机器人创新应用应急管理部重点实验室北京100083 中国矿业大学(北京)智慧矿山与机器人研究院北京100083 
受深部开采冲击地压等地质灾害扰动的影响,存在矿井超前支护系统自感知能力差、智能抗冲自适应能力弱、缺乏决策控制能力等问题。针对上述问题,提出了一种基于数字孪生和深度强化学习的矿井超前液压支架自适应抗冲支护方法。通过多源传...
来源:详细信息评论
基于强化学习的资源受限传感器信号智能采集研究
收藏 引用
《自动化与仪器仪表》2024年 第1期 12-16页
作者:叶李中国西南电子技术研究所成都610036 
针对资源受限传感器,在自主条件下的信号样本采集问题,设计了资源受限传感器的信号采集模型,提出了基于强化学习的信道采集选择算法,从而提高了信号样本的有效采集效率。文章比较了基于Q-Learning、dqn、DDPG等强化学习算法在信道选择...
来源:详细信息评论
基于人工智能算法的智能电网建模与控制策略研究
收藏 引用
《中国高新科技》2024年 第9期 44-46页
作者:薛乔溦国网福建省电力有限公司福州长乐区供电公司福建福州350000 
全球能源转型的步伐加快和技术不断进步,使得智能电网成为未来能源领域的关键焦点,并受到广泛关注。文章系统性地探讨了如何利用人工智能技术对智能电网进行高效建模和智能控制,将人工智能技术中的BP神经网络和基于dqn算法的强化学习方...
来源:详细信息评论
一种基于生成对抗网络与模型泛化的机器人推抓技能学习方法
收藏 引用
《仪器仪表学报》2022年 第5期43卷 244-253页
作者:吴培良 刘瑞军 李瑶 陈雯柏 高国伟燕山大学信息科学与工程学院秦皇岛066004 河北省计算机虚拟技术与系统集成重点实验室秦皇岛066004 北京信息科技大学自动化学院北京100192 
杂乱环境中机器人推动与抓取技能自主学习问题被学者广泛研究,实现二者之间的协同是提升抓取效率的关键,本文提出一种基于生成对抗网络与模型泛化的深度强化学习算法GARL-dqn。首先,将生成对抗网络嵌入到传统dqn中,训练推动与抓取之间...
来源:详细信息评论
基于深度Q网络的近距空战智能机动决策研究
收藏 引用
《航空兵器》2023年 第3期30卷 41-48页
作者:张婷玉 孙明玮 王永帅 陈增强南开大学人工智能学院天津300350 天津市智能机器人重点实验室天津300350 
针对近距空战对抗中无人机机动决策问题,本文基于深度Q网络(dqn)算法的框架,对强化学习奖励函数设计以及超参数的选择问题进行了研究。对于强化学习中的稀疏奖励问题,采用综合角度、距离、高度和速度等空战因素的辅助奖励,能够精确描述...
来源:详细信息评论
基于改进dqn燃气轮机转子故障诊断方法
收藏 引用
《噪声与振动控制》2023年 第4期43卷 109-115,199页
作者:崔英杰 王红军 张顺利 王星河北京信息科技大学机电工程学院北京100192 北京信息科技大学高端装备智能感知与控制北京市国际科技合作基地北京100192 北京信息科技大学机电系统测控北京市重点实验室北京100192 中国航发西安航空发动机集团有限公司设计所西安710021 
燃气轮机转子系统作为燃气轮机关键部件,由于难以获取敏感故障特征导致故障诊断精度不高,影响设备的安全服役。针对以上问题,提出一种改进深度Q网络(dqn)深度强化学习燃气轮机转子系统故障诊断方法。首先,以采集的一维工况原始振动信号...
来源:详细信息评论
基于强化学习的三维游戏控制算法
收藏 引用
《东北大学学报(自然科学版)》2021年 第4期42卷 478-482,493页
作者:孟琭 沈凝 祁殷俏 张昊园东北大学信息科学与工程学院辽宁沈阳110819 
基于强化学习,设计了一个面向三维第一人称射击游戏(DOOM)的智能体,该智能体可在游戏环境下移动、射击敌人、收集物品等.本文算法结合深度学习的目标识别算法Faster RCNN与Deep Q-Networks(dqn)算法,可将dqn算法的搜索空间大大减小,从...
来源:详细信息评论
飞行时间约束下的再入制导律
收藏 引用
《哈尔滨工业大学学报》2019年 第10期51卷 90-97页
作者:方科 张庆振 倪昆 崔朗福北京航空航天大学自动化科学与电气工程学院 
为应对现代战场的信息化与集群化发展趋势,从多高超声速飞行器饱和打击任务需求出发,针对其中的再入飞行时间约束条件进行研究,提出一套基于Deep Q-learning Network(dqn)的时间可控再入制导律.该制导律工作流程为首先纵向轨迹预测-校...
来源:详细信息评论
基于dqn和K-means聚类算法的天然气站场仪表智能识别研究
收藏 引用
《计算机测量与控制》2023年 第5期31卷 300-308页
作者:黄知坤 文炜 刘明 张香怡 刘凯书 黄腾 顾继俊国家管网集团川气东送天然气管道有限公司武汉430074 中国石油大学(北京)机械与储运工程学院北京102200 
天然气站场中的仪表是工人和设备交互的窗口,可以反映工厂的运行状况;但是站场很多老式仪表不能远程读取示数,采用人工方法读取则浪费人力,需要对其进行智能化的读数研究;针对上述问题,采用了一种基于四足机器人作为载体运动控制,并通...
来源:详细信息评论
聚类工具 回到顶部