限定检索结果

检索条件"主题词=深度Q学习网络"
6 条 记 录,以下是1-10 订阅
视图:
排序:
基于双深度q学习网络的面向设备负荷稳定的智能车间调度方法
收藏 引用
《计算机集成制造系统》2023年 第1期29卷 91-99页
作者:黎声益 马玉敏 刘鹃同济大学电子与信息工程学院上海201804 
在车间管理中,设备负荷是一个关键性能指标,负荷稳定直接影响了生产效率与生产成本,但目前鲜有研究关注如何实现设备负荷稳定的问题。为此,提出一种面向设备负荷稳定的智能车间调度方法。该方法通过一个含有深度神经网络调度模型的调度...
来源:详细信息评论
基于深度强化学习的激励型需求响应决策优化模型
收藏 引用
《电力系统自动化》2021年 第14期45卷 97-103页
作者:徐弘升 陆继翔 杨志宏 李昀 陆进军 黄华南瑞集团有限公司(国网电力科学研究院有限公司)江苏省南京市211106 智能电网保护与运行控制国家重点实验室江苏省南京市211106 
随着中国电力市场化改革的推进,售电侧市场逐步开放,售电商可以聚合大量的分散负荷参与电力市场环境下的需求响应。文中提出以售电商和用户综合收益最大化为目标的基于深度强化学习的激励型需求响应建模和求解方法。首先,建立售电商和...
来源:详细信息评论
基于DqN变动力智能决策的轨迹规划
收藏 引用
《兵工学报》2024年 第12期45卷 4395-4406页
作者:梅泽伟 李天任 朱佳琳 邵星灵 丁天雲 刘俊中北大学仪器与电子学院山西太原030051 中北大学仪器科学与动态测试教育部重点实验室山西太原030051 中国运载火箭技术研究院研究发展中心北京100071 中北大学电气与控制工程学院山西太原030051 
针对航天飞行器气动力不足难以维持应急侧向操纵确保安全避开障碍物的问题,提出一种基于深度q学习网络(Deep q-learning Network,DqN)变动力智能决策的轨迹规划方法。根据变动力航天飞行器运动学方程,设计基于航程误差的纵向制导律和考...
来源:详细信息评论
环境感知信息辅助的认知雷达波形参数智能选择
收藏 引用
《信号处理》2021年 第2期37卷 186-198页
作者:王鹏峥 李杨 张宁哈尔滨工业大学电子工程技术研究所黑龙江哈尔滨150001 对海探测与信息处理工业和信息化部重点实验室黑龙江哈尔滨150001 
现代雷达往往需要在复杂多变的电磁环境中完成多种任务。如何提升雷达的智能化水平,使其能够适应环境变化和任务需求,已成为近年来备受关注的研究课题。本文针对杂波环境下机动目标检测与跟踪的性能优化问题,提出了一种基于环境感知的...
来源:详细信息评论
基于双层强化学习的干扰策略与干扰波形优化设计
收藏 引用
《制导与引信》2023年 第4期44卷 35-41页
作者:辛祺 辛增献 马亮 辛升 陈涛哈尔滨工程大学信息与通信工程学院黑龙江哈尔滨150001 上海无线电设备研究所上海201109 
针对干扰策略与干扰波形联合优化设计问题,提出了一种基于双层强化学习的干扰策略与间歇采样转发干扰波形人工智能优化设计方法。该方法通过建立基于双层强化学习的干扰决策模型,外层利用q学习(q-learning)算法,基于雷达工作模式识别对...
来源:详细信息评论
基于改进DqN的动态避障路径规划
收藏 引用
《北京信息科技大学学报(自然科学版)》2024年 第5期39卷 14-22页
作者:郑晨炜 侯凌燕 王超 赵青娟 邹智元北京信息科技大学计算机开放系统实验室北京100101 
针对传统深度q学习网络(deep q-learning network,DqN)在具有动态障碍物的路径规划下,移动机器人在探索时频繁碰撞难以移动至目标点的问题,通过在探索策略和经验回放机制上进行改进,提出一种改进的DqN算法。在探索策略上,利用快速搜索...
来源:详细信息评论
聚类工具 回到顶部