限定检索结果

检索条件"主题词=深度强化学习"
833 条 记 录,以下是1-10 订阅
视图:
排序:
基于混合深度强化学习的ICV任务卸载与资源分配
收藏 引用
《汽车工程》2025年 第1期47卷 35-43页
作者:刘佳慧 邹渊 孙巍 孟逸豪 路潇然 李圆圆北京理工大学机械与车辆学院北京100081 北京理工大学电动车辆国家工程研究中心北京100081 
随着智能网联车辆(ICV)技术的发展,计算资源有限的ICV面临计算需求大幅增加的问题。ICV可以通过路侧单元(RSU)将任务卸载到移动边缘计算(MEC)服务器上。然而,车联网环境的动态性和复杂性使任务卸载和资源分配变得极具挑战。本文提出在...
来源:详细信息评论
深度强化学习求解动态柔性作业车间调度问题
收藏 引用
《现代制造工程》2025年 第2期 10-16页
作者:杨丹 舒先涛 余震 鲁光涛 纪松霖 王家兵武汉科技大学冶金装备及其控制省部共建教育部重点实验室武汉430081 武汉科技大学机械传动与制造工程湖北省重点实验室武汉430081 武汉科技大学精密制造研究院武汉430081 
随着智慧车间等智能制造技术的不断发展,人工智能算法在解决车间调度问题上的研究备受关注,其中车间运行过程中的动态事件是影响调度效果的一个重要扰动因素,为此提出一种采用深度强化学习方法来解决含有工件随机抵达的动态柔性作业车...
来源:详细信息评论
求解外卖配送问题的深度强化学习算法
收藏 引用
《计算机应用研究》2025年 第1期42卷 205-213页
作者:张旭阳 刘勇 马良上海理工大学管理学院上海200093 
以最小化骑手费用效益比为优化目标,采用最小比率旅行商问题对外卖配送问题进行建模。针对目前算法在求解该问题时计算精度低、算法稳定性差等问题,设计一种基于深度强化学习的DRL-MFA算法。首先,定义外卖配送问题的马尔可夫决策模型来...
来源:详细信息评论
面向多无人机辅助数据采集的深度强化学习协同航迹规划算法
收藏 引用
《中国科学:信息科学》2025年 第2期55卷 426-443页
作者:张莉涓 喻春妮 高攀 宋晓勤 缪雨祺 王雪莹南京航空航天大学电子信息工程学院南京210016 南京航空航天大学计算机科学与技术学院南京210016 东南大学移动通信全国重点实验室南京211189 
在复杂动态环境下,针对无人机执行协同数据采集任务时,出现的航迹规划问题求解不确定性高、多机协同难度大、机间碰撞严重等挑战,提出了一种面向多无人机辅助数据采集的强化学习协同航迹规划(reinforcement learning-based cooperative ...
来源:详细信息评论
基于深度强化学习的无线传感器充电策略
收藏 引用
《机械设计与制造》2025年 第1期407卷 197-203页
作者:匡孟秋湖南财经工业职业技术学院湖南衡阳421200 
为了满足每个传感器的及时充电需求,提出了一种基于深度强化学习的无线传感器充电策略。首先将传感器节点的实时充电需求建模为时间窗,并且引入充电奖励作为指标评价充电质量。调度移动充电器对传感器进行充电目的是使死区节点数和移动...
来源:详细信息评论
考虑自注意力和时序记忆的深度强化学习配电网无功电压控制策略
收藏 引用
《中国电机工程学报》2025年 第2期45卷 565-576,I0014页
作者:刘硕 冯斌 郭创新 籍雯媗 王炜 张勇浙江大学电气工程学院浙江省杭州市310027 国家电网有限公司华北分部北京市西城区100053 
大量分布式新能源的接入,导致配电网面临电压越限、网损增加等严峻挑战。针对无功电压控制问题,深度强化学习能够有效解决传统优化方法在模型依赖和求解速度方面的不足。然而现有深度强化学习方法在面对大规模配网复杂场景时,特征提取...
来源:详细信息评论
基于场景法和深度强化学习的电氢耦合系统两阶段多时间尺度优化调度
收藏 引用
《浙江电力》2025年 第1期44卷 54-67页
作者:陈哲 韦美佳 林达 李志浩 陈健国网浙江省电力有限公司电力科学研究院杭州310014 电网智能化调度与控制教育部重点实验室(山东大学)济南250061 
电氢耦合系统中风光出力存在波动性,且电能与氢能调度时间尺度也具有差异性,这些因素给系统的经济、高效调度带来诸多挑战。为此,基于场景法和深度强化学习提出一种考虑风光不确定性的电氢耦合系统两阶段多时间尺度优化调度方法。首先...
来源:详细信息评论
改进奖励函数的深度强化学习路径规划方法
收藏 引用
《计算机应用与软件》2025年 第1期42卷 271-276页
作者:桑垚 马晓宁中国民航大学计算机科学与技术学院天津300300 
针对深度强化学习在路径规划问题中的稀疏奖励问题,提出一种基于潜能奖励函数的深度强化学习模型。该模型通过设计新的奖励函数,提高奖励密度和样本利用率,减少训练难度,提升智能体在不同地图中的寻路成功率。仿真结果表明,改进后的模...
来源:详细信息评论
基于深度强化学习的游戏智能引导算法
收藏 引用
《吉林大学学报(理学版)》2025年 第1期63卷 91-98页
作者:白天 吕璐瑶 李储 何加亮吉林大学计算机科学与技术学院长春130012 吉林大学软件学院长春130012 大连民族大学信息与通信工程学院辽宁大连116600 
针对传统游戏智能体算法存在模型输入维度大及训练时间长的问题,提出一种结合状态信息转换与奖励函数塑形技术的新型深度强化学习游戏智能引导算法.首先,利用Unity引擎提供的接口直接读取游戏后台信息,以有效压缩状态空间的维度,减少输...
来源:详细信息评论
基于深度强化学习的工业物联网路由优化方法
收藏 引用
《物联网技术》2025年 第2期15卷 82-84页
作者:莫丽娟 张梦榛黄河水利职业技术学院河南开封475000 
常规的工业物联网路由优化协议多以独立形式设定,链路利用率大幅度降低,为此提出了基于深度强化学习的工业物联网路由优化方法。根据当前的路由优化需求,先进行实时监测节点部署及路由运行数据采集,采用多阶的方式扩大覆盖范围,制定多...
来源:详细信息评论
聚类工具 回到顶部