限定检索结果

检索条件"主题词=马尔科夫决策"
9 条 记 录,以下是1-10 订阅
视图:
排序:
基于马尔科夫决策过程的服务迁移策略
收藏 引用
《计算机工程与设计》2022年 第11期43卷 3015-3021页
作者:罗艺 江凌云南京邮电大学通信与信息工程学院江苏南京210003 
在移动边缘计算(MEC)网络架构中,用户能够以较低的网络延时访问服务,当用户发生移动时,为保证服务的连续性以及业务的服务质量,需要引入服务迁移策略。为解决此问题,将服务迁移问题建模为马尔科夫决策过程(MDP),用户移动模型采用二维随...
来源:详细信息评论
燃料电池汽车最优氢耗马尔科夫决策控制
收藏 引用
《控制理论与应用》2021年 第8期38卷 1219-1228页
作者:付江涛 付主木 宋书中河南科技大学信息工程学院河南洛阳471009 
本文基于马尔科夫决策过程提出一种燃料电池汽车最优等效氢燃料消耗控制策略.控制策略以部分观测量为基础,以马尔科转移概率矩阵为条件,采用基于蒙特卡洛马尔科(MCMC)算法的Metropolis-Hastings采样方法,获得平均奖励输出,进而通过...
来源:详细信息评论
基于无监督深度融合机制的货物在线装箱算法
收藏 引用
《包装工程》2024年 第11期45卷 153-162页
作者:张长勇 姚凯超 王彤中国民航大学电子信息与自动化学院天津300300 
目的针对当前三维装箱算法存在的模型鲁棒性差、泛化性弱、装载率低等问题,设计一种无监督融合机制的在线装箱算法。方法充分考虑货物“即到即码”的实时性需求,以容器空间利用率为优化目标,基于无监督深度融合指针网络端到端学习模型框...
来源:详细信息评论
拦截大气层内机动目标的深度强化学习制导律
收藏 引用
《宇航学报》2022年 第5期43卷 685-695页
作者:邱潇颀 高长生 荆武兴哈尔滨工业大学航天工程系哈尔滨150001 
针对大气层内高速机动目标的拦截问题,提出了一种基于双延迟深度确定性策略梯度(TD3)算法的深度强化学习制导律,它直接将交战状态信息映射为拦截弹的指令加速度,是一种端到端、无模型的制导策略。首先,将攻防双方的交战运动学模型描述...
来源:详细信息评论
面向耦合分流动力构型的拖拉机犁耕工况控制策略
收藏 引用
《农业工程学报》2022年 第23期38卷 41-49页
作者:窦海石 张幽彤 艾强 赵心琦北京理工大学机械与车辆学院北京100089 
当前中国农田集群和能源短缺现状极大地促进了混合动力拖拉机的推广与使用,然而混动拖拉机动态变载荷工况加大了整机功率的耦合与分流难度。为此,该研究以发动机和双电机为动力源,利用图论原理设计出满足全功率范围作业需求的两种动力...
来源:详细信息评论
瑞雷波频散曲线的深度学习反演方法
收藏 引用
《地球物理学报》2022年 第6期65卷 2244-2259页
作者:张志厚 石泽玉 马宁 王虎 乔中坤 赵思为 姚禹 赵明浩 叶志虎西南交通大学地球科学与环境工程学院成都611756 西南交通大学高速铁路线路工程教育部重点实验室成都610031 浙江工业大学理学院浙江省量子精密测量重点实验室杭州310023 中铁二院成都地勘岩土工程有限责任公司成都610000 
瑞雷波频散曲线反演是获取地表横波波速的关键步骤,现有线性反演方法的效果取决于初始模型的选择,非线性反演也存在效率低、多解等问题.为了进一步提高瑞雷波频散曲线反演的速度与精度,受深度学习卓越非线性映射能力启发,本文提出了瑞...
来源:详细信息评论
面向深空时变信道的数据传输策略
收藏 引用
《宇航学报》2016年 第2期37卷 216-222页
作者:吴海涛 焦健 顾术实 陈晨 李云鹤 吴绍华 张钦宇哈尔滨工业大学深圳研究生院深圳518055 肇庆学院电子信息与机电工程学院肇庆526061 
将呈现随机"好"、"坏"状态跳变的深空Ka频段链路噪声温度建模为两状态Gilbert-Elliot信道,考虑深空下行发送端只能获得延迟的信道状态信息(CSI)的限制,结合部分观测马尔科夫决策理论设计了基于延迟CSI预测信道状态...
来源:详细信息评论
基于神经网络深度强化学习的分拣机器人避障规划技术
收藏 引用
《工业仪表与自动化装置》2023年 第2期 46-50页
作者:丁玲上海东海职业技术学院基础部上海200241 
分拣机器人的避障决策过程较为复杂,为提高分拣机器人的工作效果,设计基于神经网络深度强化学习的分拣机器人避障规划技术。首先,在动力学场景中设置障碍物,利用马尔科夫决策过程获取分拣机器人的运动状态后,判断障碍目标。在对神经网...
来源:详细信息评论
关于视频图像多目标跟踪优化研究
收藏 引用
《计算机仿真》2020年 第9期37卷 317-322页
作者:陈志鸿 黄立勤 裴晨皓福州大学物理与信息工程学院福建福州350108 
马尔科夫决策多目标跟踪算法在目标遮挡和目标消失再出现等情况下容易丢失目标,无法进行持续有效的跟踪。利用核相关滤波器较强的判别能力,提出了一种基于核相关滤波优化的马尔科夫决策在线多目标跟踪算法。结合核相关滤波器增强跟踪目...
来源:详细信息评论
聚类工具 回到顶部