看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于DQN的异构测控资源联合调度方法 收藏
基于DQN的异构测控资源联合调度方法

基于DQN的异构测控资源联合调度方法

作     者:薛乃阳 丁丹 贾玉童 王志强 刘渊 Xue Naiyang;Ding Dan;Jia Yutong;Wang Zhiqiang;Liu Yuan

作者机构:航天工程大学研究生院北京101416 航天工程大学电子与光学工程系北京101416 中国人民解放军61646部队北京100192 

出 版 物:《系统仿真学报》 (Journal of System Simulation)

年 卷 期:2023年第35卷第2期

页      码:423-434页

摘      要:以异构测控网资源联合调度为研究对象,提出一种基于强化学习的深度Q网络(deep Q network, DQN)算法。在充分分析异构测控资源联合调度问题特点后,用数学语言对影响问题求解的约束条件进行描述,建立了资源联合调度模型;从应用强化学习解决问题的角度,对求解的问题进行马尔科夫决策过程描述后,分别设计了2个结构相同的神经网络和基于ε贪婪算法的动作选择策略,并建立了DQN求解框架。仿真结果表明:基于DQN的异构测控资源调度方法较遗传算法能够找到调度收益更优的测控调度方案。

主 题 词:航天测控 异构测控资源联合调度 深度Q网络 调度收益 强化学习 

学科分类:08[工学] 0802[工学-机械学] 0835[0835] 080201[080201] 

核心收录:

D O I:10.16182/j.issn1004731x.joss.21-0879

馆 藏 号:203118259...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分