看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法 收藏
基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法

基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法

作     者:赵知劲 朱家晟 叶学义 尚俊娜 ZHAO Zhijin;ZHU Jiasheng;YE Xueyi;SHANG Junna

作者机构:中国电子科技集团第36研究所通信系统信息控制技术国家级重点实验室嘉兴314001 杭州电子科技大学通信工程学院杭州310018 

基  金:国家自然科学基金(U19B2016) 

出 版 物:《电子与信息学报》 (Journal of Electronics & Information Technology)

年 卷 期:2022年第44卷第8期

页      码:2814-2823页

摘      要:为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法。针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数。为应对智能体之间的相互影响和动态的环境,引入集中式训练和分散式执行(CTDE)框架。该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各智能体的权重分配问题。采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率。仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性。

主 题 词:异步组网 多智能体 深度强化学习 集中式学习和分散式执行 模糊推理系统 

学科分类:11[军事学] 080904[080904] 0809[工学-计算机类] 08[工学] 110503[110503] 0710[理学-生物科学类] 0711[理学-心理学类] 0810[工学-土木类] 1105[1105] 1104[1104] 082601[082601] 081105[081105] 0826[工学-生物医学工程类] 081001[081001] 081002[081002] 0701[理学-数学类] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.11999/JEIT210608

馆 藏 号:203113901...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分