看过本文的还看了

相关文献

该作者的其他文献

文献详情 >频分多址系统分布式强化学习功率控制方法 收藏
频分多址系统分布式强化学习功率控制方法

频分多址系统分布式强化学习功率控制方法

作     者:李烨 司轲 Li Ye;Si Ke

作者机构:上海理工大学光电信息与计算机工程学院上海200093 

基  金:华为技术有限公司合作资助项目(YBN2019115054) 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2023年第40卷第12期

页      码:3772-3777页

摘      要:近年来,深度强化学习作为一种无模型的资源分配方法被用于解决无线网络中的同信道干扰问题。然而,基于常规经验回放策略的网络难以学习到有价值的经验,导致收敛速度较慢;而人工划定探索步长的方式没有考虑算法在每个训练周期上的学习情况,使得对环境的探索存在盲目性,限制了系统频谱效率的提升。对此,提出一种频分多址系统的分布式强化学习功率控制方法,采用优先经验回放策略,鼓励智能体从环境中学习更重要的数据,以加速学习过程;并且设计了一种适用于分布式强化学习、动态调整步长的探索策略,使智能体得以根据自身学习情况探索本地环境,减少人为设定步长带来的盲目性。实验结果表明,相比于现有算法,所提方法加快了收敛速度,提高了移动场景下的同信道干扰抑制能力,在大型网络中具有更高的性能。

主 题 词:分布式强化学习 频分多址系统 功率控制 贪心策略 优先经验回放 动态步长调整 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 08[工学] 

D O I:10.19734/j.issn.1001-3695.2023.03.0169

馆 藏 号:203125202...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分