看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于强化学习的网络拥塞控制算法 收藏
基于强化学习的网络拥塞控制算法

基于强化学习的网络拥塞控制算法

作     者:李凡 李慧斯 马文丹 

作者机构:广州软件学院广州510990 

基  金:广州软件学院科研项目(ky202122 ky202123) 

出 版 物:《科技创新与应用》 (Technology Innovation and Application)

年 卷 期:2024年第14卷第10期

页      码:55-58页

摘      要:该文结合强化学习方法提出一种QLCC算法,此算法是将网络拥塞过程进行简化之后描述为马尔科夫决策过程,在Q-learning算法应用的基础上创新设计的新型网络拥塞控制算法。研究过程中首先介绍强化学习方法,并对网络拥塞过程中马尔科夫决策过程的构建条件及假设进行探讨,之后从框架结构、参数结构及定义、参数离散划分和更新步骤几个方面介绍QLCC算法,并采取仿真实验方法对该种新算法的网络吞吐量、公平性、随机丢包环境下的吞吐量分别进行检测,通过与其他3种传统网络拥塞控制算法进行对比分析,证实QLCC算法具有吞吐量较佳、公平性最高、抗丢包性能最优的性能,说明其是一种具有较高应用优势的智能化网络拥塞控制算法。

主 题 词:强化学习 QLCC算法 网络拥塞控制 学习方法 仿真实验 

学科分类:08[工学] 081201[081201] 0812[工学-测绘类] 

D O I:10.19981/j.CN23-1581/G3.2024.10.014

馆 藏 号:203127205...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分