看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多臂赌博机在线学习的频谱共享方法 收藏
基于多臂赌博机在线学习的频谱共享方法

基于多臂赌博机在线学习的频谱共享方法

作     者:张娟 蒋和松 ZHANG Juan;JIANG He-song

作者机构:西南科技大学信息工程学院特殊环境机器人技术四川省重点实验室四川绵阳621010 

基  金:国家自然科学基金项目(61379005) 国防基础科研计划基金项目(B3120110005 B3120133002) 西南科技大学博士基金项目(12zx7127) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2014年第35卷第7期

页      码:2515-2519页

摘      要:针对频谱共享中信道状态建模为完全知识马尔科夫时,应用受限的问题,提出了不同信道下基于信道感知的在线学习。根据授权用户是否存在于当前信道来选择激进发送或保守发送,由于保守发送时,信道状态是不可观测的,因此将信道模型建模为部分可观测马尔科夫决策过程。将信道未知情况下的最优传输策略建模为多臂赌博机模型。仿真结果表明,在信道不完全可知情况下的多臂赌博机在线学习算法能获得最优K步策略,并通过UCB-TUNED方法改善了最优传输的K步保守策略的收敛性。

主 题 词:频谱共享 多臂赌博机 在线学习 部分可观察的马尔科夫 最优传输 

学科分类:080904[080904] 0810[工学-土木类] 0809[工学-计算机类] 08[工学] 080402[080402] 0804[工学-材料学] 081001[081001] 

D O I:10.3969/j.issn.1000-7024.2014.07.050

馆 藏 号:203227852...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分