看过本文的还看了

相关文献

该作者的其他文献

文献详情 >结合正负反馈状态表示的深度强化学习推荐方法 收藏
结合正负反馈状态表示的深度强化学习推荐方法

结合正负反馈状态表示的深度强化学习推荐方法

作     者:张涛 张志军 曹家伟 范钰敏 刘佳慧 袁卫华 ZHANG Tao;ZHANG Zhijun;CAO Jiawei;FAN Yumin;LIU Jiahui;YUAN Weihua

作者机构:山东建筑大学计算机科学与技术学院山东济南250100 

基  金:山东省自然科学基金项目(ZR2021MF099,ZR2022MF334) 山东省教学改革研究项目(M2021130,M2022245,Z2022202) 山东省优质专业学位教学案例库建设项目(SDYAL2022155) 山东省重点研发计划(软科学项目)(2021RKY03056) “海右计划”产业领军人才本土类创新团队项目(2023) 

出 版 物:《软件导刊》 (Software Guide)

年 卷 期:2024年第23卷第12期

页      码:27-35页

摘      要:深度强化学习技术在交互式推荐系统上的应用已十分成熟,但少有研究专门对状态进行表示建模,只针对用户交互过程中的正反馈序列进行状态表示建模,导致推荐系统忽略了用户交互过程中负反馈序列中存在的潜在关系及用户兴趣变化,使得推荐结果过于片面。鉴于此,提出一种基于对比学习和深度强化学习的推荐系统框架,设计了对用户和推荐系统交互过程中产生的正负反馈序列进行建模的状态表示模块。此外,为了缓解正反馈数据稀疏问题和细粒化正负反馈之间的差异性,还加入了对比辅助任务。在Movielens-100K和Movielens-1M两个真实世界的数据集上进行了大量实验,HR@10评价指标分别为0.705 2、0.490 2;NDCG@10评价指标分别为0.478 2、0.271 5。结果表明,该方法明显优于当前先进方法,证明了CRLRS对正负反馈同时进行建模以及加入对比辅助任务的必要性,并且具有更好的推荐性能。

主 题 词:深度强化学习 对比学习 推荐系统 正负反馈 状态表示 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.11907/rjdk.232308

馆 藏 号:203156439...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分