看过本文的还看了

相关文献

该作者的其他文献

文献详情 >遗忘曲线和BTM词频双层加权微博用户画像 收藏
遗忘曲线和BTM词频双层加权微博用户画像

遗忘曲线和BTM词频双层加权微博用户画像

作     者:吴迪 马文莉 杨利君 WU Di;MA Wen-li;YANG Li-jun

作者机构:河北工程大学信息与电气工程学院河北邯郸056038 

基  金:河北省自然科学基金项目(F2020402003) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2023年第44卷第12期

页      码:3800-3808页

摘      要:针对微博短文本具有时效性和建模中频词缺失的问题,提出一种遗忘曲线和BTM词频双层加权微博用户画像方法。通过计算词条的时间权重和提高中频词的词频权重,获取双层加权的用户兴趣主题词。利用遗忘曲线拟合时间函数,计算微博词条的时间权重;将重新计算的词频特征作为Gibbs采样的随机值,提出一种改进的词频加权BTM主题模型,提高中频词的词频权重;提出一种微博用户行为影响力计算方法,构建热点话题下的用户画像。实验结果表明,该方法与BTM、SL-LDA、LDA方法相比,在不同时间片PMI-score指标性能均最优,能够准确挖掘不同时间片的各主题词,构建热点话题下用户兴趣主题词词云,准确展示热点话题下的用户兴趣。

主 题 词:微博 用户画像 双层加权 遗忘曲线 时间函数 词对主题模型 行为影响力 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2023.12.038

馆 藏 号:203125162...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分