看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法 收藏
基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法

基于隐含狄列克雷分配分类特征扩展的微博广告过滤方法

作     者:邢金彪 崔超远 孙丙宇 宋良图 XING Jinbiao;CUI Chaoyuan;SUN Bingyu;SONG Liangtu

作者机构:中国科学院合肥智能机械研究所合肥230031 中国科学技术大学信息科学技术学院合肥230026 

基  金:国家科技支撑计划项目(2014BAD10B08) 安徽省科技攻关计划项目(1401032010) 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2016年第36卷第8期

页      码:2257-2261页

摘      要:传统的微博广告过滤方法忽略了微博广告文本的数据稀疏性、语义信息和广告背景领域特征等因素的影响。针对这些问题,提出一种基于隐含狄列克雷分配(LDA)分类特征扩展的广告过滤方法。首先,将微博分为正常微博和广告型微博,并分别构建LDA主题模型预测短文本对应的主题分布,将主题中的词作为特征扩展的基础;其次,在特征扩展时结合文本类别信息提取背景领域特征,以降低其对文本分类的影响;最后,将扩展后的特征向量作为分类器的输入,根据支持向量机(SVM)的分类结果过滤广告。实验结果表明,与现有的仅基于短文本分类的过滤方法相比,其准确率平均提升4个百分点。因此,该方法能有效扩展文本特征,并降低背景领域特征的影响,更适用于数据量较大的微博广告过滤。

主 题 词:广告过滤 隐含狄列克雷分配 短文本分类 支持向量机 特征扩展 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.11772/j.issn.1001-9081.2016.08.2257

馆 藏 号:203185725...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分