看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于LDA-wSVM模型的文本分类研究 收藏
基于LDA-wSVM模型的文本分类研究

基于LDA-wSVM模型的文本分类研究

作     者:李锋刚 梁钰 GAO Xiao-zhi ZENGER Kai LI Feng-gang;LIANG Yu;GAO Xiao-zhi;ZENGER Kai

作者机构:合肥工业大学管理学院合肥230009 阿尔托大学自动化与系统技术系芬兰fi00076 教育部过程优化与智能决策重点实验室合肥230009 

基  金:国家自然科学基金资助项目(71301041) 南京市科技计划资助项目(2012sf542010) 国家留学基金资助项目 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2015年第32卷第1期

页      码:21-25页

摘      要:SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势并提高分类精确度,提出了一种新的LDA-w SVM高效分类算法模型。利用LDA主题模型进行建模和特征选择,确定主题数和隐主题—文本矩阵;在经典权重计算方法上作改进,考虑各特征项与类别的关联度,设计了一种新的权重计算方法;在特征词空间上使用这种基于权重计算的w SVM分类器进行分类。实验基于R软件平台对搜狗实验室的新闻文本集进行分类,得到了宏平均值为0.943的高精确度分类结果。实验结果表明,提出的LDA-w SVM模型在文本自动分类中具有很好的优越性能。

主 题 词:文本分类 潜在狄利克雷分布 支持向量机 权重计算 吉普斯抽样 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1001-3695.2015.01.005

馆 藏 号:203920423...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分