看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Word2Vec的微博文本分类研究 收藏
基于Word2Vec的微博文本分类研究

基于Word2Vec的微博文本分类研究

作     者:牛雪莹 赵恩莹 NIU Xue-Ying;ZHAO En-Ying

作者机构:太原科技大学计算机科学与技术学院 

出 版 物:《计算机系统应用》 (Computer Systems & Applications)

年 卷 期:2019年第28卷第8期

页      码:256-261页

摘      要:以微博为代表的社交平台是信息时代人们必不可少的交流工具.挖掘微博文本数据中的信息对自动问答、舆情分析等应用研究都具有重要意义.短文本数据的分类研究是短文本数据挖掘的基础.基于神经网络的Word2vec模型能很好的解决传统的文本分类方法无法解决的高维稀疏和语义鸿沟的问题.本文首先基于Word2vec模型得到词向量,然后将类别因素引入传统权重计算方法TF-IDF(Term Frequency-Inverse Document Frequency)设计词向量权重,进而用加权求和的方法得到短文本向量,最后用SVM分类器对短文本做分类训练并且通过微博数据实验验证了该方法的有效性.

主 题 词:Word2Vec 短文本分类 TF-IDF 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 08[工学] 

D O I:10.15888/j.cnki.csa.007030

馆 藏 号:203727168...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分