看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于大数据挖掘技术的文本分类研究 收藏
基于大数据挖掘技术的文本分类研究

基于大数据挖掘技术的文本分类研究

作     者:孟鑫淼 MENG Xinmiao

作者机构:新华三大数据研究院河南郑州450001 

出 版 物:《现代电子技术》 (Modern Electronics Technique)

年 卷 期:2020年第43卷第17期

页      码:126-129页

摘      要:文本数据具有规模大、特征维数高等特点,当前文本分类方法无法刻画文本变化特点,使得文本分类正确率低、误差大、分类时间长,为了获得理想的文本分类效果,设计基于大数据挖掘技术的文本分类方法。首先对当前文本分类的研究进展进行分析,找出导致当前文本分类效果差的原因;然后,提取文本分类原始特征,并引入核主成分分析算法对原始特征进行处理,降低特征维数,简化文本分类器的结构;最后,采用大数据挖掘技术构建文本分类器,并与其他文本分类方法进行对比测试。测试结果表明,所提方法可以更好地描述文本变化特点,能够对各种类型文本进行准确识别和分类,文本分类精度超过95%,明显高于当前其他文本分类方法,并且所提方法的文本分类时间显著减少,具有更好的文本分类效果。

主 题 词:大规模文本数据 高维特征 大数据挖掘技术 文本分类器 分类精度 分类时间 

学科分类:11[军事学] 0810[工学-土木类] 1105[1105] 08[工学] 080203[080203] 0802[工学-机械学] 081002[081002] 110503[110503] 

D O I:10.16652/j.issn.1004-373x.2020.17.029

馆 藏 号:203969048...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分