看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于k最近邻和改进TF-IDF的文本分类框架 收藏
基于k最近邻和改进TF-IDF的文本分类框架

基于k最近邻和改进TF-IDF的文本分类框架

作     者:龚静 黄欣阳 GONG Jing;HUANG Xin-yang

作者机构:湖南环境生物职业技术学院公共基础课部湖南衡阳421005 南华大学计算机学院湖南衡阳421001 

基  金:国家自然科学基金项目(61300234) 湖南省教育厅基金项目(12C1056) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2018年第39卷第5期

页      码:1340-1344,1349页

摘      要:为获得更加精确稳定的文本分类结果,提出一种基于k-最近邻(k-NN)和词频-逆文档词频(TF-IDF)改进的文本分类方法,主要由文本模块、图形用户界面(GUI)模块、预处理模块、k-NN&TF-IDF模块和相似性测量共5个模块组成。在权重获取方面,对处于不同位置的特征词分别赋予不同的系数,通过构建权重矩阵,反映特征词的重要性和分布情况。在编程方面,通过执行修正的语言集查询(LINQ),优化查询效率。实验结果表明,与其它分类方法相比,该方法在分类准确率、查全率和F1测度方面具有一定优势。讨论分类器对整个文本分类框架的影响,实验结果表明,k-NN分类器比SVM分类器更适合文本分类。

主 题 词:文本分类 k-NN 分类器 权重矩阵 优化 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2018.05.024

馆 藏 号:203288959...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分