看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于K-Medoids聚类的改进KNN文本分类算法 收藏
基于K-Medoids聚类的改进KNN文本分类算法

基于K-Medoids聚类的改进KNN文本分类算法

作     者:罗贤锋 祝胜林 陈泽健 袁玉强 LUO Xian-feng;ZHU Sheng-lin;CHEN Ze-jian;YUAN Yu-qiang

作者机构:华南农业大学信息学院广东广州510642 

基  金:广东省科技计划基金项目(2011B020313015) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2014年第35卷第11期

页      码:3864-3867,3937页

摘      要:为有效提高传统KNN算法(K最近邻算法)在海量数据的分类效率,分析传统KNN算法的分类过程,提出基于K-Medoids聚类的改进KNN算法。利用K-Medoids算法对文本训练集进行聚类,把文本训练集分成相似度较高的簇;根据待分类文本与簇的相对位置,对文本训练集进行裁剪,解决传统KNN算法在文本训练集过大时速度慢的问题。分析与实验结果表明,该裁剪方法能够合理有效地裁剪文本训练集,提高了KNN算法的运行效率和分类能力。

主 题 词:文本分类 隶属度 K最近邻 样本裁剪 K-Medoids聚类 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1000-7024.2014.11.030

馆 藏 号:203551192...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分