看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种基于聚类密度的文本分类算法研究 收藏
一种基于聚类密度的文本分类算法研究

一种基于聚类密度的文本分类算法研究

作     者:谭学清 张磊 周通 罗琳 

作者机构:武汉大学信息管理学院 

基  金:国家社会科学基金项目"数字图书馆标签系统的语义挖掘研究"(项目批准号:12CTQ003)的研究成果之一 

出 版 物:《图书馆学研究》 (Research on Library Science)

年 卷 期:2016年第13期

页      码:74-83页

摘      要:在现代信息技术领域,如何快速、准确和全面地找到用户真正所需要的信息,已经成为该领域的研究重点。在文本分类的理论基础之上,文章针对KNN算法存在的不足,设计了一种基于聚类密度的文本分类算法,通过计算待分类文本的相似度及其权重值的大小判断待分类文本的所属类别。并通过3个实验对该分类算法进行了验证,实验结果表明,基于聚类密度的分类算法在不同特征选择方法、不同特征词数下的分类效果都优于KNN分类算法,同时证明在多种相似度算法中,Jensen-Shannon散度更适合聚类密度算法。

主 题 词:文本分类 向量空间模型 K最近邻算法 聚类密度 

学科分类:1205[管理学-图书情报与档案管理类] 12[管理学] 120501[120501] 120502[120502] 

核心收录:

D O I:10.15941/j.cnki.issn1001-0424.2016.13.016

馆 藏 号:203185282...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分