看过本文的还看了

相关文献

该作者的其他文献

文献详情 >K-均值文本聚类算法在智能答疑系统中应用 收藏
K-均值文本聚类算法在智能答疑系统中应用

K-均值文本聚类算法在智能答疑系统中应用

作     者:程铃钫 何月顺 Cheng Lingfang;He Yueshun

作者机构:东华理工大学信息工程学院江西抚州344000 

出 版 物:《科技广场》 (Science Mosaic)

年 卷 期:2009年第1期

页      码:75-78页

摘      要:本文将数据挖掘算法应用于智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以改进,传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同样依赖于所有变量,聚类效果往往不尽如人意。为了克服这一缺点,提出一种改进的K-均值文本聚类算法,它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重。经过实验测试,获得了一种基于子空间变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类,还能够生成质量较高的聚类结果。实验结果表明基于子空间变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法。

主 题 词:文本聚类 K-均值 变量加权 子空间 

学科分类:08[工学] 081202[081202] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1671-4792.2009.01.024

馆 藏 号:203840854...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分