看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于可变染色体长度的遗传K均值聚类算法 收藏
基于可变染色体长度的遗传K均值聚类算法

基于可变染色体长度的遗传K均值聚类算法

作     者:严宇平 肖菁 YAN Yu-ping;XIAO Jing

作者机构:中山大学软件学院广东广州510275 中山大学广东省信息安全技术重点实验室 

基  金:中山大学青年教师基金项目(1131161) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2008年第29卷第14期

页      码:3709-3713页

摘      要:针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺点,使用了一种基于可变染色体编码长度的遗传算法对传统K-均值聚类进行改进。该算法可以在事先不确定K值的情况下,通过多次的选择、交叉、变异的遗传操作,最终得到最优的聚类数,以及最优的初始质心集。通过Reuters数据集的实验结果表明,基于该算法的聚类划分结果明显优于传统K-均值聚类算法,并且好过基于固定染色体编码长度遗传算法的K-均值聚类算法。

主 题 词:文本聚类 K-均值算法 遗传算法 可变染色体长度编码 Reuters数据集 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2008.14.077

馆 藏 号:203341815...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分