看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种可重叠子空间K-Means聚类算法 收藏
一种可重叠子空间K-Means聚类算法

一种可重叠子空间K-Means聚类算法

作     者:刘宇航 马慧芳 刘海姣 余丽 LIU Yuhang;MA Huifang;LIU Haijiao;YU Li

作者机构:西北师范大学计算机科学与工程学院兰州730070 桂林电子科技大学广西可信软件重点实验室广西桂林541004 

基  金:国家自然科学基金(61762078,61363058) 广西可信软件重点实验室研究课题(kx202003) 广西多源信息挖掘与安全重点实验室开放基金(MIMS18-08) 西北师范大学2019年度青年教师科研能力提升计划重大项目(NWNU-LKQN2019-2) 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2020年第46卷第8期

页      码:58-63,71页

摘      要:现有聚类算法面向高维稀疏数据时多数未考虑类簇可重叠和离群点的存在,导致聚类效果不理想。为此,提出一种可重叠子空间K-Means聚类算法。设计类簇子空间计算策略,在聚类过程中动态更新每个类簇的属性子空间,并定义合理的约束函数指导聚类过程,从而实现类簇的可重叠性与离群点的控制。在此基础上定义合理的目标函数对传统K-Means算法进行修正,利用熵权约束分别计算每个类簇中各维度的权重,使用权重值标识不同类簇中维度的相对重要性,并加入控制重叠程度和离群值数量的参数。在人工数据集和真实数据集上的实验结果表明,该算法在NMI、F1指标上均优于EWKM、NEO-K-Means、OKM等子空间聚类算法,具有更好的聚类结果。

主 题 词:目标函数 子空间聚类 离群点 熵权约束 K-Means聚类算法 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.19678/j.issn.1000-3428.0054555

馆 藏 号:203967454...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分