看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种改进的加速K均值聚类算法 收藏
一种改进的加速K均值聚类算法

一种改进的加速K均值聚类算法

作     者:马俊宏 武丽芬 MA Junhong;WU Lifen

作者机构:晋中学院计算机科学与技术学院 

基  金:国家自然科学基金面上资助项目(61601334) 晋中学院“1331工程”重点创新团队建设计划资助项目(jzxycktd2017017) 

出 版 物:《太赫兹科学与电子信息学报》 (Journal of Terahertz Science and Electronic Information Technology)

年 卷 期:2019年第17卷第5期

页      码:885-891,897页

摘      要:针对当前聚类算法应用于大规模多类别数据集中时,计算量较大,且算法性能严重依赖于K值的不足,提出一种改进的加速K均值聚类算法。算法主要由两种策略组成:一是基于质心下界(PLB)的跳跃过程,新引入称为质心的固定点来计算对象和矩心间距离的下界,避免了常见聚类算法在收敛早期过程中的距离计算过程;二是基于不变矩心对(ICP)的跳跃过程,如果矩心更新步骤完成后被分配及未被分配矩心的位置保持不变,则维持对象分配策略不变且无需计算与未被分配矩心之间的距离。此外,还给出了将本文算法与Hamerly算法相结合的拓展算法以进一步提升聚类加速效果。对大规模高维图像数据集进行了仿真实验,结果表明,与Hamerly算法相比,本文算法在获得相同聚类效果的同时,极大地压缩了距离计算量。当K值较大时,本文算法的平均压缩率更高,平均耗时更少。

主 题 词:聚类 距离计算 质心下界 Hamerly算法 拓展算法 压缩率 耗时 

学科分类:080903[080903] 0809[工学-计算机类] 081203[081203] 08[工学] 080501[080501] 0805[工学-能源动力学] 080502[080502] 0835[0835] 0812[工学-测绘类] 

D O I:10.11805/TKYDA201905.0885

馆 藏 号:203817716...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分