看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于云计算平台Hadoop的HKM聚类算法设计研究 收藏
基于云计算平台Hadoop的HKM聚类算法设计研究

基于云计算平台Hadoop的HKM聚类算法设计研究

作     者:张淑芬 董岩岩 陈学斌 ZHANG Shu-fen;DONG Yan-yan;Chen Xue-bin

作者机构:华北理工大学理学院河北唐山063009 河北省数据科学与应用重点实验室河北唐山063009 

出 版 物:《应用科学学报》 (Journal of Applied Sciences)

年 卷 期:2018年第36卷第3期

页      码:524-534页

摘      要:为有效解决传统K-means聚类算法在处理大规模数据集时面临的扩展性问题,提出了一种Hadoop K-means聚类算法.该算法首先根据样本密度剔除数据集中孤立点或者噪声点的影响,再利用最大化最小距离思想选取K个初始中心,使初始聚簇中心点最优化,最后用Hadoop云计算平台的Map Reduce编程模型实现算法的并行化.实验结果表明,该算法不仅在聚类结果上具有较高的准确率和稳定性,而且能够很好地解决传统聚类算法在处理大规模数据时所面临的扩展性问题.

主 题 词:K-means算法 样本密度 最大化最小距离 Hadoop平台 并行化计算 

学科分类:0810[工学-土木类] 0808[工学-自动化类] 081203[081203] 08[工学] 0805[工学-能源动力学] 0835[0835] 0701[理学-数学类] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.0255-8297.2018.02.012

馆 藏 号:203289693...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分