看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种面向大数据集的粗粒度并行聚类算法研究 收藏
一种面向大数据集的粗粒度并行聚类算法研究

一种面向大数据集的粗粒度并行聚类算法研究

作     者:向尧 袁景凌 钟珞 赵彦鹏 XIANG Yao;YUAN Jing-ling;ZHONG Luo;ZHAO Yan-peng

作者机构:武汉理工大学计算机科学与技术学院武汉430070 

基  金:国家自然科学基金项目(61303029)资助 武汉市科技创新团队项目(201307020402005)资助 中央高校基本科研专项基金项目(2013-IV-054 145210007)资助 

出 版 物:《小型微型计算机系统》 (Journal of Chinese Computer Systems)

年 卷 期:2014年第35卷第10期

页      码:2370-2374页

摘      要:随着大数据时代的到来,面对数据量剧增,传统的聚类算法将面临极大的挑战.为了提高聚类算法的效率,本文基于Hadoop平台设计与实现了并行化的Partitioning Around Medoid聚类算法,并从优化聚类单元和聚类中心的角度,结合视觉聚类的核心思想提出了粗粒度聚类单元策略(Coarse-Grained Clustering Unit Strategy).通过多组实验比较,结果表明,在粗粒度聚类单元策略的优化下算法在运行效率,计算能力等方面提高6%以上,所实现的并行算法具有良好的加速比,扩展比和伸缩率.研究结果为以后的大数据集下的聚类分析奠定了基础.

主 题 词:云计算 大数据 PAM 粗粒度 Hadoop 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1000-1220.2014.10.032

馆 藏 号:203843420...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分