看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Hadoop的仿射传播大数据聚类分析方法 收藏
基于Hadoop的仿射传播大数据聚类分析方法

基于Hadoop的仿射传播大数据聚类分析方法

作     者:唐东明 TANG Dongming

作者机构:西南交通大学信息化研究院成都610031 

基  金:国家自然科学基金(No.61100118 No.61003142 No.61373009) 中央高校基本科研业务费专项资金资助(No.2682014CX100) 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2015年第51卷第4期

页      码:29-34页

摘      要:仿射传播聚类算法(AP)是一个新的聚类分析方法,已经被广泛应用于各种领域。APC算法不能用于大型数据的分析。为了克服这个限制,在Hadoop分布式框架的基础上提出一种改进的放射传播聚类分析方法(基于Hadoop的仿射传播大数据聚类分析方法,简称APCH)。通过在Hadoop环境下重新设计算法流程,APCH算法成为了一个并行化的大数据聚类分析方法。此外APCH算法能够高效操作大数据,并能够直接决定聚类的个数。为了验证方法的性能,在多个数据集上进行了实验。实验结果表明APCH对大数据处理有很好的适应性和延展性。APCH采用开源的方式提供可执行软件程序和源代码,用户可以下载后部署在自己的分布式集群中或者是部署在亚马逊EC2等云计算环境中。所有编译后的执行程序,源代码,用户手册,部分测试数据集均可以从https://***/Hello World CN/Map Reduce APC上下载。

主 题 词:仿射传播聚类 Map Reduce Hadoop 键值存储 大数据 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.3778/j.issn.1002-8331.1403-0492

馆 藏 号:203371852...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分