看过本文的还看了

相关文献

该作者的其他文献

文献详情 >Kmeans算法的Spark实现及优化 收藏
Kmeans算法的Spark实现及优化

Kmeans算法的Spark实现及优化

作     者:张友海 李锋刚 ZHANG You-hai;LI Feng-gang

作者机构:安徽职业技术学院信息工程系合肥230011 合肥工业大学管理学院合肥230009 

基  金:国家自然科学青年基金:"基于多重分形和文本数据流技术的网络金融信息动态挖掘研究"(71301041) 

出 版 物:《西安文理学院学报(自然科学版)》 (Journal of Xi’an University(Natural Science Edition))

年 卷 期:2017年第20卷第3期

页      码:18-20,32页

摘      要:聚类算法作为机器学习领域的一个至关重要的算法体系,已经被深入研究和广泛使用了很多年,其主要研究内容集中在用相似距离作为依据,其中Kmeans算法应用极为广泛,被添加到各种数据挖掘软件包中.传统的Kmeans算法不能满足今天大数据环境下的应用,文中利用Spark技术将其改进为并行化的设计思想并进行优化.

主 题 词:Kmeans算法 Spark 并行化 优化 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 

D O I:10.3969/j.issn.1008-5564.2017.03.004

馆 藏 号:203231137...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分