看过本文的还看了

相关文献

该作者的其他文献

文献详情 >云计算平台中分布式Hadoop数据挖掘关键技术研究(英文) 收藏
云计算平台中分布式Hadoop数据挖掘关键技术研究(英文)

云计算平台中分布式Hadoop数据挖掘关键技术研究(英文)

作     者:何婕 赖敏 Jie HE;Min LAI

作者机构:重庆广播电视大学电子信息工程学院重庆401520 重庆工程学院软件与计算机学院重庆401320 

基  金:Chongqing Science and Technology Research Project of the Education Commission(KJ1737458)~~ 

出 版 物:《机床与液压》 (Machine Tool & Hydraulics)

年 卷 期:2018年第46卷第24期

页      码:144-149页

摘      要:云计算环境下的大数据特征挖掘是大数据统计及分析的基础。为了提高聚类的准确度和速度,设计了一种基于分布式Hadoop平台和熵加权特征选择的数据挖掘方案。该方案首先采用无回路有向图对Hadoop平台下的Map Reduce作业流调度问题进行了分析。然后采用并行Map Reduce执行过程完成分布式计算。最后,采用熵加权聚类算法实现海量数据挖掘。仿真结果显示,提出的数据挖掘方案具有较好聚类效果和运行效率。

主 题 词:云计算 大数据挖掘 Map Reduce Hadoop 熵加权 聚类算法 

学科分类:0810[工学-土木类] 08[工学] 081001[081001] 

D O I:10.3969/j.issn.1001-3881.2018.24.023

馆 藏 号:203430139...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分