看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Hadoop的Web日志挖掘 收藏
基于Hadoop的Web日志挖掘

基于Hadoop的Web日志挖掘

作     者:程苗 陈华平 CHENG Miao;CHEN Hua-ping

作者机构:中国科学技术大学管理学院合肥230026 中国科学技术大学计算机科学与技术学院合肥230026 

基  金:博士点基金资助项目(200803580024) 创新研究群体科学基金资助项目(70821001) 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2011年第37卷第11期

页      码:37-39页

摘      要:基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。为进一步验证该平台的高效性,在该平台上利用改进后的算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,在集群中运用分布式算法处理大量的Web日志文件,可以明显提高Web数据挖掘的效率。

主 题 词:云计算 Hadoop架构 Map/Reduce编程模式 Web日志挖掘 遗传算法 偏爱访问路径 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1000.3842.2011.11.013

馆 藏 号:203248620...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分