看过本文的还看了

相关文献

该作者的其他文献

文献详情 >并行Fp-growth算法在搜索引擎中的应用 收藏
并行Fp-growth算法在搜索引擎中的应用

并行Fp-growth算法在搜索引擎中的应用

作     者:黄剑 李明奇 郭文强 HUANG Jian;LI Ming-qi;GUO Wen-qiang

作者机构:电子科技大学数学科学学院成都611731 新疆财经大学计算机科学与工程学院乌鲁木齐830012 

基  金:国家自然科学基金(61163066)资助 

出 版 物:《计算机科学》 (Computer Science)

年 卷 期:2015年第42卷第S1期

页      码:459-461 483,483页

摘      要:针对用户历史检索过程产生的Web日志文件,研究其查询词和点击链接是否为频繁集,以及在分布式条件下频繁集挖掘的效率问题。基于Hadoop框架,设计了并行Fp-growth算法,对搜索引擎Web日志进行挖掘。仿真实验结果显示,满足支持度的查询词和点击链接频繁集在Web日志中普遍存在。随着Hadoop节点数的增加,并行Fpgrowth算法性能将得到大幅提高。由此,频繁集挖掘效率得到明显提高,且数据量越大,效率提升越明显。

主 题 词:日志文件 频繁集 Hadoop Fp-growth 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

馆 藏 号:203144815...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分