看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进FP-tree的最大频繁项目集挖掘算法 收藏
基于改进FP-tree的最大频繁项目集挖掘算法

基于改进FP-tree的最大频繁项目集挖掘算法

作     者:马丽生 姚光顺 杨传健 MALi-sheng;YAO Guang-shun;YANG Chuan-jian

作者机构:滁州学院计算机与信息工程学院安徽滁州239000 

基  金:安徽省高校省级自然科学研究项目(KJ2010B421 KJ2011Z276) 安徽省高校省级优秀青年人才基金项目(2010SQRL137 2011SQRL123) 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2012年第32卷第2期

页      码:326-329页

摘      要:针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存条件模式基的存储空间开销。在分析最大频繁项目集挖掘算法中搜索空间以及数据表示方法的基础上,通过理论分析和证明,设计了剪枝策略和压缩策略,缩小了算法搜索空间,压缩了FP-tree的规模,提高了算法的执行效率。最后将新算法分别与NHTFPG算法、FpMAX算法进行对比,验证算法的正确性和有效性。实验结果表明,新算法保存FP-tree条件模式基所需要的存储空间不到NHTFPG算法的50%,执行效率比FpMAX算法提高了2~3倍。

主 题 词:频繁项目集 最大频繁项目集 条件模式基 项头表 剪枝策略 压缩策略 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 

核心收录:

D O I:10.3724/SP.J.1087.2012.00326

馆 藏 号:203111872...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分