看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于DiffNodeset结构的最大频繁项集挖掘算法 收藏
基于DiffNodeset结构的最大频繁项集挖掘算法

基于DiffNodeset结构的最大频繁项集挖掘算法

作     者:尹远 张昌 文凯 郑云俊 YIN Yuan;ZHANG Chang;WEN Kai;ZHENG Yunjun

作者机构:重庆邮电大学通信新技术应用研究中心重庆400065 中国电信股份有限公司重庆分公司重庆401121 重庆信科设计有限公司重庆401121 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2018年第38卷第12期

页      码:3438-3443页

摘      要:在数据挖掘中,通过挖掘最大频繁项集来代替挖掘频繁项集可以大大地提升系统的运行效率。针对现有的最大频繁项集挖掘算法的运行时间消耗仍然很大的问题,提出了一种基于DiffNodeset结构的最大频繁项集挖掘(DNMFIM)算法。首先,采用了一种新的数据结构DiffNodeset来实现求交集以及支持度的快速计算;其次,引入一种新的线性复杂度的连接方法来降低两个DiffNodeset在连接过程中的复杂度,避免了多次的无效计算;然后,将集合枚举树作为搜索空间,同时采用多种优化剪枝策略来缩小搜索空间;最后,再结合最大频繁项集挖掘算法(MAFIA)中所使用的超集检测技术来有效地提高算法的准确性。实验结果表明,DNMFIM算法在时间效率方面性能优于MAFIA与基于N-list的MAFIA(NB-MAFIA),该算法在不同类型数据集中进行最大频繁项集挖掘时均有良好的效果。

主 题 词:最大频繁项集挖掘 关联规则 集合枚举树 优化剪枝 超集检测 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 

D O I:10.11772/j.issn.1001-9081.2018040913

馆 藏 号:203430191...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分