看过本文的还看了

相关文献

该作者的其他文献

文献详情 >采用N-list结构的混合并行频繁项集挖掘算法 收藏
采用N-list结构的混合并行频繁项集挖掘算法

采用N-list结构的混合并行频繁项集挖掘算法

作     者:刘卫明 张弛 毛伊敏 LIU Weiming;ZHANG Chi;MAO Yimin

作者机构:江西理工大学信息工程学院江西赣州341000 

基  金:国家重点研发计划(2018YFC1504705) 国家自然科学基金(41562019) 江西省教育厅科技项目(GJJ151528,GJJ151531) 

出 版 物:《计算机科学与探索》 (Journal of Frontiers of Computer Science and Technology)

年 卷 期:2022年第16卷第1期

页      码:120-136页

摘      要:针对大数据环境下并行MRPrePost频繁项集挖掘算法中存在计算节点负载不均衡,N-list合并效率低以及冗余搜索等问题,提出了基于N-list结构的混合并行频繁项集挖掘算法HP-FIMBN。首先,设计负载量估计函数(LE)来计算出频繁1项集F-list中每一项的负载量,同时提出基于贪心策略的分组方法(GM-GS)将F-list中的每一项根据其负载量进行均匀分组,既解决了数据划分中计算节点负载不均衡的问题,又降低了集群中各节点上子PPC-Tree树的规模;其次,提出预先放弃策略(EAS),该策略不仅能有效避免合并过程中的无效计算,而且不需要遍历初始N-list结构就能得到最终的N-list,极大地提高了N-list结构的合并效率;最后,采用集合枚举树作为搜索空间,并提出超集等价剪枝策略(SES)来避免挖掘过程中的冗余搜索,生成最终的挖掘结果。实验结果表明,该算法在大数据环境下进行频繁项集挖掘具有较好的效果。

主 题 词:频繁项集挖掘 N-list结构 贪心策略 集合枚举树 超集等价剪枝策略(SES) 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

核心收录:

D O I:10.3778/j.issn.1673-9418.2008068

馆 藏 号:203107093...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分