看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种基于交叉熵的top-k频繁项集挖掘算法 收藏
一种基于交叉熵的top-k频繁项集挖掘算法

一种基于交叉熵的top-k频繁项集挖掘算法

作     者:宋威 郑川龙 SONG Wei;ZHENG Chuanlong

作者机构:北方工业大学信息学院北京100144 

基  金:国家自然科学基金项目(61977001) 北京市长城学者培养计划项目(CIT&TCD20190305) 

出 版 物:《郑州大学学报(理学版)》 (Journal of Zhengzhou University:Natural Science Edition)

年 卷 期:2022年第54卷第4期

页      码:27-33页

摘      要:通过指定期望结果项集数量挖掘top-k频繁项集,可解决频繁项集挖掘中支持度阈值难以设定的问题。由于能在较短的时间内得到足够多的精确结果,因此利用启发式方法挖掘项集的工作受到了越来越多的关注,但利用启发式方法来挖掘top-k频繁项集却鲜有研究。提出了一种基于交叉熵的top-k频繁项集挖掘算法KCE。首先,给出了将交叉熵应用于top-k频繁项集挖掘的建模方法;其次,提出了基于过滤支持度的搜索空间剪枝策略;第三,设计了利用按位交叉来产生下一代项集的策略,以提高样本的多样性。实验结果表明,KCE算法在运行时间和空间消耗上都有优势,且挖掘结果的平均精度在95%以上。

主 题 词:数据挖掘 top-k频繁项集 交叉熵 过滤支持度 按位交叉 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

D O I:10.13705/j.issn.1671-6841.2021313

馆 藏 号:203111246...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分