看过本文的还看了

相关文献

该作者的其他文献

文献详情 >在分布式数据流中查找近期频繁项方法的研究 收藏
在分布式数据流中查找近期频繁项方法的研究

在分布式数据流中查找近期频繁项方法的研究

作     者:任家东 李可 冯佳音 杨楠 REN Jia-Dong;LIKe;FENG Jia-Yin;YANG Nan

作者机构:燕山大学信息科学与工程学院河北秦皇岛066004 燕山大学电气工程学院河北秦皇岛066004 

出 版 物:《计算机科学》 (Computer Science)

年 卷 期:2008年第35卷第3期

页      码:206-208页

摘      要:传统的分布式数据流挖掘模型是一种挖掘结果中逐层进行的层次模型,通信带宽是一个瓶颈。为了减少分布式数据流结点的通信,本文采用一种基于数据密度的偏倚抽样方法对分布式数据流组中的每个流进行抽样,只维护抽样数据中最近期的元素。在频繁项挖掘过程中,设计了一种哈希计数方法(不同于传统哈希计数算法),可以同时对数据的计数进行增加和删减,计数的值是有一定误差保证的近似值,算法称为FFIDDS算法。实验结果证明,通信负担和处理时间均明显比传统HCS模型的算法优秀。

主 题 词:分布式数据流 频繁项 算法 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 08[工学] 081201[081201] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1002-137X.2008.03.064

馆 藏 号:203640424...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分