看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于谱聚类的多数据流演化事件挖掘 收藏
基于谱聚类的多数据流演化事件挖掘

基于谱聚类的多数据流演化事件挖掘

作     者:杨宁 唐常杰 王悦 陈瑜 郑皎凌 YANG Ning;TANG Chang-Jie;WANG Yue;CHEN Yu;ZHENG Jiao-Ling

作者机构:四川大学计算机学院四川成都610065 

基  金:国家自然科学基金No.600773169 国家"十一.五"科技支撑计划No.2006BAI05A01~~ 

出 版 物:《软件学报》 (Journal of Software)

年 卷 期:2010年第21卷第10期

页      码:2395-2409页

摘      要:为解决从多数据流挖掘演化事件这一难题,提出了一种多数据流上的谱聚类算法SCAM(spectral clustering algorithm of multi-streams),其相似矩阵基于耦合度构造,而耦合度衡量了两个数据流的动态相似性.提出了算法EEMA(evolutionary events mining algorithm),该算法基于聚类模型的演变挖掘多数据流的演化事件.定义了聚类模型凝聚度,用以衡量聚类的紧凑程度,并证明了凝聚度的上界.基于到上界的距离和规范化相似矩阵的特征间隙,定义了聚类模型质量,并作为EEMA的优化目标自动地确定聚簇数k.设计了O-EEMA作为EEMA的优化实现,其时间复杂度为O(cn2/2).在合成和真实数据集上的实验结果表明,EEMA和O-EEMA是有效的、可行的.

主 题 词:多数据流 耦合聚类 演化事件 矩阵扰动 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.3724/sp.j.1001.2010.03745

馆 藏 号:203318272...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分