看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种基于主成分和密度的改进型动态数据流聚类算法 收藏
一种基于主成分和密度的改进型动态数据流聚类算法

一种基于主成分和密度的改进型动态数据流聚类算法

作     者:琚春华 梅铮 许翀寰 Ju Chunhua;Mei Zheng;Xu Chonghuan

作者机构:浙江工商大学计算机与信息工程学院杭州310018 

基  金:国家自然科学基金(编号:70671094) 浙江省自然科学基金重点项目(编号:Z1091224) 浙江省自然科学基金(编号:Y1090617) 浙江省科技计划项目(编号:2009C13G2050020) 

出 版 物:《情报学报》 (Journal of the China Society for Scientific and Technical Information)

年 卷 期:2010年第29卷第4期

页      码:579-585页

摘      要:本文主要研究了在有限资源约束下的数据流聚类方法。针对海量,高速的数据流,现有聚类方法在有界内存和有界时间的限制下,难以快速有效地进行聚类,设计了一种基于主成分和密度的动态数据流聚类算法,PDStream算法.它采用滑动窗口管理数据流;首先使用主成分模型作为前置系统,它负责对基本窗口内的源数据进行属性转换,起到了降维的作用;然后使用密度聚类模型作为后置系统进行聚类操作;最后对系统中生成的概要数据进行简化的二次聚类并更新聚类簇。通过实验表明,PDStream算法有效克服了STREAM算法使得聚类受控于历史数据的缺点,显现出处理海量数据的优越性以及聚类质量高的特点。

主 题 词:数据流聚类 主成分分析 密度 滑动窗口 

学科分类:08[工学] 080203[080203] 0802[工学-机械学] 

核心收录:

D O I:10.3772/j.issn.1000-0135.2010.04.001

馆 藏 号:203241226...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分