看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向高维数据的低冗余top-k异常点发现方法 收藏
面向高维数据的低冗余top-k异常点发现方法

面向高维数据的低冗余top-k异常点发现方法

作     者:陈冠华 马秀莉 杨冬青 唐世渭 帅猛 谢昆青 Chen Guanhua;Ma Xiuli;Yang Dongqing;Tang Shiwei;Shuai Meng;Xie Kunqing

作者机构:北京大学信息科学技术学院北京100871 机器感知与智能教育部重点实验室(北京大学)北京100871 高可信软件技术教育部重点实验室(北京大学)北京100871 

基  金:国家"八六三"高技术研究发展计划基金项目(2007AA120502) 国家自然科学基金项目(60874082) 

出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)

年 卷 期:2010年第47卷第5期

页      码:788-795页

摘      要:异常发现是数据挖掘领域的一类重要任务.针对高维对象的异常度量问题和异常点集合的冗余问题,提出了一种新的面向高维数据的异常点发现方法.该方法通过采用高维数据的二部图表示,以高维对象的压缩能力作为其异常程度的度量,能够有效支持包含不同类型属性的高维数据.为了解决top-k异常点集合中的冗余问题,提出了低冗余top-k异常点的概念.由于精确计算低冗余的top-k异常点是NP-hard问题,设计了计算近似低冗余的top-k异常点的启发式方法k-AnomaliesHD算法.从在真实和人工数据集上的实验结果可以看出,该方法具有较好的扩展性;而且与不考虑冗余的异常点发现方法相比较,能够更有效地概括数据中的异常模式.

主 题 词:数据挖掘 异常检测 高维数据 低冗余 异常度量 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 

核心收录:

馆 藏 号:203154810...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分