看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于HDBACAN聚类的自适应过采样技术 收藏
基于HDBACAN聚类的自适应过采样技术

基于HDBACAN聚类的自适应过采样技术

作     者:董宏成 赵学华 赵成 刘颖 解如风 DONG Hong-cheng;ZHAO Xue-hua;ZHAO Cheng;LIU Ying;XIE Ru-feng

作者机构:重庆邮电大学通信与信息工程学院重庆400065 重庆市质量和标准化研究院重庆400023 重庆信科设计有限公司重庆401121 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2020年第41卷第5期

页      码:1295-1300页

摘      要:为克服不平衡数据集中存在的噪声、小分离、类内和类间不平衡问题,提出一种基于HDBSCAN(hierarchical density-based spatial clustering of applications with noise)聚类的自适应过采样技术。该技术只对HDBSCAN发现的任意形状的集群进行过采样,在稀疏度大的集群中自适应地合成较多的样本,在稀疏度小的集群中合成相对较少的样本,且合成的样本靠近集群中心。实验结果表明,该方法可有效避免不平衡数据集中噪声的产生,同时克服类间和类内不平衡问题,为不平衡学习提供了一种过采样策略。

主 题 词:类不平衡 聚类 过采样 不平衡学习 数据挖掘 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2020.05.015

馆 藏 号:203922888...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分