看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向软件缺陷预测的聚类欠采样集成方法 收藏
面向软件缺陷预测的聚类欠采样集成方法

面向软件缺陷预测的聚类欠采样集成方法

作     者:陆鹏程 邱建林 卞彩峰 陈璐璐 陈翔 LU Peng-cheng;QIU Jian-lin;BIAN Cai-feng;CHEN Lu-lu;CHEN Xiang

作者机构:南通大学电子信息学院江苏南通226019 南通大学计算机科学与技术学院江苏南通226019 

基  金:国家自然科学基金项目(61202006 61272424) 计算机软件新技术国家重点实验室开放课题基金项目(KFKT2012B29) 江苏省自然科学基金项目(BK2010277) 江苏省科技创新基金项目(BC2013167) 江苏省高校自然科学基金项目(12KJB520014) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2016年第37卷第7期

页      码:1805-1810,1891页

摘      要:为缓解类不平衡问题对预测模型性能的影响,提出一种基于聚类的欠采样集成方法 CBUE(cluster-based undersampling ensemble method)。对多数类进行聚类分析,根据聚类的结果分布(即每个簇的大小比例)有放回地选择N个多数类的子集,N个子集分别和所有的少数类实例组成N个新的训练集;根据N个训练集训练出N个分类器,按照少数服从多数的原则生成一个新的集成分类器对新的数据进行预测。CBUE以NASA数据集作为评测对象,以balance、G-mean和AUC为评测指标,实验结果表明,该方法在大部分情况下要优于5种经典的基准方法 (ROS、RUS、SMOTE、RF和NB)。

主 题 词:类不平衡学习 软件缺陷预测 集成学习方法 欠采样 聚类 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2016.07.020

馆 藏 号:203174484...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分