看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于测地距离的GIDGC-KNN不平衡数据分类器 收藏
基于测地距离的GIDGC-KNN不平衡数据分类器

基于测地距离的GIDGC-KNN不平衡数据分类器

作     者:张立旺 师智斌 ZHANG Li-wang;SHI Zhi-bin

作者机构:中北大学计算机与控制工程学院山西太原030051 

基  金:国家自然科学基金项目(50976108) 山西省自然科学基金项目(2012011011-3) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2016年第37卷第2期

页      码:389-395页

摘      要:IDGC(imbalanced data gravitation classification)在不平衡数据分类中使用欧式距离计算引力时,未能考虑数据分布性状和待测数据近邻类相关性,存在准确率低的问题,为此提出一种基于测地距离的GIDGC-KNN不平衡数据分类器模型。在IDGC基础上引入放大引力系数(amplified gravitation coefficient,AGC),结合测地距离和KNN(K-nearest neighbor)算法得到数据分布隐含的全局几何结构和近邻样本类相关性。该模型适应高维具有流形结构的数据,继承了KNN近邻样本类相关性的优点。KEEL数据集上的实验结果表明,与IDGC算法、数据层面算法、代价敏感学习算法和集成方法算法相比,GIDGC-KNN在高不平衡数据集上比在低不平衡数据集上有明显的分类性能优势和良好的泛化能力。

主 题 词:测地距离 K-近邻 数据引力 不平衡数据 分类 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2016.02.021

馆 藏 号:203890130...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分