看过本文的还看了

相关文献

该作者的其他文献

文献详情 >类别混叠度对非均衡数据分类的有效性分析 收藏
类别混叠度对非均衡数据分类的有效性分析

类别混叠度对非均衡数据分类的有效性分析

作     者:邢延 陈嘉锋 贾小彦 汪新 Xing Yan;Chen Jiafeng;Jia Xiaoyan;Wang Xin

作者机构:广东工业大学自动化学院广州510006 广东工业大学土木与交通工程学院广州510006 

基  金:国家自然科学基金(51378128)资助项目 广东省自然科学基金(2015A030313498)资助项目 

出 版 物:《数据采集与处理》 (Journal of Data Acquisition and Processing)

年 卷 期:2018年第33卷第5期

页      码:936-944页

摘      要:类别混叠度是指不同类别数据之间互相交叠、混合的程度,其量化指标包含基于几何统计的和基于信息论的两类,用于衡量数据分类的难易。实际分类任务中存在大量的非均衡数据,大类与小类样本之间悬殊的数量差别给分类造成了极大的困难。本文采用实验研究的方法,验证类别混叠度量化指标指导非均衡数据分类的有效性,以减少甚至避免盲目试错带来的庞大计算开销。首先,针对两类分类问题,设计验证实验,在不同类数据非均衡率,不同别边界形状、不同特征类型、不同概率分布的非均衡仿真数据上研究类别混叠度的有效性。其次,在实验研究的基础上,分析数据的非均衡性对类别混叠度的影响规律,找出类别混叠度指导非均衡分类的有效方法。最后,在真实的非均衡数据上验证类别混叠度指导非均衡分类的实际效果。实验结果表明,对数据的非均衡率具有较强鲁棒性的类别混叠度量化指标可以有效地指导非均衡数据的分类器选择。

主 题 词:类别混叠度 分类复杂度 非均衡数据 分类 非均衡率 

学科分类:0810[工学-土木类] 081203[081203] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.16337/j.1004-9037.2018.05.019

馆 藏 号:203393482...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分