看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向长尾分布数据的在线流特征选择 收藏
面向长尾分布数据的在线流特征选择

面向长尾分布数据的在线流特征选择

作     者:范凯钧 林耀进 张智慧 毛煜 王晨曦 FAN Kaijun;LIN Yaojin;ZHANG Zhihui;MAO Yu;WANG Chenxi

作者机构:闽南师范大学计算机学院福建漳州363000 数据科学与智能应用福建省高等学校重点实验室闽南师范大学福建漳州363000 

基  金:国家自然科学基金面上项目(62076116) 福建省自然科学基金重点项目(2021J02049) 

出 版 物:《昆明理工大学学报(自然科学版)》 (Journal of Kunming University of Science and Technology(Natural Science))

年 卷 期:2023年第48卷第1期

页      码:77-88页

摘      要:在开放动态环境下分类学习的任务中,数据通常存在类别长尾分布的特点,且数据标记空间存在层次化结构关系以及动态性.针对实际任务中不同的需求,许多特征选择算法被提出,但是这些已有的特征选择算法忽略数据的长尾分布特点和特征空间的不确定性.针对上述问题,文中提出基于邻域粗糙集的长尾分布数据在线流特征选择算法.借助邻域粗糙集模型,并考虑邻域内样本间的关系后,定义了自适应邻域关系,设计基于稀有类样本重要性的依赖度计算公式.同时,利用层次结构降低类别不平衡性,提出在线冗余度分析和在线重要度分析两种在线特征评价指标,用于选出具有高可分离性和强区分性的特征子集.实验结果表明所提算法优于其它先进算法.

主 题 词:特征选择 长尾分布数据集 在线流特征选择 层次分类 邻域粗糙集 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.16112/j.cnki.53-1223/n.2023.01.136

馆 藏 号:203118549...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分