看过本文的还看了

相关文献

该作者的其他文献

文献详情 >最大相关和最大差异的高维数据特征选择算法 收藏
最大相关和最大差异的高维数据特征选择算法

最大相关和最大差异的高维数据特征选择算法

作     者:孟圣洁 于万钧 陈颖 MENG Shengjie;YU Wanjun;CHEN Ying

作者机构:上海应用技术大学计算机科学与信息工程学院上海201418 

基  金:国家自然科学基金资助项目(61976140) 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2024年第44卷第3期

页      码:767-771页

摘      要:针对高维数据存在冗余信息且维度过高的问题,提出基于信息量的最大相关最大差异特征选择算法(MCD)。首先,利用互信息(MI)度量特征和标签之间的相关性,对特征进行排序,选择互信息最大的特征加入特征子集;然后,引入信息距离度量特征之间的信息冗余性及差异性,设计评价准则对每个特征进行评价,使特征子集中特征和标签的相关性、特征之间的差异性最大;最后,用前向搜索策略结合评价准则进行属性约简,最优化特征子集。采用2种不同的分类器,在6个数据集上和mRMR(minimal-Redundancy-Maximal-Relevance criterion)、RReliefF等5个经典算法进行对比实验,利用分类精度验证MCD的有效性。在支持向量机(SVM)分类器下,平均分类精度提高了5.67~23.80个百分点;在K-近邻(KNN)分类器下,平均分类精度提高了2.69~25.18个百分点。可见,MCD在绝大多数情况下,能有效去除冗余特征,分类精度有明显提高。

主 题 词:特征选择 高维数据 特征冗余 相关性 分类准确率 降维 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.11772/j.issn.1001-9081.2023030365

馆 藏 号:203126647...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分