看过本文的还看了

相关文献

该作者的其他文献

文献详情 >文档分类中的多特征最大值法及其改进方法 收藏
文档分类中的多特征最大值法及其改进方法

文档分类中的多特征最大值法及其改进方法

作     者:龚静 黄欣阳 GONG Jing HUANG Xin-yang

作者机构:湖南环境生物职业技术学院信息技术系湖南衡阳421001 南华大学计算机学院湖南衡阳421001 

基  金:湖南省教育厅基金项目(12C1056) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2017年第38卷第8期

页      码:2262-2268页

摘      要:为在每个文档类别中选择更多的特征,解决至少一个特征法(ALOF)的特征不足问题,提出文档特征最大值法(MFT)和改进的文档特征最大值法(IMFT)。按照数据处理方式决定选择特征的数量,MFT法解析所有文档,确保训练集中每个文档都用最终特征矢量来表示,IMFT法只分析特征评估函数中特征值高的文档以选择较少的特征,减少选择不相关特征的概率。实验考虑3个文档分类数据库和3个评估函数,实验结果表明,与ALOF法和模糊关联聚类(FRC)法相比,提出的两种方法的F1测度更高,分类效果更好,评估函数对最终的分类结果具有重要影响,不同的特征数会左右最终结果。

主 题 词:文档分类 评估函数 特征最大值 F1测度 特征数 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208s/j.issn1000-7024.2017.08.050

馆 藏 号:203255421...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分