看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于X^2统计的改进文本特征选择方法 收藏
基于X^2统计的改进文本特征选择方法

基于X^2统计的改进文本特征选择方法

作     者:闫健卓 李鹏英 方丽英 龙丽英 刘欣悦 YAN Jian-zhuo;LI Peng-ying;FANG Li-ying;LONG Li-ying;LIU Xin-yue

作者机构:北京工业大学电控学院北京100022 

基  金:国家自然科学基金项目(61174109) 北京市委组织部优秀人才培养计划基金项目(2010D005015000001) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2016年第37卷第5期

页      码:1391-1394页

摘      要:为克服传统X^2统计模型未考虑特征词频数因素不足的缺陷,根据特征项的词频数及其在类间、类内不同分布情况,提出一种改进的X^2统计特征选择方法,使特征频数信息得到有效利用。实验对比改进前后的方法对文本分类的结果,实验结果表明,改进后方法的分类效果优于传统X^2统计方法,验证了其有效性。

主 题 词:文本分类 特征选择 X2统计 特征频数 特征分布 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2016.05.051

馆 藏 号:203536343...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分