看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于特征信息增益权重的文本分类算法 收藏
基于特征信息增益权重的文本分类算法

基于特征信息增益权重的文本分类算法

作     者:李文斌 刘椿年 陈嶷瑛 LI Wen-bin;LIU Chun-nian;CHEN Yi-ying

作者机构:北京工业大学计算机学院多媒体与智能软件技术北京重点实验室北京100022 石家庄经济学院信息工程系石家庄050031 

基  金:国家自然科学基金资助项目(60173014) 北京市自然科学基金资助项目(4022003) 

出 版 物:《北京工业大学学报》 (Journal of Beijing University of Technology)

年 卷 期:2006年第32卷第5期

页      码:456-460页

摘      要:为了在分类精度不受损失的情况下提高训练速度,设计了3种基于信息增益(information gain,简称IG) 特征权重的分类算法,分别被命名为:IG-C1、IG-C2、IG-C.它们根据特征对IG贡献的大小及在新文本中出现的次数进行分类.这3种算法都具有较低的时间复杂度和实现简单的特点.实验结果表明,其中IG-C的分类效果最为理想.

主 题 词:文本处理 信息分类 特征提取  

学科分类:0810[工学-土木类] 08[工学] 080401[080401] 0804[工学-材料学] 080402[080402] 0805[工学-能源动力学] 0835[0835] 081002[081002] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.0254-0037.2006.05.015

馆 藏 号:203201540...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分