看过本文的还看了

相关文献

该作者的其他文献

文献详情 >Bagging中文文本分类器的改进方法研究 收藏
Bagging中文文本分类器的改进方法研究

Bagging中文文本分类器的改进方法研究

作     者:张翔 周明全 耿国华 ZHANG Xiang;ZHOU Ming-quan;GENG Guo-hua

作者机构:西北大学可视化技术研究所陕西西安710127 西安建筑科技大学信息与控制工程学院陕西西安710055 北京师范大学信息科学与技术学院北京100875 

基  金:国家自然科学基金项目(60736008)资助 

出 版 物:《小型微型计算机系统》 (Journal of Chinese Computer Systems)

年 卷 期:2010年第31卷第2期

页      码:281-284页

摘      要:在文本分类研究中,集成学习是一种提高分类器性能的有效方法.Bagging算法是目前流行的一种集成学习算法.针对Bagging算法弱分类器具有相同权重问题,提出一种改进的Bagging算法.该方法通过对弱分类器分类结果进行可信度计算得到投票权重,应用于Attribute Bagging算法设计了一个中文文本自动分类器.采用kNN作为弱分类器基本模型对Sogou实验室提供的新闻集进行分类.实验表明该算法比Attribute Bagging有更好的分类精度.

主 题 词:中文文本分类 可信度 Attribute Bagging 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

核心收录:

馆 藏 号:203119473...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分