看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进权重贝叶斯的维文文本分类模型 收藏
基于改进权重贝叶斯的维文文本分类模型

基于改进权重贝叶斯的维文文本分类模型

作     者:李艳姣 蒋同海 

作者机构:中国科学院研究生院北京100080 中国科学院新疆理化技术研究所新疆乌鲁木齐830011 

基  金:新疆维吾尔自治区高技术研究发展基金项目(201012112) 新疆维吾尔自治区电子发展专项基金项目(XJDZZXZJ20109) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2012年第33卷第12期

页      码:4726-4730页

摘      要:为提高朴素贝叶斯分类器的分类性能,考虑决策分类过程中条件属性的不同重要程度,提出了一种基于特征选择权重的贝叶斯分类算法。采用卡方值和文档频数相结合的数值来表示特征词的重要程度,对该值进行处理获得每个特征词权重,建立加权贝叶斯分类器。在研究维文特点的基础上,利用该算法构建了一个维文文本分类模型。在搜集到的维文语料库上进行的实验结果表明,该算法比朴素贝叶斯拥有更好的分类性能。

主 题 词:文本分类 贝叶斯 卡方 加权 文档频率 特征选择 

学科分类:1305[艺术学-设计学类] 13[艺术学] 08[工学] 081104[081104] 0804[工学-材料学] 081101[081101] 0811[工学-水利类] 

D O I:10.16208/j.issn1000-7024.2012.12.035

馆 藏 号:203165396...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分