看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种基于类别强信息特征和贝叶斯算法的中文文本分类器 收藏
一种基于类别强信息特征和贝叶斯算法的中文文本分类器

一种基于类别强信息特征和贝叶斯算法的中文文本分类器

作     者:陈艳秋 孙培立 Chen Yanqiu;Sun Peili

作者机构:大连东软信息技术学院计算机科学与技术系辽宁大连100623 大连海洋大学经济管理学院辽宁大连100623 

出 版 物:《计算机应用与软件》 (Computer Applications and Software)

年 卷 期:2014年第31卷第8期

页      码:330-333页

摘      要:为了提高中文文本分类的效率与精度,设计一种新型的分类器。该分类器采用基于语料库的正向扫描统计分词。在词频统计阶段,采取训练阶段的按类别统计和测试阶段的按文章不同区域统计的方法;为了更好地选择特征词,提出了频度、集中度、相关度三个强信息特征标准;在特征权重计算上,提出了将词频和综合特征选择函数相结合的权重计算方法;最后,结合朴素贝叶斯原理进行分类。实验证明该分类器简单有效。

主 题 词:中文文本分类 特征选择 特征权重 分类算法 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1000-386x.2014.08.083

馆 藏 号:203136591...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分