看过本文的还看了

相关文献

该作者的其他文献

文献详情 >哈萨克语文本分类系统的设计与实现 收藏
哈萨克语文本分类系统的设计与实现

哈萨克语文本分类系统的设计与实现

作     者:玛依来.哈帕尔 古丽拉.阿东别克 Mayra Hapar;Gulila Altenbek

作者机构:新疆大学信息科学与工程学院乌鲁木齐830046 

基  金:国家自然科学基金资助项目"现代哈萨克语词级文本语料库构建技术研究"(60763005) 国家教育部 国家语委民族语言文字规范标准建设及信息化科研项目"基于语料库的哈萨克语词语标注规范研究"(MZ115-92) 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2011年第37卷第5期

页      码:196-198页

摘      要:利用K-最近距离算法对哈萨克语文本进行分类,通过统计词频信息和语言信息相结合的方法选择特征,实现一个哈萨克语文本分类系统。在计算特征权重值时不仅考虑词频,还利用特征的集中度、分散度,经过训练和统计对每一类哈萨克语文本形成特征的权重向量,根据K-最近距离算法判断测试文本的所属类别,实验结果表明该方法可行。

主 题 词:文本分类 K-最近距离 集中度 分散度 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1000-3428.2011.05.066

馆 藏 号:203756535...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分