看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于广泛相似度的维吾尔语文档分类方案 收藏
基于广泛相似度的维吾尔语文档分类方案

基于广泛相似度的维吾尔语文档分类方案

作     者:如先姑力.阿布都热西提 亚森.艾则孜 年梅 Ruxianguli · ABUDUREXITI;Yasen · AIZEZI;NIAN Mei

作者机构:新疆警察学院信息安全工程系新疆乌鲁木齐830011 新疆师范大学计算机科学技术学院新疆乌鲁木齐830054 

基  金:新疆维吾尔自治区自然科学基金科研基金项目(2015211A016) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2017年第38卷第6期

页      码:1686-1691页

摘      要:针对维吾尔语文档自动分类问题,提出一种基于广泛相似度度量和K-means聚类的文档分类方案。将维吾尔语文档进行预处理,通过词频-逆向文档频率(TF-IDF)算法获得关键词集合;利用提出的广泛相似度度量,通过考虑与语料库中其它文档之间的距离,计算文档间的相似度;基于广泛相似度构建一个集群距离矩阵,获得一组基础集群;将基础集群的中心作为K-means聚类的初始中心,完成所有文档的聚类。实验结果表明,该方案具有较高的分类精度和较低的计算时间。

主 题 词:维吾尔语 文档分类 广泛相似度 K-means聚类 词频-逆向文档频率 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2017.06.054

馆 藏 号:203233442...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分