看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于共识和分类改善文档聚类的识别信息方法 收藏
基于共识和分类改善文档聚类的识别信息方法

基于共识和分类改善文档聚类的识别信息方法

作     者:王留洋 俞扬信 陈伯伦 章慧 WANG Liuyang;YU Yangxin;CHEN Bolun;ZHANG Hui

作者机构:淮阴工学院计算机与软件工程学院江苏淮安223003 

基  金:国家自然科学基金资助项目(61602202) 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2020年第40卷第4期

页      码:1069-1073页

摘      要:不同的聚类算法用于设计各自的策略,然而,每种技术在执行特定数据集时都有一定的局限性。选择恰当的识别信息方法(DIM)可确保文档聚类的进行。针对这些问题提出一种基于共识和分类的文档聚类(DCCC)的DIM。首先,选择识别信息最大化聚类(CDIM)作为数据集生成初始聚类的解决方法,并使用两种不同的CDIM方法生成两个初始聚集;其次,使用不同的参数方法对两初始聚集再进行初始化,通过簇标签信息间的关系建立共识,最大限度地提高文档的识别数总和;最后,选择识别文本权重分类(DTWC)作为文本分类器给共识分配新的簇标签,通过训练文本分类器更改基础分区,并根据预报标签信息生成最后的分区。采用8个网络数据集进行实验,选择BCubed的精度和召回率指标进行聚类验证。实验结果表明,所提出的共识分类方法的聚类结果优于对比方法的聚类结果。

主 题 词:共识聚类 文档聚类 识别信息 簇标签 文本分类器 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.11772/j.issn.1001-9081.2019091540

馆 藏 号:203901289...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分