看过本文的还看了

相关文献

该作者的其他文献

文献详情 >改进的基于词集距离的FTC聚类算法 收藏
改进的基于词集距离的FTC聚类算法

改进的基于词集距离的FTC聚类算法

作     者:王秀慧 赵治军 WANG Xiu-hui;ZHAO Zhi-jun

作者机构:山西大同大学教育科学与技术学院山西大同037009 大同市人民政府信息化中心山西大同037009 

基  金:大同市科技计划基金项目(2018187) 山西省教育科学"十二五"规划基金项目(GH-13091) 山西大同大学青年基金项目(2016Q9) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2019年第40卷第11期

页      码:3175-3179页

摘      要:针对FTC在实现聚类的过程中忽略了文本词语有序性这一特征,结合算法时间复杂度,提出基于词集距离的WSD-FTC文本聚类算法。在采用FP-Growth挖掘频繁项集的过程中通过限制词集距离得到质量更高、数量更少的频繁项集,以此作为聚类依据。通过定义簇间相似系数保证多主题文本归入不同簇中,实现一定程度的软聚类。实验结果表明,WSD-FTC具有更好的聚类效果及更优的时间开销。

主 题 词:频繁项集 聚类 词集距离 簇间相似系数 软聚类 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2019.11.019

馆 藏 号:203823894...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分