看过本文的还看了

相关文献

该作者的其他文献

文献详情 >关键语义信息补足的深度文本聚类算法 收藏
关键语义信息补足的深度文本聚类算法

关键语义信息补足的深度文本聚类算法

作     者:郑璐依 黄瑞章 任丽娜 白瑞娜 林川 Zheng Luyi;Huang Ruizhang;Ren Lina;Bai Ruina;Lin Chuan

作者机构:贵州大学公共大数据国家重点实验室贵阳550025 贵州大学计算机科学与技术学院贵阳550025 

基  金:国家自然科学基金资助项目(62066007) 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2023年第40卷第6期

页      码:1653-1659页

摘      要:针对大多数现有的深度文本聚类方法在特征映射过程中过于依赖原始数据质量以及关键语义信息丢失的问题,提出了一种基于关键语义信息补足的深度文本聚类算法(DCKSC)。该算法首先通过提取关键词数据对原始文本数据进行数据增强;其次,设计了一个关键语义信息补足模块对传统的自动编码器进行改进,补足映射过程中丢失的关键语义信息;最后,通过综合聚类损失与关键词语义自动编码器的重构损失学习适合于聚类的表示特征。实验证明,提出算法在五个现实数据集上的聚类效果均优于当前先进的聚类方法。聚类结果证明了关键语义信息补足方法和文本数据增强方法对深度文本聚类的重要性。

主 题 词:深度文本聚类 表征学习 自动编码器 自监督聚类 数据增强 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.19734/j.issn.1001-3695.2022.10.0555

馆 藏 号:203122284...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分