看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种基于t-分布随机近邻嵌入的文本聚类方法 收藏
一种基于t-分布随机近邻嵌入的文本聚类方法

一种基于t-分布随机近邻嵌入的文本聚类方法

作     者:徐秀芳 徐森 花小朋 徐静 皋军 安晶 Xu Xiufang;Xu Sen;Hua Xiaopeng;Xu Jing;Gao Jun;An Jing

作者机构:盐城工学院信息工程学院盐城224051 江苏省媒体设计与软件技术重点实验室(江南大学)无锡214122 盐城工学院机械工程学院盐城224051 

基  金:国家自然科学基金(61105057 61375001) 江苏省自然科学基金(BK20151299) 江苏省"333工程" 江苏省高等学校自然科学研究项目(18KJB520050) 江苏省媒体设计与软件技术重点实验室(江南大学)开放课题(18ST0201) 江苏省高校"青蓝工程" 

出 版 物:《南京大学学报(自然科学版)》 (Journal of Nanjing University(Natural Science))

年 卷 期:2019年第55卷第2期

页      码:264-271页

摘      要:文本数据具有高维、稀疏、海量的特性,给传统的聚类算法带来了极大挑战.提出一种基于t-分布随机近邻嵌入(t-Distributed Stochastic Neighbor Embedding,t-SNE)的文本聚类方法.首先通过t-SNE将高维文本数据嵌入到低维空间,使得高维空间相似度较低的文本对应的映射点距离较远,而相似度较高的文本对应的映射点距离较近;然后根据低维空间映射点坐标,再采用传统的聚类分析算法进行聚类,得到最终的聚类结果.在多个基准文本数据集上进行了实验测试,验证了该方法的有效性.

主 题 词:聚类分析 文本聚类 维数约简 随机近邻嵌入 聚类算法 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.13232/j.cnki.jnju.2019.02.011

馆 藏 号:203607116...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分