看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于本体及相似度的文本聚类研究 收藏
基于本体及相似度的文本聚类研究

基于本体及相似度的文本聚类研究

作     者:王刚 邱玉辉 WANG Gang;QIU Yu-hui

作者机构:安康学院电子与信息工程系陕西安康725000 西南大学语义网格实验室重庆400715 

基  金:陕西省教育厅资助项目(09JK317) 智能信息处理技术关键问题及应用研究(2008akxy005) 基于本体的服务研究(AYQDZR200916) 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2010年第27卷第7期

页      码:2494-2497页

摘      要:为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类忽略概念的内涵及缺少概念间的联系,设计和改进了基于本体和相似度的文本聚类方法TCBOS(textclusteringbased on ontology and similarity)。研究了文本预处理及分词的方法,设计了用有限状态自动机来自动提取概念和关系的方法,对概念语义扩展和相似度计算方法进行了改进和完善,通过应用本体的语义相似度来度量文档间相近程度,完善了根据相似度进行文本聚类的K中心点算法。实验证明,该方法从聚类的准确性和聚类的关联度方面改善了聚类质量,为文本的自动分析和推荐提供了一条途径。

主 题 词:本体 相似度 文本聚类 语义 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1001-3695.2010.07.026

馆 藏 号:203441425...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分