看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进后缀树算法中英文聚类引擎的实现 收藏
基于改进后缀树算法中英文聚类引擎的实现

基于改进后缀树算法中英文聚类引擎的实现

作     者:胡海龙 孙晨 赫枫龄 左万利 HU Hai-long;SUN Chen;HE Feng-ling;ZUO Wan-li

作者机构:吉林大学计算机科学与技术学院长春130012 吉林大学通讯工程学院长春130012 

基  金:吉林省科技发展计划项目基金(批准号:20070533) 

出 版 物:《吉林大学学报(理学版)》 (Journal of Jilin University:Science Edition)

年 卷 期:2009年第47卷第2期

页      码:299-304页

摘      要:提出一种基于改进后缀树与交互聚类思想相结合的算法ISTC算法,通过改造传统后缀树结构实现了对文档标题和摘要的层次化聚类,同时用交互聚类的方式替代了传统的递归算法.ISTC算法具有语言无关性,不仅适用于基于单词的西方文字,而且可以在不引入词典分词技术的情况下有效地处理基于单字的中文字符.在此算法基础上,设计并实现了基于改进后缀树算法的交互聚类引擎,在不同的网络环境下对其进行了系统测试,并与其他元搜索引擎进行了对比.实验结果表明,使用改进后缀树算法进行实时交互式聚类是可行的.

主 题 词:后缀树 文本聚类 元搜索引擎 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

核心收录:

D O I:10.3321/j.issn:1671-5489.2009.02.030

馆 藏 号:203940982...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分