限定检索结果

检索条件"主题词=后缀树"
19 条 记 录,以下是1-10 订阅
视图:
排序:
基于后缀树的西文二次文献相关性算法设计
收藏 引用
《情报杂志》2009年 第6期28卷 155-158页
作者:范晓莉 张志平中国科学技术信息研究所北京100038 
基于后缀树结构与向量空间模型来设计西文二次文献的文献相关性判定算法。给出了文献相关性判定的流程,分析了后缀树算法的优势,并采用后缀树算法抽取特征项建立向量空间模型。与基于词的向量空间模型相比,基于后缀树的文献相关性判...
来源:详细信息评论
基于改进后缀树算法中英文聚类引擎的实现
收藏 引用
《吉林大学学报(理学版)》2009年 第2期47卷 299-304页
作者:胡海龙 孙晨 赫枫龄 左万利吉林大学计算机科学与技术学院长春130012 吉林大学通讯工程学院长春130012 
提出一种基于改进后缀树与交互聚类思想相结合的算法ISTC算法,通过改造传统后缀树结构实现了对文档标题和摘要的层次化聚类,同时用交互聚类的方式替代了传统的递归算法.ISTC算法具有语言无关性,不仅适用于基于单词的西方文字,而且可以...
来源:详细信息评论
基于后缀树的带有通配符的模式匹配研究
收藏 引用
《计算机科学》2012年 第12期39卷 177-180,194页
作者:侯宝剑 谢飞 胡学钢 刘应玲 王海平合肥工业大学计算机与信息学院合肥230009 合肥师范学院计算机科学与技术系合肥230601 中国科学技术大学物理学院合肥230026 
由于在生物序列分析、文本索引、网络入侵检测等领域的应用需求,带有通配符的模式匹配问题一直是研究的热点。针对已有的研究工作中通配符和长度约束具有较强的局限性问题,研究带有灵活通配符的模式匹配问题,其中通配符可以在模式的任...
来源:详细信息评论
基于后缀树的Web论坛信息抽取
收藏 引用
《计算机工程与设计》2008年 第7期29卷 1675-1677页
作者:肖建鹏 张来顺 任星 宋晓光解放军信息工程大学电子技术学院河南郑州450004 中国人民解放军65012部队辽宁沈阳110101 
针对现有网上论坛信息抽取的不足,提出一种基于后缀树的论坛信息抽取方法。将标准化后的HTML文档转换为后缀树,查找出其中的重复模式并产生分装器,将分装器转换为NFA(非确定型有穷自动机)达到抽取论坛信息的目的。该方法运用构造后缀树...
来源:详细信息评论
维吾尔文后缀树构造算法的设计与实现
收藏 引用
《计算机工程与应用》2013年 第8期49卷 9-11,16页
作者:买买提依明.哈斯木 吾守尔.斯拉木 维尼拉.木沙江新疆大学信息科学与工程学院乌鲁木齐830046 和田师范专科学校计算机科学系新疆和田848000 
为用后缀树聚类算法对维吾尔文网页进行聚类,通过分析可扩展后缀树和维吾尔文的特点设计了维吾尔文后缀树构造算法。实验结果证明该方法能够在线性的时间范围内构造维吾尔文后缀树,并用它来对维吾尔文网页进行聚类。
来源:详细信息评论
后缀树的设计与构造
收藏 引用
《信息与电脑》2019年 第6期31卷 52-53页
作者:赵美勇 史昊臻 朱珍珍山东科技大学山东济南266590 
后缀树是处理字符串的一个优秀算法。利用图像化设计可使后缀树更加清晰。按照递推的思路,建立前i个字符对应的后缀树,通过插入第i+1个字符的方式,建立前i+1个字符对应的后缀树。由于字符串的任意子串都可以表示为某个后缀的前缀,因此...
来源:详细信息评论
基于后缀树的相似代码检测方法的研究
收藏 引用
《信息通信》2016年 第10期29卷 117-118页
作者:禤静广西大学计算机与电子信息学院广西南宁530004 南宁职业技术学院信息工程学院广西南宁530008 
通常以词或字符为单位构造后缀树进行代码检测,空间开销大,同时增加字符串对比数量。针对该问题,文章设计了一种基于后缀树的代码相似度检测方法,应用Rabin指纹算法以句子为单位生成的指纹序来构造后缀树,并结合RMQ提取后缀树指纹公共...
来源:详细信息评论
数据挖掘中后缀树算法的应用研究
收藏 引用
《焦作大学学报》2007年 第3期21卷 70-72页
作者:赵杰文 原娇杰焦作大学计算机工程系河南焦作454003 
后缀树是一种非常重要的数据结构,它在与字符串处理相关的各种领域里有着非常广泛的应用。构造后缀树是应用后缀树解决问题的前提和关键。文章首先引入了一种新颖的数据结构——后缀树的相关概念,在此基础上,对其特点和算法的构建进行...
来源:详细信息评论
基于型结构和加权熵的中文高频词提取算法
收藏 引用
《吉林大学学报(工学版)》2011年 第1期41卷 188-192页
作者:王龙 刘衍珩 李晓光 官健吉林大学计算机科学与技术学院长春130012 辽宁大学信息学院沈阳110036 
提出了一种基于型结构和加权熵的中文高频词提取算法。简单介绍了中文的型结构和加权信息熵,详细叙述了算法的原理和设计步骤,并给出了具体的算法描述。实验结果表明,该算法是可行和有效的。
来源:详细信息评论
一种基于Nutch的网页聚类系统的设计与实现
收藏 引用
《计算机工程与应用》2011年 第5期47卷 118-122页
作者:阳小兰 钱程 赵海廷武汉科技大学中南分校信息工程学院武汉430223 
设计了一种在中英文环境下、能够对Nutch的搜索结果进行聚类处理的搜索结果聚类系统,该系统基于k-means算法和后缀树聚类算法,是一个由Nutch搜索引擎、文本分词、TF-IDF权重计算以及文本聚类等模块构成的搜索引擎结果文档聚类系统,并通...
来源:详细信息评论
聚类工具 回到顶部