看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Lucene的中文分词器的改进与实现 收藏
基于Lucene的中文分词器的改进与实现

基于Lucene的中文分词器的改进与实现

作     者:罗惠峰 郭淑琴 Luo Huifeng;Guo Shuqin

作者机构:浙江工业大学信息工程学院浙江杭州310023 

出 版 物:《微型机与应用》 (Microcomputer & Its Applications)

年 卷 期:2015年第34卷第11期

页      码:76-78,82页

摘      要:Lucene是一个高效的全文检索工具包,本文主要研究了Lucene的体系架构及其在中文检索上的应用。通过对基于最大匹配算法的中文分词器的设计与改进,并引入文本解析器与构建同义词词库引擎,使得Lucene对中文的检索更加个性化。通过检索结果的对比表明,改进后的中文分词器对检索功能的扩展有了极大的提高。并最终构建出了一个高效的中文全文检索系统。

主 题 词:全文检索 中文分词器 文本解析器 最大匹配算法(MMSEG) 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1674-7720.2015.11.023

馆 藏 号:203111298...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分