看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Lucene的中文全文检索系统的研究与设计 收藏
基于Lucene的中文全文检索系统的研究与设计

基于Lucene的中文全文检索系统的研究与设计

作     者:索红光 孙鑫 SUO Hong-guang;SUN Xin

作者机构:中国石油大学(华东)计算机与通信工程学院山东东营257061 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2008年第29卷第19期

页      码:5083-5086页

摘      要:提出了一种基于Lucene的中文全文检索系统模型。通过分析Lucene的系统结构,系统采用了基于统计的网页正文提取技术,并且加入了中文分词模块和索引文档预处理模块来提高检索系统的效率和精度。在检索结果的处理上,采用文本聚类的办法,使检索结果分类显示,提高了用户的查找的效率。实验数据表明,该系统在检索中文网页时,在效率、精度和结果处理等方面性能明显提高。

主 题 词:全文检索 网页正文提取 中文分词模块 索引文档预处理 文本聚类 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 08[工学] 081201[081201] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2008.19.042

馆 藏 号:203748199...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分