看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Lucene全文检索应用研究 收藏
基于Lucene全文检索应用研究

基于Lucene全文检索应用研究

作     者:吴代文 WU Daiwen

作者机构:渭南师范学院传媒工程系陕西714000 

基  金:全文检索技术在网络教育中的应用研究(10YKZ048) 教育部特色专业建设点项目编号:TS11772 

出 版 物:《微计算机应用》 (Microcomputer Applications)

年 卷 期:2011年第32卷第2期

页      码:62-65页

摘      要:通过Lucene API和PDFBox API实现对PDF文档的二次全文检索。为了实现精确的搜索关键词定位,本文设计并实现了一种新的二次索引算法,该二次索引带有关键词的页码、坐标及其上下文等信息。利用该二次索引可将检索结果定位到PDF文档的具体页,然后在页面上标示出关键字的具体位置,使对PDF文档的二次检索达到了类似百度文库的全文检索效果。

主 题 词:全文检索 二次索引 二次检索 Lucene 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.2095-347X.2011.02.010

馆 藏 号:203280546...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分