看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Tika语义分析的文档内容检索服务研究 收藏
基于Tika语义分析的文档内容检索服务研究

基于Tika语义分析的文档内容检索服务研究

作     者:丁振凡 

作者机构:华东交通大学信息工程学院江西南昌330013 

出 版 物:《井冈山大学学报(自然科学版)》 (Journal of Jinggangshan University (Natural Science))

年 卷 期:2013年第34卷第2期

页      码:60-64页

摘      要:介绍了利用Lucene结合Tika实现站点内容的全文检索设计的编程过程。用Tika获取文档的元数据以及文档内容的文本提取。用Lucene实现文档的索引创建和检索服务,结合实例详细分析了Lucene API的具体使用特点。利用Spring MVC实现搜索服务的Web访问处理。可对网站的HTML、PDF、word、PPT、mht等各种类型的文档提供统一的内容检索服务。在该论文研究基础上可建立个性化的内容搜索服务系统。

主 题 词:Spring MVC Lucene Tika 文档元数据 全文检索 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 08[工学] 081201[081201] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1674-8085.2013.02.014

馆 藏 号:203910262...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分