分布式全文检索技术的研究及应用
作者机构:桂林理工大学信息科学与工程学院广西桂林541000
基 金:"嵌入式技术与智能信息处理"广西高校重点实验室基金项目 国家自然科学基金项目(61262076)
出 版 物:《计算机工程与设计》 (Computer Engineering and Design)
年 卷 期:2018年第39卷第9期
页 码:2997-3001页
摘 要:为有效解决分布式对海量数据的资源管理、共享资源并发访问控制以及如何对海量数据进行快速且准确的检索,提出一种基于zookeeper的分布式服务协调模型为分布式提供资源的管理和并发访问的控制,在lucene搜索引擎的基础上,采用组件技术并在BM25F算法的基础上添加时间因子分别对文档进行解析,创建索引和检索结果排序算法进行优化的方案。系统应用结果表明,该方案有效解决了分布式的资源管理和控制问题,提高了检索的效率和准确度。
主 题 词:zookeeper框架 分布式 lucene搜索引擎 文档解析 BM25F算法
学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类]
D O I:10.16208/j.issn1000-7024.2018.09.052
馆 藏 号:203369354...