看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Nutch技术的垂直搜索引擎设计与实现 收藏
基于Nutch技术的垂直搜索引擎设计与实现

基于Nutch技术的垂直搜索引擎设计与实现

作     者:卜天然 

作者机构:安徽商贸职业技术学院安徽芜湖241002 

基  金:安徽省省级自然科研重点课题"农业环境信息监测传感器网络数据采集优化研究"(KJ2012B067) 

出 版 物:《通化师范学院学报》 (Journal of Tonghua Normal University)

年 卷 期:2016年第37卷第4期

页      码:4-8页

摘      要:在研究垂直搜索引擎的设计思想、相关技术的基础上,利用Nutch开源框架设计实现了农业环境信息的垂直搜索引擎,支持了对特定信息的检索服务.系统采用了网页模板技术对网页信息进行提取,采用改进的TF-IDF算法提取特征词,利用基于特征词的向量空间模型进行主题相关性判定,利用朴素贝叶斯算法对网页信息进行分类.测试结果表明,改进后的Nutch具有更高的查询准确率.

主 题 词:Nutch 垂直搜索 信息提取 

学科分类:0810[工学-土木类] 08[工学] 080401[080401] 0804[工学-材料学] 080402[080402] 0835[0835] 081002[081002] 

D O I:10.13877/j.cnki.cn22-1284.2016.04.002

馆 藏 号:203567082...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分