看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Nutch的节能减排垂直搜索引擎设计与实现 收藏
基于Nutch的节能减排垂直搜索引擎设计与实现

基于Nutch的节能减排垂直搜索引擎设计与实现

作     者:袁志祥 张飞 鲍威 孙国华 刘明 YUAN Zhi-xiang;ZHANG Fei;BAO Wei;SUN Guo-hua;LIU Ming

作者机构:安徽工业大学计算机学院安徽马鞍山243002 中国标准化研究院资源与环境分院北京100191 

基  金:国家科技支撑计划基金项目(2012BAK30B04) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2016年第37卷第9期

页      码:2565-2570页

摘      要:为提高搜索引擎检索节能减排领域信息的准确度,在研究垂直搜索引擎的设计思想和相关技术的基础上,利用Nutch开源框架设计实现节能减排垂直搜索引擎。采用网页模板技术对网页信息进行提取,利用改进的TF-IDF算法进行特征词表示,采用基于特征词的向量空间模型进行主题相关性判定,利用朴素贝叶斯分类算法对网页信息进行分类。实验结果表明,该搜索引擎可有效对节能减排的相关信息进行检索。

主 题 词:节能减排 垂直搜索引擎 Nutch 向量空间模型 朴素贝叶斯 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 08[工学] 081201[081201] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2016.09.051

馆 藏 号:203187160...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分