看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于概念分析的主题爬虫设计 收藏
基于概念分析的主题爬虫设计

基于概念分析的主题爬虫设计

作     者:汪涛 樊孝忠 顾益军 刘林 

作者机构:北京理工大学信息科学技术学院计算机科学工程系 

基  金:扬州万方电子技术有限责任公司合作项目(2003.08) 

出 版 物:《北京理工大学学报》 (Transactions of Beijing Institute of Technology)

年 卷 期:2004年第24卷第10期

页      码:890-893页

摘      要:研究改进主题爬虫设计的方法,用高效的主题爬虫取代传统搜索引擎中的普通爬虫,以更高的精度完成定向信息采集.在成功实现基于关键词的主题爬虫的基础上,提出了基于概念的主题相关度分析算法,给出了基于概念分析的主题爬虫的实现方案.比较两种主题爬虫工作的实验结果,显示爬虫的性能得到了提高,论证了该设计的可行性与可操作性,为实现准确的定向信息采集奠定了良好的基础.

主 题 词:搜索引擎 主题爬虫 概念分析 相关度 信息采集 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 08[工学] 081201[081201] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1001-0645.2004.10.012

馆 藏 号:203393044...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分