看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Context Graphs的主题爬虫的研究与实现 收藏
基于Context Graphs的主题爬虫的研究与实现

基于Context Graphs的主题爬虫的研究与实现

作     者:陈星 CHEN Xing

作者机构:中国科学院软件研究所北京100190 中国科学院研究生院北京100049 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2011年第32卷第3期

页      码:914-917页

摘      要:为了解决传统主题爬虫对主题网页搜索效率偏低的问题,分析了基于网络拓扑结构建模的Context Graphs的爬行策略。考虑了以往ContextGraphs方法存在的不足,即没有区分网页不同部分文本的重要程度,通过将锚文字、页面标题和页面内容做综合考虑,对原算法进行了改进。将改进前后的算法进行实验对比,实验结果表明,在提高主题爬行质量方面,改进后的算法达到了更好的效果。

主 题 词:主题爬虫 Context Graphs模型 层次建模 链接分析 内容分析 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 08[工学] 081201[081201] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2011.03.027

馆 藏 号:203465082...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分