限定检索结果

检索条件"主题词=信息降噪"
1 条 记 录,以下是1-10 订阅
视图:
排序:
基于网页分块自定义信息提取的Web信息采集器设计
收藏 引用
《广东科技》2010年 第16期19卷 41-45页
作者:苏炜 李正权 黎有广东省计算中心 
通过分析现有网络信息采集软件的不足,根据网页文本信息的结构和内容特征,提出一种基于网页文本信息或富文本信息的优化提取策略。通过将网页文档表示为DOM标签树的形式,把信息按Web页面的标签进行内容块的分割,结合XPath定位的方式,利...
来源:详细信息评论
聚类工具 回到顶部