看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于相似页面的Web信息抽取系统的实现 收藏
基于相似页面的Web信息抽取系统的实现

基于相似页面的Web信息抽取系统的实现

作     者:贡正仙 朱巧明 李培峰 GONG Zheng-xian;ZHU Qiao-ming;LI Pei-feng

作者机构:苏州大学计算机科学与技术学院 

基  金:江苏省高技术研究资助项目(BG2005020) 江苏省教育厅自然基金资助项目(04KKB320134) 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2006年第26卷第8期

页      码:1983-1986页

摘      要:分析了RoadRunner的核心算法,针对RoadRunner的不足,综合自动和半自动抽取阶段的各项研究成果,设计并实现了基于相似页面的W eb信息抽取系统。介绍了系统结构和实现的关键技术,包括如何获取相似页面,可靠的噪声处理和自动归纳抽取规则的算法。

主 题 词:Web页面 RoadRunner 相似页面 信息抽取 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

核心收录:

馆 藏 号:203901386...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分