看过本文的还看了

相关文献

该作者的其他文献

文献详情 >Web信息抽取和展现系统的设计与实现 收藏
Web信息抽取和展现系统的设计与实现

Web信息抽取和展现系统的设计与实现

作     者:彭祥礼 朱小军 查志勇 PENG Xiang-li;ZHU Xiao-jun;ZHA Zhi-yong

作者机构:湖北省电力公司信息通信中心湖北武汉430077 

出 版 物:《电力信息化》 (Electric Power Information Technology)

年 卷 期:2012年第10卷第2期

页      码:23-26页

摘      要:随着计算机网络技术的高速发展,如何高效准确地识别和获取Web信息变得至关重要。文章介绍了一个完整的Web信息抽取和展现系统,其总体架构由Web网站集、抽取规则库、内容定制模块和内容展现模块4部分组成。该系统支持用户通过可视化交互式界面定制信息抽取规则,实现了用户个性化抽取规则的存储。在数据项定位方式上采用基于DOM树和分层区域划分的方法,结合父子结点信息进行数据校验,既可以快速定位到信息抽取的目标区域,又能有效保证抽取方法的精度。

主 题 词:Web信息抽取 抽取规则 HTML DOM树 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1672-4844.2012.02.006

馆 藏 号:203334446...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分