看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于智能的网页信息提取系统的研究与设计 收藏
基于智能的网页信息提取系统的研究与设计

基于智能的网页信息提取系统的研究与设计

作     者:刘亚东 彭舰 张达平 LIU Ya-Dong, PENG Jian, ZHANG Da-Ping(College of Computer Science, Sichuan University, Chengdu 610065, China)

作者机构:四川大学计算机学院成都610065 

基  金:四川省应用基础基金(2008JY0027) 四川省科技支撑计划项目(07GG006-040) 

出 版 物:《四川大学学报(自然科学版)》 (Journal of Sichuan University(Natural Science Edition))

年 卷 期:2009年第46卷第4期

页      码:957-962页

摘      要:随着Internet的迅速发展,为人们提供了大量的信息,但这些信息都包含在网页中,为了使用这些信息数据,需要将数据从网页中提取出来.本文介绍了一种新的基于智能的网页信息提取系统EIES,通过对RoadRunner的改进和利用,在提取过程中不需人工干预,实现了信息提取的智能化.实验表明,该系统能够更准确、更有效地分类相似网页和提取网页信息.

主 题 词:智能 Web信息提取 RoadRunner HTML结构树 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.0490-6756.2009.04.019

馆 藏 号:203403355...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分