看过本文的还看了

相关文献

该作者的其他文献

文献详情 >HtmIParser提取网页信息的设计与实现 收藏
HtmIParser提取网页信息的设计与实现

HtmIParser提取网页信息的设计与实现

作     者:黄颖 黄治平 HUANG Ying;HUANG Zhi-ping

作者机构:江西理工大学信息工程学院江西赣州341000 赣南师范学院江西赣州341000 

出 版 物:《江西理工大学学报》 (Journal of Jiangxi University of Science and Technology)

年 卷 期:2007年第28卷第6期

页      码:26-28,35页

摘      要:互联网上信息量的激增,迫切需要一些自动化的工具帮助人们在海量信息源中迅速找到真正需要的信息,如标题、链接、email和图片等,而HTML语言所表述的web页面经浏览器分析后只适合浏览,不适合作为一种数据交换的方式由机器处理,文中详细介绍了如何使用HtmlParser来提取网页当中的超链接信息,将其清洗后存入SQL数据库当中,以备后续工作使用。

主 题 词:HtmlParser 信息提取 网页解析 

学科分类:08[工学] 081201[081201] 0812[工学-测绘类] 

D O I:10.3969/j.issn.2095-3046.2007.06.007

馆 藏 号:203317099...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分