看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于本体和DOM相结合的Web信息抽取器 收藏
基于本体和DOM相结合的Web信息抽取器

基于本体和DOM相结合的Web信息抽取器

作     者:柳佳刚 陈山 贺令亚 Liu Jiagang;Chen Shan;He Lingya

作者机构:湖南工学院计算机科学系衡阳421002 

出 版 物:《现代图书情报技术》 (New Technology of Library and Information Service)

年 卷 期:2009年第5期

页      码:44-49页

摘      要:针对基于Web页面信息本体的信息抽取不能准确划定抽取区域的缺点,设计基于本体和DOM相结合的Web信息抽取器。利用DOM树设计对样本页面信息项路径进行归纳学习的算法,该算法能准确划定信息抽取区域,降低页面噪声,实现对Web页面的预处理。实验表明,改进后的抽取方法提高了Web信息的抽准率。

主 题 词:信息抽取 包装器 本体 文档对象模型 归纳学习 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1003-3513.2009.05.009

馆 藏 号:203871669...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分