看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于本体的Web信息抽取系统 收藏
基于本体的Web信息抽取系统

基于本体的Web信息抽取系统

作     者:王志华 魏斌 李占波 赵伟 WANG Zhi-hua;WEI Bin;LI Zhan-bo;ZHAO Wei

作者机构:郑州大学软件技术学院河南郑州450002 

基  金:河南省软科学研究计划基金项目(112400450172) 河南省教育厅自然科学基金项目(2009A520027) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2012年第33卷第7期

页      码:2634-2639页

摘      要:为了解决已有信息抽取系统中方法不具有重用性及不能抽取语义信息的问题,提出了一个基于领域本体的面向主题的Web信息抽取框架。对Web中文页面,借助外部资料,利用本体解析信息,对文件采集及预处理中的源文档及信息采集、文档预处理、文档存储等技术进行了分析设计,提出了文本转换中的分词及词表查询和命名实体识别算法,并给出了一种知识抽取方案。实验结果表明,该方法可以得到性能较高的抽取结果。

主 题 词:本体 信息抽取 Web页面 关键技术 抽取框架 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1000-7024.2012.07.022

馆 藏 号:203480416...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分