看过本文的还看了

相关文献

该作者的其他文献

文献详情 >无监督的互联网事件抽取框架 收藏
无监督的互联网事件抽取框架

无监督的互联网事件抽取框架

作     者:何一鸣 HE Yi-ming

作者机构:复旦大学计算机科学技术学院上海200433 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2011年第32卷第3期

页      码:910-913,917页

摘      要:为高效便捷地获取互联网上发布的真实事件信息,提出了一种无监督的互联网事件抽取框架。该框架利用DOM树模型的平行结构特性对表格页面进行事件抽取,并以表格页面抽取的事件作为种子来总结详情页面的对应模式,进一步使用总结的模式在详情页面中抽取。在大量网站页面中应用该框架,并将抽取结果与常用的包装器生成算法进行比较,结果表明了该框架的有效性以及在详情页面中的抽取质量优于包装器算法。

主 题 词:信息抽取 互联网事件抽取 表格网页 详情网页 无监督 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 08[工学] 081201[081201] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2011.03.071

馆 藏 号:203272192...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分