看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于XML的政府公文信息抽取中间件的设计与实现 收藏
基于XML的政府公文信息抽取中间件的设计与实现

基于XML的政府公文信息抽取中间件的设计与实现

作     者:聂哲 顾明 NIE Zhe;GU Ming

作者机构:深圳职业技术学院软件工程系广东深圳518055 

基  金:深圳市科学与信息局科技基金项目(05KJCD020) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2007年第28卷第5期

页      码:1158-1160页

摘      要:超文本信息抽取是Internet信息重组的重要手段。通过对政府公文信息格式进行了研究,提出了一种基于XML的信息抽取中间件模型,通过基于串匹配与串频统计相结合的分词处理、利用遗传算法的词类标注以及基于改进的隐马尔科夫模型的XML模板自动填充,可以快速的对Internet上的政府公文信息进行信息重组,以供相关应用系统使用。

主 题 词:政府公文 信息抽取 中间件 分词处理 词类标注 模板填充 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1000-7024.2007.05.052

馆 藏 号:203870820...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分