看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于《知网》义原搭配的中文文本语义级自动查错研究 收藏
基于《知网》义原搭配的中文文本语义级自动查错研究

基于《知网》义原搭配的中文文本语义级自动查错研究

作     者:郭充 张仰森 GUO Chong;ZHANG Yang-sen

作者机构:北京信息科技大学计算机学院智能信息处理研究所北京100192 

基  金:国家自然科学基金项目(60873013) 北京市自然科学基金B类重点项目(KZ200811232019) 北京市属市管高校人才强教计划基金项目(PXM2008_014215_055942) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2010年第31卷第17期

页      码:3924-3928页

摘      要:语义级的自动查错一直是汉语文本自动校对技术的难点。针对汉语文本中的语义搭配错误,提出了一种基于《知网》义原搭配的有效的自动查错方法,主要包括语义知识库的构建和自动查错算法。语义知识库的构建分为两步:①根据规则从训练语料中统计出大量的动词与名词之间的二元搭配组合,并利用互信息等因素筛选记录;②利用《知网》对词语义项的义原描述(对于动词抽取其义项中的主义原,名词抽取其义项中的主义原和常见的4个辅助义原),将动词与名词的二元搭配组合转变为义原之间相互制约的多元组合。在语义知识库的基础上设计相应的自动查错算法。实验结果显示,该方法的召回率为35%,精确率为82.3%,具有较好的应用前景。

主 题 词:语义搭配错误 互信息 知网 义原 语义知识库 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2010.17.030

馆 藏 号:203449669...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分