看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于字串切分统计词典的繁体中文拼写检错方法 收藏
基于字串切分统计词典的繁体中文拼写检错方法

基于字串切分统计词典的繁体中文拼写检错方法

作     者:王勇 顾磊 Wang Yong;Gu Lei

作者机构:南京邮电大学计算机学院南京210003 

基  金:国家自然科学基金资助项目(61302157) 国家教育部人文社会科学研究青年基金资助项目(12YJC870008) 江苏省教育厅高校哲学社会科学基金资助项目(2013SJB870004) 江苏省社科研究文化精品课题(12SWC-030) 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2016年第33卷第5期

页      码:1370-1373,1378页

摘      要:针对繁体中文拼写检错的问题进行了研究,提出一种基于字串切分统计词典的检错方法。利用语料库中字串出现的频率信息作为检错依据,根据字串及其频率信息来建立统计词典,并设计了基于统计规则评判的检错算法。以SIGHAN7会议中文拼写校验任务中用于检错评测的1 000句测试集作为实验测试集,并与此会议提交的结果进行比较,实验结果表明,与基于复杂语言模型的检错方法相比,该方法在实现简单的同时也有很好的检错效果,获得了较高的准确率和精确率以及较低的误报率。

主 题 词:中文语言处理 繁体中文拼写检错 中文分词 字串切分 统计词典 混淆集 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1001-3695.2016.05.021

馆 藏 号:203567065...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分