看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向大规模英语学习者语料库建设的自动拼写检查研究 收藏
面向大规模英语学习者语料库建设的自动拼写检查研究

面向大规模英语学习者语料库建设的自动拼写检查研究

作     者:梁茂成 邓海龙 LIANG Mao-cheng;DENG Hai-long

作者机构:北京航空航天大学外国语学院北京市100083 北京外国语大学中国外语与教育研究中心北京市100089 赣州市赣南师范大学外国语学院341000 

基  金:国家社科基金项目“基于深度学习方法的语料库索引向量化与自动聚类研究”(项目编号:19BYY082)的阶段性研究成果 

出 版 物:《外语电化教学》 (Technology Enhanced Foreign Language Education)

年 卷 期:2020年第1期

页      码:31-37,5页

摘      要:随着学习者语料库建设规模的不断扩大,语料预处理的自动化需求也愈发迫切。拼写检查是语料预处理中的重要步骤,是后续语料检索及统计分析得以准确进行的前提条件。现有通用自动拼写检查工具并不适于学习者语料库建设。同时,由于学习者拼写错误标注语料数量有限,有监督深度学习模型无法得到应用。针对上述问题,该研究将词向量技术应用于自动拼写检查,结合编辑距离计算以及N-Gram语言模型,设计和构建面向大规模英语学习者语料库建设的自动拼写检查系统。数据测评结果表明,通过词向量增强的自动拼写检查系统在各项主要指标上均超过现有开源自动拼写检查工具,计算效率也能满足语料预处理应用需要。

主 题 词:英语学习者语料库 自动拼写检查 词向量 

学科分类:0502[文学-外国语言文学类] 050201[050201] 05[文学] 

核心收录:

馆 藏 号:203894520...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分