看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于虚拟上下文的统计机器翻译短语表的过滤 收藏
基于虚拟上下文的统计机器翻译短语表的过滤

基于虚拟上下文的统计机器翻译短语表的过滤

作     者:殷乐 张玉洁 徐金安 YIN Yue;ZHANG Yujie;XU Jinan

作者机构:北京交通大学计算机学院北京100044 

基  金:北京交通大学人才基金资助项目(KKRC11001532) 

出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)

年 卷 期:2013年第27卷第6期

页      码:139-143页

摘      要:在基于短语的统计机器翻译系统中,自动抽取的短语表中不可避免的包含大量的冗余和错误的短语对,这浪费了解码资源又影响翻译质量。为了缓解这个问题,该文提出一种基于虚拟上下文的过滤短语表的方法。该方法引入虚拟上下文计算短语对的得分增量;并通过计算最大和最小的短语对的得分增量,设计了一种对短语对重排序的过滤策略。我们在NTCIR-9的中英数据上进行了验证实验,结果显示,当短语表的规模下降到原来的47%时,翻译质量的BLEU值提高了0.000 5;当短语表的规模下降到原来的30%时,BLEU值仅下降0.000 6。实验结果表明,在大规模短语表的过滤中,该文的方法是有效可行的。

主 题 词:基于短语的统计机器翻译 短语表过滤 虚拟上下文 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1003-0077.2013.06.020

馆 藏 号:203122717...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分