看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于单词领域特征敏感的多领域神经机器翻译 收藏
基于单词领域特征敏感的多领域神经机器翻译

基于单词领域特征敏感的多领域神经机器翻译

作     者:黄增城 满志博 张玉洁 徐金安 陈钰枫 HUANG Zengcheng;MAN Zhibo;ZHANG Yujie;XU Jin’an;CHEN Yufeng

作者机构:北京交通大学计算机与信息技术学院北京100044 

基  金:国家自然科学基金(61876198 61976016和61976015)资助 

出 版 物:《北京大学学报(自然科学版)》 (Acta Scientiarum Naturalium Universitatis Pekinensis)

年 卷 期:2023年第59卷第1期

页      码:1-10页

摘      要:鉴于现有基于单词的领域特征学习方法在领域识别上的精度较低,为提高领域判别和提供准确的翻译,提出一种单词级别的领域特征敏感学习机制,包括两方面:1)编码器端的上下文特征编码,为了扩展单词级别的领域特征学习范围,引入卷积神经网络,并行提取不同大小窗口的词串作为单词的上下文特征;2)强化的领域特征学习,设计基于多层感知机的领域判别器模块,增强从单词上下文特征中获取更准确领域比例的学习能力,提升单词的领域判别准确率。在多领域UM-Corpus英-汉和OPUS英-法翻译任务中的实验结果显示,所提方法平均BLEU值分别超过强基线模型0.82和1.06,单词的领域判别准确率比基线模型分别提升10.07%和18.06%。对实验结果的进一步分析表明,所提翻译模型性能的提升得益于所提出的单词领域特征敏感的学习机制。

主 题 词:多领域神经机器翻译 领域特征敏感 上下文特征 领域判别 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.13209/j.0479-8023.2022.063

馆 藏 号:203118521...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分