基于深度学习的多语言跨领域主题对齐模型
作者机构:中南财经政法大学信息与安全工程学院武汉430073 中南财经政法大学统计与数学学院武汉430073 武汉大学信息管理学院武汉430072
基 金:国家自然科学基金面上项目(71974202) 国家自然科学基金重大课题(71790612)
出 版 物:《清华大学学报(自然科学版)》 (Journal of Tsinghua University(Science and Technology))
年 卷 期:2020年第60卷第5期
页 码:430-439页
摘 要:在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了2种新的指标,即双语主题相似度(bilingual topic similarity, BTS)和双语对齐相似度(bilingual alignment similarity, BAS),用于评价辅助分布对齐的效果。相比传统的对齐模型MCTA, TAM在跨语言主题对齐任务中双语对齐相似度提升了约1.5%,在跨领域主题对齐任务中F1值提升了约10%。研究结果对于改进跨语言和跨领域信息处理具有重要意义。
主 题 词:跨语言主题对齐 跨领域主题对齐 深度学习 双语词嵌入 知识对齐
学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类]
核心收录:
D O I:10.16511/j.cnki.qhdxxb.2020.21.003
馆 藏 号:203908716...