看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于混合相似度度量的跨语言舰船实体匹配算法 收藏
基于混合相似度度量的跨语言舰船实体匹配算法

基于混合相似度度量的跨语言舰船实体匹配算法

作     者:孟卓鹏 吴继冰 刘丽华 王懋 邓苏 黄宏斌 MENG Zhuopeng;WU Jibing;LIU Lihua;WANG Mao;DENG Su;HUANG Hongbin

作者机构:国防科技大学系统工程学院湖南长沙410073 

基  金:湖南省自然科学基金项目(2019JJ50726) 

出 版 物:《郑州大学学报(理学版)》 (Journal of Zhengzhou University:Natural Science Edition)

年 卷 期:2022年第54卷第4期

页      码:12-19页

摘      要:由于装备信息的敏感性,军事领域的跨语言实体匹配问题会面临缺乏标注好的平行语料、依赖机器翻译质量等问题。从这些问题出发,提出了一种跨语言舰船实体匹配算法。首先归纳匹配规则,通过融合机器翻译和词典短语释义取得语言转换结果,设计了检测后缀相同字符串的相似度度量suffix-matter优化候选集,提高了算法的效率。还设计了捕捉字符和发音特征的混合相似度度量MixSim协助寻找匹配的实体。利用从互联网上爬取各国舰船活动事件的新闻报道和简式舰船数据进行实验,结果表明算法取得了较好的效果,而且证明了两种相似度度量在字符串比对中的有效性。

主 题 词:跨语言实体匹配 相似度度量 机器翻译 规则 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.13705/j.issn.1671-6841.2021297

馆 藏 号:203111172...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分