看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于句法依存卷积神经网络的句子相似度计算 收藏
基于句法依存卷积神经网络的句子相似度计算

基于句法依存卷积神经网络的句子相似度计算

作     者:铉静 吴琼 魏从悦 伍星 XUAN Jing;WU Qiong;WEI Congyue;WU Xing

作者机构:重庆大学计算机学院重庆400044 重庆工商大学管理科学与工程学院重庆400067 

基  金:重庆工商大学开放基金项目资助(KFJJ2019056,KFJJ2019050) 重庆工商大学杰、优博士人才计划资助项目(2056001) 重庆工商大学数据与信息管理方向学科建设资助项目(ZDPTTD201917) 

出 版 物:《重庆大学学报(自然科学版)》 (Journal of Chongqing University)

年 卷 期:2020年第43卷第9期

页      码:41-53页

摘      要:句子相似度计算是自然语言处理的一项基础任务,其准确性直接影响机器翻译、问题回答等下游任务的性能。传统机器学习方法主要依靠词形、词序及结构等浅层特征计算句子相似度,而深度学习方法能够融入深层语义特征,从而取得了更好效果。深度学习方法如卷积神经网络在提取文本特征时存在提取句子语义特征较浅、长距离依赖信息不足的缺点。因此设计了DCNN(dependency convolutional neural network)模型,该模型利用词语之间的依存关系来解决该不足。DCNN模型首先通过依存句法分析得到句子中词语之间的依存关系,而后根据与当前词存在一跳或者两跳关系的词语形成二元和三元的词语组合,再将这两部分信息作为原句信息的补充,输入到卷积神经网络中,以此来获取词语之间长距离依赖信息。实验结果表明,加入依存句法信息得到的长距离依赖能有效提升模型性能。在MSRP(microsoft research paraphrase corpus)数据集上,模型准确度和F1值分别为80.33%和85.91,在SICK(sentences involving compositional knowledge)数据集上模型的皮尔森相关系数能达到87.5,在MSRvid(microsoft video paraphrase corpus)数据集上模型的皮尔森相关系数能达到92.2。

主 题 词:句子相似度 依存句法树 长距离依赖 

学科分类:0808[工学-自动化类] 0809[工学-计算机类] 081203[081203] 08[工学] 0805[工学-能源动力学] 0813[工学-化工与制药类] 0835[0835] 0814[工学-地质类] 0812[工学-测绘类] 

核心收录:

D O I:10.11835/j.issn.l000-582X.2020.09.005

馆 藏 号:203984987...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分