看过本文的还看了

相关文献

该作者的其他文献

文献详情 >水稻病虫草害与药剂实体关系联合抽取算法 收藏
水稻病虫草害与药剂实体关系联合抽取算法

水稻病虫草害与药剂实体关系联合抽取算法

作     者:沈利言 姜海燕 胡滨 谢元澄 SHEN Liyan;JIANG Haiyan;HU Bin;XIE Yuancheng

作者机构:南京农业大学人工智能学院江苏南京210095 南京农业大学国家信息农业工程技术中心江苏南京210095 

基  金:国家重点研发计划项目(2016YFD0300607) 江苏省研究生培养创新工程项目(SJCX18_0198) 

出 版 物:《南京农业大学学报》 (Journal of Nanjing Agricultural University)

年 卷 期:2020年第43卷第6期

页      码:1151-1161页

摘      要:[目的]从水稻病虫草害防治文本中,自动抽取病虫草害与药剂之间的实体与关系,为构建作物系统领域知识图谱提供数据。[方法]针对病虫草害防治文本中含有大量实体没有明确边界以及药剂与病虫草害实体之间存在多种类型关系的特点,设计了一种基于新标注模式的双层长短期记忆(bi-directional long short-term memory,BiLSTM)网络与注意力机制结合的水稻病虫草害与药剂的实体关系联合抽取算法(joint entity recognition and relation extraction for rice diseases,pests and weeds,JE-DPW)。该方法在解码层利用BiLSTM网络的前向传播和反向传播,增强对病虫草害防治文本中复杂语义特征的提取;再通过softmax分类器获取字符的类别标签,实现实体识别;与此同时,利用注意力机制判断当前字符与之前字符之间存在的关联关系,实现实体与多关系的联合抽取。[结果]利用包含7380个实体、8605个关系的病虫草害防治文本数据集训练模型,使用测试集测试后发现:JE-DPW算法在病虫草害与药剂的实体抽取和关系分类任务中的准确率分别为91.3%和76.8%,对无边界实体识别的准确率为88.1%。与BiLSTM实现实体抽取方法相比,准确率高出8.1%。与利用循环神经网络(recurrent neural network,RNN)和长短期记忆网络(long short-term memory,LSTM)实现关系分类的方法相比,准确率分别高出22.6%和19.7%;随着关系数量的增加,JE-DPW算法在关系抽取上的F1值可保持17.4%~20.1%的优势。[结论]本文提出的算法可以有效提升水稻病虫草害防治文本中实体关系联合抽取的准确度,提高作物系统领域知识库的构建速度。

主 题 词:病虫草害 实体关系抽取 长短期记忆网络 注意力机制 

学科分类:0710[理学-生物科学类] 0830[工学-生物工程类] 081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.7685/jnau.201912024

馆 藏 号:203992211...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分