看过本文的还看了

相关文献

该作者的其他文献

文献详情 >东盟十国新闻文本的命名实体识别 收藏
东盟十国新闻文本的命名实体识别

东盟十国新闻文本的命名实体识别

作     者:郑彦斌 夏志超 郭智 黄永忠 刘文芬 ZHENG Yan-bin;XIA Zhi-chao;GUO Zhi;HUANG Yong-zhong;LIU Wen-fen

作者机构:桂林电子科技大学广西密码学与信息安全重点实验室桂林541004 东莞理工学院计算机与网络安全学院东莞523808 

基  金:国家自然科学基金(61602125 61866008 61862011 61862012) 广西自然科学基金(2016GXNSFBA380153 2017GXNSFAA198192 2018GXNSFAA138116) 广西密码学与信息安全重点实验室项目(GCIS201625 GCIS201704) 桂林电子科技大学研究生教育创新计划项目(2018YJCX51)资助 

出 版 物:《科学技术与工程》 (Science Technology and Engineering)

年 卷 期:2018年第18卷第35期

页      码:162-168页

摘      要:为构建东盟十国知识图谱,需要对相关文本进行命名实体识别工作。设计一种基于双向GRU-CRF的神经网络模型,对中国驻东盟十国大使馆中文新闻数据进行命名实体识别。以预训练的领域词向量为输入,利用双向GRU网络从向量化的文本中提取语义特征;再通过CRF层预测并输出最优标签序列。为了进一步改善结果,在双向GRU和CRF层之间添加两层隐藏层。在数据预处理方面,提出一种数据集划分算法,对文本进行更加科学合理的划分。在东盟十国数据集上,将该模型与几种混合模型进行对比,结果显示所提模型在人名、地名、组织机构名识别任务中拥有更好的识别性能。

主 题 词:双向GRU-CRF 命名实体识别 东盟十国 知识图谱 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

馆 藏 号:203439987...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分