看过本文的还看了

相关文献

该作者的其他文献

文献详情 >中文命名实体识别模型对比分析 收藏
中文命名实体识别模型对比分析

中文命名实体识别模型对比分析

作     者:祖木然提古丽·库尔班 艾山·吾买尔 Zumurantiguli Kuerban;Aishan Wumaier

作者机构:新疆大学信息科学与工程学院乌鲁木齐830046 新疆多语种信息技术重点实验室乌鲁木齐830046 

基  金:国家自然科学基金(No.61662077、No.61262060) 

出 版 物:《现代计算机》 (Modern Computer)

年 卷 期:2019年第25卷第14期

页      码:3-7页

摘      要:为了比较客观了解现有主要中文命名实体识别系统与开源系统的性能,基于字的双向长短时记忆循环神经网络(BiLSTM)接入条件随机场(CRF)的系统,利用微软亚洲研究院的MSRA数据集实现中文命名实体识别模型,然后使用MSRA测试数据对自建模型、哈工大的语言技术平台(LTP)和斯坦福大学CoreNLP自然语言处理工具进行对比测试与分析。实验表明:BiLSTM对地名实体的识别效果最佳,与地名和人名相比机构名识别效果与开源工具保持同等水平。实验在语料规模以及实验设计方面有提升空间。后续将实验模型作为重点,将特定领域实体与序列标注问题相结合进行开展研究。

主 题 词:命名实体识别 双向长短时记忆循环神经网络(BiLSTM) 语言技术平台(LTP) CoreNLP 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1007-1423.2019.14.001

馆 藏 号:203673322...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分