看过本文的还看了

相关文献

该作者的其他文献

文献详情 >融合汉字多级特征与文本局部特征的中文命名实体识别 收藏
融合汉字多级特征与文本局部特征的中文命名实体识别

融合汉字多级特征与文本局部特征的中文命名实体识别

作     者:张慧 秦董洪 白凤波 罗余特 刘成星 宋蕃桦 ZHANG Hui;QIN Donghong;BAI Fengbo;LUO Yute;LIU Chengxing;SONG Fanhua

作者机构:广西民族大学人工智能学院广西南宁530000 

基  金:广西科技基地和人才专项(桂科AD23026054) 广西壮族自治区中央引导地方科技发展资金项目(桂科ZY24212045) 

出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)

年 卷 期:2024年第38卷第9期

页      码:93-107页

摘      要:针对目前中文命名实体识别模型在复杂语境下准确率较低的问题,添加更多汉字特征以弥补词向量表形、表音方面的不足,引入更多先验知识,丰富语义特征;同时设计一种兼顾全局特征与局部特征的编码器,提升模型面对复杂语境时的鲁棒性与泛化性;实验结果表明,该文提出的方法在Weibo、OntoNotes 5.0、Boson、People Daily数据集上F 1值分别提升1.61、0.37、0.98、0.98,验证汉字本身特征的重要性与通用性的同时,也验证了文本局部特征有助于提升模型性能。此外,还探究了八种不同汉字编码方式对模型性能的影响,实验证明相比于单个拼音字符,汉字的声母、韵母携带更多发音信息,音调、多音字等特征也有利于提升模型性能;最后,在多种文本实例上测试了模型性能,实验结果表明了该文工作的有效性。

主 题 词:字形特征 拼音特征 文本局部特征 命名实体识别 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

馆 藏 号:203144801...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分