看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向远程监督命名实体识别的噪声检测 收藏
面向远程监督命名实体识别的噪声检测

面向远程监督命名实体识别的噪声检测

作     者:王嘉诚 王凯 王昊奋 杜渂 何之栋 阮彤 刘井平 Wang Jiacheng;Wang Kai;Wang Haofen;Du Wen;He Zhidong;Ruan Tong;Liu Jingping

作者机构:华东理工大学信息科学与工程学院上海200237 同济大学设计与创意学院上海200092 迪爱斯信息技术股份有限公司上海200032 

基  金:上海市促进产业高质量发展专项资金(2021-GZL-RGZN-01018) 国家重点研发计划项目(2021YFC2701800,2021YFC2701801) 之江实验室开放课题(2019ND0AB01) 上海市青年科技英才扬帆计划项目(23YF1409400) 

出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)

年 卷 期:2024年第61卷第4期

页      码:916-928页

摘      要:针对远程监督命名实体识别(named entity recognition,NER)任务,目前有许多基于强化学习的方法,利用强化学习的强大决策能力,对远程监督生成的自动标注数据进行噪声过滤.然而,这些方法所使用的策略网络模型架构都较简单,识别噪声能力较弱,且都以完整的句子样本为单位进行识别,导致句子中的部分正确信息被丢弃.为解决上述问题,提出了一种新的基于强化学习的方法,称为RLTL-DSNER,该方法可以从远程监督生成的带噪数据中,以单词级别识别正确实例,减少噪声实例对远程监督NER的负面影响.具体来说,在策略网络模型中引入了标签置信函数来准确识别实例.此外,提出了一种新颖的NER模型预训练策略,使其能为强化学习的初始训练提供精准的状态表示和有效的奖励值,引导其向正确的方向更新.在4个数据集上的实验结果验证了RLTL-DSNER方法的优越性,在NEWS数据集上,相较于现有最先进的方法,获得了4.28%的F1提升.

主 题 词:命名实体识别 远程监督 深度强化学习 噪声检测 预训练策略 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.7544/issn1000-1239.202220999

馆 藏 号:203127134...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分