看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于文本特征增强的电力命名实体识别 收藏
基于文本特征增强的电力命名实体识别

基于文本特征增强的电力命名实体识别

作     者:刘文松 胡竹青 张锦辉 刘雪菁 林峰 俞俊 LIU Wensong;HU Zhuqing;ZHANG Jinhui;LIU Xuejing;LIN Feng;YU Jun

作者机构:南瑞集团有限公司(国网电力科学研究院有限公司)江苏省南京市211106 江苏瑞中数据股份有限公司江苏省南京市211106 

基  金:国家重点研发计划资助项目(2017YFB1001800) 国网电力科学研究院有限公司科技项目“知识图谱技术研究及在科技领域应用”资助 

出 版 物:《电力系统自动化》 (Automation of Electric Power Systems)

年 卷 期:2022年第46卷第21期

页      码:134-142页

摘      要:针对电力领域语料规模小、实体嵌套、实体缩写等特点,提出基于文本特征增强的实体识别方法。首先,通过预设词库和低粒度分词的方式,在合理利用中文单词蕴含的语义信息的同时,降低分词传递误差的影响。其次,设计词级双向门控循环单元学习中文单词构造特征,融合词性和词长特征后,与单词向量拼接成为单词增强向量。然后,基于双向门控循环单元-注意力机制-条件随机场完成实体识别模型的构建和训练。在此基础上,采用电力领域语料库进行验证,F1分数为87.02%,证实了电力命名实体识别效果。

主 题 词:电力实体识别 低粒度分词 单词构造特征 词级双向门控循环单元 

学科分类:080802[080802] 0808[工学-自动化类] 08[工学] 081203[081203] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.7500/AEPS20210323003

馆 藏 号:203115458...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分