看过本文的还看了

相关文献

该作者的其他文献

文献详情 >结合字形特征与迭代学习的金融领域命名实体识别 收藏
结合字形特征与迭代学习的金融领域命名实体识别

结合字形特征与迭代学习的金融领域命名实体识别

作     者:刘宇瀚 刘常健 徐睿峰 骆旺达 陈奕 吉忠晟 应能涛 LIU Yuhan;LIU Changjian;XU Ruifeng;LUO Wangda;CHEN Yi;JI Zhongsheng;YING Nengtao

作者机构:哈尔滨工业大学(深圳)计算机科学与技术学院广东深圳518055 

基  金:国家自然科学基金(61632011,61876053) 深圳市基础研究项目(JCYJ20180507183527919,JCYJ20180507183608379) 深圳市技术攻关项目(JSGG20170817140856618) 

出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)

年 卷 期:2020年第34卷第11期

页      码:74-83页

摘      要:针对中文金融文本领域的命名实体识别,该文从汉字自身特点出发,设计了结合字形特征、迭代学习以及双向长短时记忆网络和条件随机场的神经网络模型。该模型是一种完全端到端且不涉及任何特征工程的模型,其将汉字的五笔表示进行编码以进行信息增强,同时利用迭代学习的策略不断对模型整体预测结果进行改进。由于现有的命名实体识别研究在金融领域缺乏高质量的有标注的语料库资源,所以该文构建了一个大规模的金融领域命名实体语料库HITSZ-Finance,共计31210个文本句,包含4类实体。该文在语料库HITSZ-Finance上进行了一系列实验,实验结果均表明模型的有效性。

主 题 词:金融领域命名实体识别 中文语料库 深度学习 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

馆 藏 号:203993385...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分