看过本文的还看了

相关文献

该作者的其他文献

文献详情 >部首感知的中文医疗命名实体识别 收藏
部首感知的中文医疗命名实体识别

部首感知的中文医疗命名实体识别

作     者:李丹 徐童 郑毅 王喆锋 陈恩红 LI Dan;XU Tong;ZHENG Yi;WANG Zhefeng;CHEN Enhong

作者机构:大数据分析与应用安徽省重点实验室(中国科学技术大学)安徽合肥230027 中国科学技术大学计算机科学与技术学院安徽合肥230027 华为技术有限公司浙江杭州310052 

基  金:国家重点研发计划(2018YFB1004300) 国家自然科学基金(U1605251,61703386) 中央高校基本科研业务费专项资金(WK9110000014) 安徽省重点研发计划项目(1804b06020377) 

出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)

年 卷 期:2020年第34卷第12期

页      码:54-64页

摘      要:人工智能技术的发展推动了医疗领域的智能化,为提升医疗效率、改善医疗水平提供了新的助力。同时,这一新的趋势也催生了海量的电子病历文本,其所蕴含的丰富信息具有巨大的潜在挖掘与应用价值。然而,当前中文电子病历的命名实体识别研究工作并没有全面考虑中文及中文医疗领域的特殊性,而是将面向通用数据集的模型迁移到医疗领域的实体类型中,分析效果较为有限。针对这一问题,该文设计了长短期记忆网络与条件随机场的联合模型并引入BERT模型;在此基础之上,考虑到医疗领域命名实体鲜明的部首特征,通过将部首信息编码到字向量中,并且结合部首信息修改条件随机场层得分函数的计算方式,有效地提升了医疗领域命名实体的抽取能力。通过两项电子病历数据集的实验结果表明,该文提出的模型整体效果略高于通用的实体识别模型,并对疾病诊断等特定类型的实体词的识别效果具有较为明显的提升。

主 题 词:命名实体识别 长短期记忆网络 条件随机场 BERT 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

馆 藏 号:203101798...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分