看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向中医古籍的单篇文本知识标引与结构解析技术 收藏
面向中医古籍的单篇文本知识标引与结构解析技术

面向中医古籍的单篇文本知识标引与结构解析技术

作     者:刘耀 李冠霖 李浣青 Liu Yao;Li Guanlin;Li Huanqing

作者机构:中国科学技术信息研究所北京100038 巴黎理工学院Samovar实验室法国91120 北京大学软件与微电子学院北京100871 

基  金:国家社会科学基金项目“数字资源知识共享与知识再利用模式与方法研究”(项目编号:21BTQ011) 国家重点研发计划“数据驱动的科技咨询服务平台建设”(项目编号:2018YFB143502)研究成果之一 

出 版 物:《图书情报工作》 (Library and Information Service)

年 卷 期:2022年第66卷第24期

页      码:118-127页

摘      要:[目的/意义]在无标注资源的情况下,对中医古籍文本领域的分词和命名实体识别技术进行研究,基于分词与命名实体识别模型,对中医领域文本进行分词并进行语言模型的训练。[方法/过程]在训练过程中,研究采用实体概念排序预测与遮罩词预测的多任务学习框架,有效将词典中的先验概念知识融入到语言模型中,得到融合语篇语义与先验知识的语言模型。从模型训练中使用的MLM任务出发,设计基于完形填空类型的文本生成任务来进行单篇古籍文本的知识标引,以短句一实体为路径,遍历单篇文本中所有的短句并进行知识概念的全标引,并基于先验规则的挖掘,从单篇文本中发现隐性知识结构,从而构建隐性篇章结构。[结果/结论]对比实验显示,在仅有5个标注样本的情况下,研究提出的文本标引方式能够有效利用模型的先验知识;相较于传统方法,能更好地解决标注缺失情况下的中医古籍文本知识标引的问题,为进一步实现中医古籍单篇文本的解析提供解决方法。对中医古籍进行整理、校注,挖掘其中蕴含的知识,对中医学与现代医学的发展,以及医学史的研究都有重要的理论与现实意义。

主 题 词:单篇文本知识结构解析 知识标引 先验知识 词微调语言模型 实体概念识别 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.13266/j.issn.0252-3116.2022.24.011

馆 藏 号:203118220...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分