看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的领域本体概念自动获取方法研究 收藏
基于深度学习的领域本体概念自动获取方法研究

基于深度学习的领域本体概念自动获取方法研究

作     者:王思丽 祝忠明 刘巍 杨恒 Wang Sili

作者机构:中国科学院西北生态环境资源研究院文献情报中心甘肃兰州730000 中国科学院兰州文献情报中心甘肃兰州730000 中国科学院大学北京100049 

基  金:中国科学院兰州文献情报中心2018年主任基金项目“基于深度学习的领域本体自动构建方法研究”(项目编号:Y8AJ012005) 中国科学院2019年西部之光项目“开放学术资源的情景化组织与服务研究”(项目编号:Y9AX011001)的成果 

出 版 物:《情报理论与实践》 (Information Studies:Theory & Application)

年 卷 期:2020年第43卷第3期

页      码:145-152,144页

摘      要:[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。

主 题 词:深度学习 领域本体 概念自动获取 词嵌入 自注意力 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081203[081203] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.16353/j.cnki.1000-7490.2020.03.024

馆 藏 号:203885883...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分