看过本文的还看了

相关文献

该作者的其他文献

文献详情 >英汉双语富媒体知识图谱构建工程研究——以CNS英文期刊为例 收藏
英汉双语富媒体知识图谱构建工程研究——以CNS英文期刊为例

英汉双语富媒体知识图谱构建工程研究——以CNS英文期刊为例

作     者:韦向峰 缪建明 张全 袁毅 WEI Xiangfeng;MIAO Jianming;ZHANG Quan;YUAN Yi

作者机构:中国科学院声学研究所北京100190 富媒体数字出版内容组织与知识服务重点实验室北京100038 中国兵器工业信息中心北京100089 

基  金:2022年富媒体数字出版内容组织与知识服务重点实验室开放基金“基于英文科技出版物的跨语言富媒体知识工程研究”(ZD2022-10/01) 

出 版 物:《情报工程》 (Technology Intelligence Engineering)

年 卷 期:2023年第9卷第5期

页      码:84-96页

摘      要:[目的/意义]研究自动构建英汉双语富媒体知识图谱的方法和过程,为跨语言多模态知识图谱的自动构建提供借鉴参考,对及时获取最新英文科研成果、科技情报监测等具有重要意义。[方法/过程]采用自顶向下和自底向上相结合的方法,先从顶层设计要抽取的主要实体、属性和关系,从底层非结构化文本数据进行分析抽取细粒度的实体和属性,对有歧义实体和跨语言实体进行实体对齐,对跨媒体的实体进行实体链接,用图数据库实现知识图谱的存储及应用。[局限]未来需进一步提高细粒度实体的抽取正确率,对音视频媒体进行特征提取和内容自动识别。[结果/结论]以CNS(Cell、Nature、Science)等英文科技期刊网站为例,通过数据抓取、实体抽取、属性抽取、知识融合、跨媒体链接等过程,实现了英汉双语富媒体知识图谱的构建、存储和可视化展示。

主 题 词:富媒体 知识图谱 实体抽取 实体对齐 语步识别 

学科分类:1205[管理学-图书情报与档案管理类] 12[管理学] 081203[081203] 08[工学] 120502[120502] 0835[0835] 0812[工学-测绘类] 

D O I:10.3772/j.issn.2095-915x.2023.05.007

馆 藏 号:203125463...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分