看过本文的还看了

相关文献

该作者的其他文献

文献详情 >DB4Trans:数据库内置知识图谱嵌入模型训练引擎 收藏
DB4Trans:数据库内置知识图谱嵌入模型训练引擎

DB4Trans:数据库内置知识图谱嵌入模型训练引擎

作     者:柳鹏凯 王鑫 刘宝珠 蔡顺汀 李思卓 LIU Peng-Kai;WANG Xin;LIU Bao-Zhu;CAI Shun-Ting;LI Si-Zhuo

作者机构:天津大学智能与计算学部天津300350 

基  金:国家重点研发计划项目(2019YFE0198600) 国家自然科学基金面上项目(61972275)资助 

出 版 物:《计算机学报》 (Chinese Journal of Computers)

年 卷 期:2022年第45卷第9期

页      码:1969-1982页

摘      要:知识图谱嵌入技术将知识图谱中的实体和关系嵌入到连续的向量空间中,在简化图谱操作的同时保留知识图谱的固有结构,并有助于完成诸如图谱补全、链接预测等下游任务.随着基于知识的人工智能的日益普及和应用,知识图谱的数据规模正在急剧增加.然而,大部分的知识图谱嵌入工作主要关注模型训练的结果,忽略了对于数据规模的可扩展性,在处理大规模知识图谱时表现出较差的性能.近年来的一些研究工作将数据库技术应用于机器学习算法的优化,同时提供了用于数据库内机器学习的各类工具.通过将知识图谱嵌入模型与数据库在数据管理上的优势进行有效的结合,能够在保证知识图谱嵌入模型训练的准确率和效率的同时,提供更好的可扩展性以支持大规模知识图谱数据的训练.基于此,本文提出一种数据库内置知识图谱嵌入模型训练引擎DB4Trans.首先,设计了一种用于知识图谱嵌入模型训练的数据存储方案,对实体和关系进行编码并建立索引结构,以实现模型训练过程中对中间结果的快速访问和更新;其次,提出了一种数据库内置的模型训练优化算法,对数据库与内存间的数据批量交换方案进行设计以支持大规模数据的训练与存储;最后,在不同数据集上进行了测试,比较了模型训练与预测的时间、模型训练的准确率、存储时间和空间效率并验证了方法的可扩展性.实验结果表明,所提出的方法能够在不影响模型训练效率和准确率的同时,通过内存与数据库间的数据交换,支持在数据库内完成大规模知识图谱的训练过程.

主 题 词:数据库 知识图谱嵌入 模型训练引擎 DB4AI TransE 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

核心收录:

D O I:10.11897/SP.J.1016.2022.01969

馆 藏 号:203114408...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分