看过本文的还看了

相关文献

该作者的其他文献

文献详情 >DPML:一种面向科学数据语用的标记语言 收藏
DPML:一种面向科学数据语用的标记语言

DPML:一种面向科学数据语用的标记语言

作     者:蔡华谦 刘逸豪 关天鹏 吴恺东 杨婧如 罗超然 朱小杰 刘佳 黄罡 CAI Huaqian;LIU Yihao;GUAN Tianpeng;WU Kaidong;YANG Jingru;LUO Chaoran;ZHU Xiaojie;LIU Jia;HUANG Gang

作者机构:数据空间与系统全国重点实验室北京100091 北京大学计算机学院北京100871 北京大学软件与微电子学院北京100871 中国科学院计算机网络信息中心北京100083 

基  金:国家重点研发计划“面向国家科学数据中心的基础软件栈及系统”(2021YFF0704200) 

出 版 物:《数据与计算发展前沿(中英文)》 (Frontiers of Data & Computing)

年 卷 期:2024年第6卷第4期

页      码:46-58页

摘      要:【目的】科学数据的使用场景日益丰富,了解已有场景中科学数据如何使用,对科技探索与发现有很重要的启发和借鉴作用。然而,由于科学数据的场景化使用蕴藏了复杂的输入、算法和执行环境,这使得如何统一地描述数据的场景化使用成为了一个挑战。这种统一描述的缺失导致了理解和学习已有场景中的科学数据的用法变得难度大、成本高、效率低。【方法】针对数据场景化使用的统一描述缺失的问题,本文采用数据语用的概念,从超图的角度来建模数据的场景化使用,设计了面向数据语用的新型标记语言DPML(Data Pragmatics Markup Language),并提出了一套基于AI的科学数据语用的自动化提取方法。【结果】DPML可以表征多种典型的基于科学数据的场景化使用中的数据语用,同时利用上述的自动化方法,可以高效地提取出DPML。【结论】通过提出DPML及其自动化提取方法,本文实现了科学数据场景化使用中隐含的数据语用的自动化表征。通过数据以及数据之间的语用关系所形成的科学数据的语用网络蕴藏了科学数据如何使用的知识,可以促进科学数据跨学科的共享和再利用,为科学研究的深入合作与数据驱动发现开辟了新的路径。

主 题 词:科学数据 数据语用 标记语言 自动化提取 人工智能 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 

D O I:10.11871/jfdc.issn.2096-742X.2024.04.004

馆 藏 号:203138931...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分