看过本文的还看了

相关文献

该作者的其他文献

文献详情 >非结构化地质数据内容存储方法研究 收藏
非结构化地质数据内容存储方法研究

非结构化地质数据内容存储方法研究

作     者:魏东琦 江宝得 张静雅 WEI Dongqi;JIANG Baode;ZHANG Jingya

作者机构:中国地质大学(武汉)国家地理信息系统工程技术研究中心湖北武汉430074 中国地质调查局西安地质调查中心陕西西安710054 地理信息工程国家重点实验室陕西西安710054 

基  金:中国地质调查项目“国家地质大数据汇聚与管理”(202009000000180722) 地理信息工程国家重点实验室基金资助项目、实验室开放基金(SKLGIE2019-Z-4-1) 

出 版 物:《西北地质》 (Northwestern Geology)

年 卷 期:2021年第54卷第4期

页      码:266-273页

摘      要:地质工作已迈入大数据时代,但地学信息被记录成的报告、图件等非结构化数据,仍按照较为简单的方式组织归类到一起并存储在文件系统中,形成很多个内部构成复杂的数据集。这种方式不能很好的表达非结构化数据承载的丰富地学信息,也不便表达信息之间的复杂关系,更不利于发现跨数据集存在的深层知识。为尝试解决这个问题,笔者提出了多粒度级别内容树模型和支持演化的数据建模方式。这些特性使得通过模型可以对数据内容进行不同尺度的拆分,对信息的精确定位,还可以使模型根据数据主体需要,拓展主体特征描述的维度,逐步发现数据包含的信息和建立信息与信息之间的关系。考虑到地质大数据的特点,设计了以HBase为核心的数据模型持久化方式,以达到使用大数据技术体系下技术分析处理数据的目的;最后给出了对成果地质数据进行建模的实例,将文档、图件等非结构化数据以内容实体为最小单元进行拆分和重构,达到了较好的内容组织和信息表达效果。

主 题 词:地质大数据 非结构化数据 数据建模 内容存储 

学科分类:081801[081801] 08[工学] 0818[工学-交通运输类] 

D O I:10.19751/j.cnki.61-1149/p.2021.04.022

馆 藏 号:203105936...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分