看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Hadoop与Spark的大数据处理平台的构建研 收藏
基于Hadoop与Spark的大数据处理平台的构建研

基于Hadoop与Spark的大数据处理平台的构建研

作     者:朱毓 

作者机构:安徽工业职业技术学院 

基  金:安徽省高校自然科学研究重点项目——基于BPF面向容器网络模型研究与优化(编号:KJ2021A1467) 

出 版 物:《互联网周刊》 (China Internet Week)

年 卷 期:2023年第7期

页      码:87-89页

摘      要:鉴于当前的数据治理管控方法缺乏统一标准约束,治理管控效果比较差,故此设计一种基于Hadoop与Spark大数据平台的数据治理管控方法。使用Apache Atlas元数据管理工具,配合Hadoop与Spark平台完成管理工具的伸缩和扩展,实现元数据管理,利用Hadoop与Spark大数据平台中自带的分布式文件系统GFS的结构,内置的大量块服务器与客户端功能使用的过程中进行交互,搭建并行计算框架,数据治理过程主要针对数据的一致性、完整性和实时性三个方面进行治理过程设计。方法性能测试结果表明:使用设计的数据治理管控方法,企业的运营数据一致性、完整性、实时性分别为97.5%、97.7%、95.4%,由此可以看出数据质量存在提升。

主 题 词:Hadoop Spark 大数据处理 平台构建 

学科分类:08[工学] 0812[工学-测绘类] 

馆 藏 号:203120996...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分