基于决策树挖掘算法的气象大数据云平台设计
作者机构:海南省气象信息中心海口570203 海南省南海气象防灾减灾重点实验室海口570203
基 金:国家自然科学基金(41775011) 海南省气象局科技创新项目(HNQXSJ202114)
出 版 物:《计算机测量与控制》 (Computer Measurement &Control)
年 卷 期:2022年第30卷第11期
页 码:140-146页
摘 要:大数据、云计算技术的迅猛发展为挖掘气象数据丰富的科研和经济价值提供了技术支撑,促进了Hadoop及其包含的文件存储系统(HDFS,hadoop distributed file system)和分布式计算模型在气象数据处理领域广泛应用;由于气象数据具有大数据的4 V特征,还需要引入新的数据处理算法来提高气象数据处理效率;通过对决策树算法原理的研究,基于Hadoop云平台,创建随机森林模型,为数据挖掘算法在云平台上的应用提供一种新的可能性;基于决策树(CART,classification and regression trees)挖掘算法的气象大数据云平台设计,采用Hadoop系统架构和MapReduce工作流程,对气象大数据云平台采用集群部署;平台总体架构分为基础设施层、数据管理与处理层、应用层,减少了决策树建立的时间,实现了气象数据高效加工和挖掘分析等平台功能。
主 题 词:气象数据 气象大数据云平台 决策树算法 Hadoop MapReduce
学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类]
D O I:10.16526/j.cnki.11-4762/tp.2022.11.021
馆 藏 号:203115537...