基于云边多数仓架构和代价预测模型的查询调度
作者机构:东北大学医学与生物信息工程学院辽宁沈阳110169 沈阳市纪检监察大数据监督保障中心辽宁沈阳110179 东北大学计算机科学与工程学院辽宁沈阳110169
出 版 物:《大数据》 (Big Data Research)
年 卷 期:2025年第11卷第1期
页 码:150-166页
摘 要:随着云计算和大数据的发展,传统的本地数据仓库面临着扩容困难、数据处理效率低下的问题,由此云边架构的数据仓库应运而生。该架构的数据仓库分布在云中心和边缘端,使数据存储和处理更加灵活,在保证查询效率的前提下,为数据安全、数据隐私和跨地域数据共享等业务提供支持。设计基于云边多数仓的调度框架,集成以机器学习技术为核心的查询代价预测模型,实现了在多个查询粒度上的云边协同执行和云边择优执行,提高了系统的整体性能和查询效率。此外,提出了有利于查询代价信息增强的多特征融合和特征筛选方法。此调度框架和优化算法在SSB和TPC-DS数据集上均表现出显著的性能提升,为云边多数仓架构下的数据仓库查询调度提供了有效的解决方案。
主 题 词:云边多数仓 调度框架 查询代价预测 随机森林 特征筛选
学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类]
D O I:10.11959/j.issn.2096-0271.2025011
馆 藏 号:203156832...