看过本文的还看了

相关文献

该作者的其他文献

文献详情 >VPM:列存储系统中基于带值路径的物化技术 收藏
VPM:列存储系统中基于带值路径的物化技术

VPM:列存储系统中基于带值路径的物化技术

作     者:丁祥武 余文兵 刘国华 Ding Xiangwu;Yu Wenbing;Liu Guohua

作者机构:东华大学计算机科学与技术学院上海201620 计算机软件新技术国家重点实验室(南京大学)南京210093 

基  金:"核高基"国家科技重大专项基金项目(2010ZX01042-001-003-004) 国家自然科学基金项目(61070031 61070032) 上海市自然科学基金项目(11ZR1401200) 

出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)

年 卷 期:2012年第49卷第10期

页      码:2086-2094页

摘      要:物化是列存储数据仓库查询中必不可少的操作,物化策略和物化技术直接影响到查询执行的性能,因此设计一种适应于列存储系统的物化策略和相关技术尤为重要.针对延迟物化可能重复读取数据块的缺陷,提出了基于带值路径的物化技术,简称VPM.首先,定义了一个描述物理执行中间结果的结构——传递块,该结构将用于重构的位置信息与实际列值相分离.在此基础上,对于给定的物理查询树,根据其操作节点是否需要某一列的值进行路径标记,生成自扫描节点或抽值节点到最终需要这些节点的引用列的祖先节点之间的路径,即带值路径.将起始节点引用列的列值保存在传递块的列值区中,并在向查询树的上层操作节点传输过程中不断对其过滤.对带值路径中的其他列仅保存其位置信息.在查询执行时,除了路径起始节点要从磁盘读取数据外,其他节点直接从传递块中获得相应的列值,有效地减少了查询处理过程的I/O开销,提高了查询的执行性能.最后在DWMS上使用TPC-H中针对数据仓库的基准数据集SSBM进行实验,验证了基于带值路径物化技术的有效性.

主 题 词:列存储 物化 传递块 带值路径 VPM 

学科分类:0810[工学-土木类] 12[管理学] 1201[管理学-管理科学与工程类] 0808[工学-自动化类] 0839[0839] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

馆 藏 号:203118685...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分