看过本文的还看了

相关文献

该作者的其他文献

文献详情 >MapReduce并行加速数据流多模式相似性搜索 收藏
MapReduce并行加速数据流多模式相似性搜索

MapReduce并行加速数据流多模式相似性搜索

作     者:付晨 钟诚 叶波 FU Chen;ZHONG Cheng;YE Bo

作者机构:广西大学计算机与电子信息学院南宁530004 广西科技信息网络中心南宁530012 

基  金:广西自然科学基金资助项目(2014GXNSFAA118396)~~ 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2017年第37卷第1期

页      码:37-41,53页

摘      要:设计时间序列数据在Hadoop分布式文件系统(HDFS)中的有效存储方式,利用分布式缓存工具Distributed Cache将各子序列分发到Hadoop集群的计算节点上,将动态时间弯曲距离矩阵划分成多个子矩阵,采取并行迭代计算每条反对角线上子矩阵的方法,基于MapReduce编程模型,实现高效并行计算时间序列动态弯曲距离,通过改进剪裁冗余计算方法,设计实现一种数据流多模式相似性搜索并行算法。中国雪深长时间序列数据集的实验结果表明,当每条时间序列的长度达到5 000以上时,并行计算动态弯曲距离所需时间少于串行计算所需时间,当每条时间序列的长度达到9 000以上时,参与计算的集群节点越多,并行计算所需时间越少;当模式长度达到4 000、参与计算的集群节点数达5个以上时,从数据流中并行搜索出与模式匹配的相似子序列所需时间约为串行搜索所需时间的20%。

主 题 词:时间序列 数据流 动态时间弯曲距离 模式搜索 Hadoop 

学科分类:08[工学] 081201[081201] 0812[工学-测绘类] 081202[081202] 

D O I:10.11772/j.issn.1001-9081.2017.01.0037

馆 藏 号:203210927...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分