限定检索结果

检索条件"主题词=Spark"
356 条 记 录,以下是81-90 订阅
视图:
排序:
一种基于spark的不确定数据集频繁模式挖掘算法
收藏 引用
《信息与控制》2019年 第3期48卷 257-264页
作者:杨阳 丁家满 李海滨 贾连印 游进国 姜瑛昆明理工大学信息工程与自动化学院 
如何在海量不确定数据集中提高频繁模式挖掘性能是目前研究的热点.传统算法大多是以期望、概率或者权重等单一指标为数据项集支持度,在大数据背景下,同时考虑概率和权重支持度的算法难以兼顾其执行效率.为此,本文提出一种基于spark的不...
来源:详细信息评论
spark Streaming框架下的气象自动站数据实时处理系统
收藏 引用
《计算机应用》2018年 第1期38卷 38-43,55页
作者:赵文芳 刘旭林北京市气象信息中心北京100089 北京市气象探测中心北京100176 
针对现有气象自动站业务平台面临处理数据不及时、交互式响应慢、统计时效差等问题,提出了使用spark Streaming技术和HBase解决该问题的方法,将实时计算框架和分布式数据库系统结合起来实现大规模流式数据处理。使用Flume收集自动站数据...
来源:详细信息评论
基于spark的BIRCH算法并行化的设计与实现
收藏 引用
《计算机工程与科学》2017年 第1期39卷 35-41页
作者:李帅 吴斌 杜修明 陈玉峰北京邮电大学智能通信软件与多媒体北京重点实验室北京100876 北京邮电大学计算机学院北京100876 国网山东省电力公司电力科学研究院山东济南250000 
在分布式计算和内存为王的时代,spark作为基于内存计算的分布式框架技术得到了前所未有的关注与应用。着重研究BIRCH算法在spark上并行化的设计和实现,经过理论性能分析得到并行化过程中时间消耗较多的spark转化操作,同时根据并行化BIRC...
来源:详细信息评论
spark下的分布式粗糙集属性约简算法
收藏 引用
《计算机应用》2020年 第2期40卷 518-523页
作者:章夏杰 朱敬华 陈杨黑龙江大学计算机科学技术学院哈尔滨150080 黑龙江省数据库与并行计算重点实验室哈尔滨150080 
属性约简(特征选择)作为数据预处理的重要环节,大多以属性依赖作为筛选属性子集的标准。设计了一种快速依赖计算方法FDC,通过直接寻找基于相对正域的对象来计算依赖度,而不需要预先求出相对正域,相比传统方法在速度上有明显的性能提升...
来源:详细信息评论
基于spark的线性模型在广告投放系统中的应用研究
收藏 引用
《广东工业大学学报》2016年 第5期33卷 28-33页
作者:林穗 赵菲广东工业大学计算机学院广东广州510006 
针对在线广告投放中对实时性和高精确度的要求,对比了Hadoop和spark两种主流平台在实现流程及效率方面的差异,提出了将线性模型结合spark技术应用在广告投放系统中,并从数值特征、迭代和步长等方面对模型进行优化.经测试表明,调优后的...
来源:详细信息评论
spark框架结合分布式KNN分类器的网络大数据分类处理方法
收藏 引用
《计算机应用研究》2019年 第11期36卷 3274-3277,3333页
作者:曹瑜 王楠 徐志超哈尔滨金融学院计算机系哈尔滨150030 吉林财经大学管信学院长春130117 吉林大学计算机学院长春130012 
针对现有大数据分类方法难以满足大数据应用中时间和储存空间的限制,提出了一种基于Apache spark框架的大数据并行多标签K最近邻分类器设计方法。为了通过使用其他内存操作来减轻现有MapReduce方案的成本消耗,首先,结合Apache spark框...
来源:详细信息评论
spark和Flink平台大数据批量处理的性能分析
收藏 引用
《中国电子科学研究院学报》2018年 第2期13卷 191-195,213页
作者:马黎武汉大学计算机学院 商丘职业技术学院学报编辑部 
为了研究Apache spark和Apache Flink两个框架在进行批量大数据处理时的性能差异和相似性,分析spark和Flink的引擎差异,重点对比了两个框架在运行机器学习算法的细节。比较的算法有:支持向量机(SVM)算法、线性回归(LR)算法和分布...
来源:详细信息评论
基于spark框架的乘潮水位计算与可视化平台
收藏 引用
《计算机工程与科学》2015年 第12期37卷 2216-2221页
作者:秦勃 朱勇 秦雪中国海洋大学信息科学与工程学院山东青岛266100 国家海洋信息中心天津300171 
乘潮水位计算是海洋环境信息处理的重要组成部分,具有计算量大、计算复杂度高、计算时间长等特性。采用传统集群计算模式实现乘潮水位计算业务,存在计算成本高、计算伸缩性和交互性差的问题。针对以上问题,提出一种基于spark框架的乘潮...
来源:详细信息评论
美国spark自我管理课程的本土化设计及其实证研究
收藏 引用
《北京体育大学学报》2017年 第9期40卷 72-80,98页
作者:李凌姝 季浏上海外国语大学体育教学部上海200083 华东师范大学体育与健康学院上海200241 
在我国越来越注重"健康第一"的体育教学指导思想之时,人们也在思考如何提高学生自身的体育锻炼水平,如何将有限的体育课堂效果延伸到课外,甚至让其进行终身体育锻炼,spark自我管理课程在欧美广为盛行并已达到一定的效果。旨...
来源:详细信息评论
基于spark Streaming的实时数据分析系统及其应用
收藏 引用
《计算机应用》2017年 第5期37卷 1263-1269页
作者:韩德志 陈旭光 雷雨馨 戴永涛 张肖上海海事大学信息工程学院上海201306 郑州大学信息工程学院郑州450001 
为了实现对实时网络数据流的快速分析,设计一种分布式实时数据流分析系统(DRDAS),能有效解决并发访问数据流的收集、存储和实时分析问题,为大数据环境的网络安全检测提供了一种有效的数据分析平台;根据spark Streaming运行的原理设计一...
来源:详细信息评论
聚类工具 回到顶部