看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Spark的大数据访存行为跨层分析工具 收藏
基于Spark的大数据访存行为跨层分析工具

基于Spark的大数据访存行为跨层分析工具

作     者:许丹亚 王晶 王利 张伟功 Xu Danya;Wang Jing;Wang Li;Zhang Weigong

作者机构:首都师范大学信息工程学院北京100048 高可靠嵌入式技术北京市工程研究中心(首都师范大学)北京100048 北京成像理论与技术高精尖创新中心(首都师范大学)北京100048 

基  金:国家自然科学基金项目(61772350) 北京市科技新星计划(Z181100006218093) 北京未来芯片技术高精尖创新中心科研基金项目(KYJJ2018008) 北京市高水平教师队伍建设计划(CIT&TCD201704082) 科技创新服务能力建设基本科研业务费(科研类)(19530050173) 

出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)

年 卷 期:2020年第57卷第6期

页      码:1179-1190页

摘      要:大数据时代的到来为信息处理带来了新的挑战,内存计算方式的Spark显著提高了数据处理的性能.Spark的性能优化和分析可以在应用层、系统层和硬件层开展,然而现有工作都只局限在某一层,使得Spark语义与底层动作脱离,如操作系统参数对Spark应用层的性能影响的缺失将使得大量灵活的操作系统配置参数无法发挥作用.针对上述问题,设计了Spark存储系统分析工具SMTT,打通了Spark层、JVM层和OS层,建立了上层应用程序的语义与底层物理内存信息的联系.SMTT针对Spark内存特点,分别设计了针对执行内存和存储内存的追踪方式.基于SMTT工具完成了对Spark迭代计算过程内存使用,以及跨越Spark,JVM和OS层的执行存储内存使用过程的分析,并以RDD为例通过SMTT分析了单节点和多节点情况下Spark中读和写操作比例,结果表明该工作为Spark内存系统的性能分析和优化提供了有力的支持.

主 题 词:大数据 Spark 内存管理 跨层分析 内存追踪 

学科分类:0810[工学-土木类] 0808[工学-自动化类] 0839[0839] 081203[081203] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.7544/issn1000-1239.2020.20200109

馆 藏 号:203933371...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分