看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向新一代神威超级计算机的高效内存分配器 收藏
面向新一代神威超级计算机的高效内存分配器

面向新一代神威超级计算机的高效内存分配器

作     者:王豪杰 马子轩 郑立言 王元炜 王飞 翟季冬 WANG Haojie;MA Zixuan;ZHENG Liyan;WANG Yuanwei;WANG Fei;ZHAI Jidong

作者机构:清华大学计算机科学与技术系北京100084 

基  金:国家自然科学基金项目(U20A20226) 

出 版 物:《清华大学学报(自然科学版)》 (Journal of Tsinghua University(Science and Technology))

年 卷 期:2022年第62卷第5期

页      码:943-951页

摘      要:随着应用程序规模的增大,应用程序对计算资源的需求也日益增加,超级计算机为满足这一需求提供了良好的平台。传统的超级计算机主要面向科学计算程序,而近年来应用的多样化对超级计算机的软硬件设计提出了新要求。该文在新一代神威超级计算机上发现了在动态运行模式下内存分配的性能问题,并针对神威的体系结构特征和应用特征,设计了高效的内存分配器——SWAlloc。实验结果表明:SWAlloc可以将超大规模机器学习训练框架八卦炉的内存分配速度提升至多75 839倍;对随机生成的内存分配记录和标准测试程序集PARSEC中的内存分配记录的测试结果,验证了SWAlloc在不同应用上的通用性和高效性,可将神威超级计算机上PARSEC的内存分配效率提升至多51倍(平均提升36%)。SWAlloc已经布署于新一代神威超级计算机上,并用于SWPytorch、 SWTensorFlow等超大规模应用。

主 题 词:内存分配 超级计算机 高性能计算 机器学习 

学科分类:08[工学] 0835[0835] 0812[工学-测绘类] 081202[081202] 

核心收录:

D O I:10.16511/j.cnki.qhdxxb.2022.22.007

馆 藏 号:203110313...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分