看过本文的还看了

相关文献

该作者的其他文献

文献详情 >国产百万亿次机群系统Alltoall性能测试与分析 收藏
国产百万亿次机群系统Alltoall性能测试与分析

国产百万亿次机群系统Alltoall性能测试与分析

作     者:饶立 张云泉 李玉成 RAO Li;ZHANG Yun-quan;LI Yu-cheng

作者机构:中国科学院软件研究所并行计算实验室北京100190 中国科学院软件研究所计算机科学国家重点实验室北京100190 

基  金:国家自然科学基金(No.60303020) 国家自然基金重点项目(No.60533020) 国家863(No.2006AA01A102 No.2006AA01A125)资助 

出 版 物:《计算机科学》 (Computer Science)

年 卷 期:2010年第37卷第8期

页      码:186-188,207页

摘      要:随着高性能计算机的应用和发展,并行应用程序所使用的处理器数越来越多,进程间的通信量也不断增多,这对应用程序的性能有很大影响。在采用一种快速傅里叶变换HFFT对曙光5000A进行性能测试时发现,MPI集合通信函数MPI Alltoall的巨大通信开销是并行程序设计的瓶颈。为此,对现有主流Alltoall算法在曙光5000A和深腾7000上进行性能测试与分析,以期对未来的Alltoall算法的优化工作做出贡献。利用不同消息长度和不同进程数测试了Alltoall函数多种算法的性能,这些算法包括二维网格算法、三维网格算法、Bruck算法、原始算法、成对交换算法、递归倍增算法、环算法以及LAM/MPI中的简单算法等。实验结果表明:消息长度较小时,在曙光5000A上采用原始算法和Bruck算法的性能较好,而在深腾7000上用时较少的算法是简单算法和Bruck算法;对于长消息,曙光5000A上最优的算法是环算法,深腾7000上成对交换性能最优。

主 题 词:集合通信 Alltoall 曙光5000A 性能测试与分析 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 08[工学] 081201[081201] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1002-137X.2010.08.040

馆 藏 号:203656858...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分