看过本文的还看了

相关文献

该作者的其他文献

文献详情 >高精度CFD程序的内外子区域划分异构并行算法 收藏
高精度CFD程序的内外子区域划分异构并行算法

高精度CFD程序的内外子区域划分异构并行算法

作     者:王巍 徐传福 车永刚 WANG Wei;XU Chuanfu;CHE Yonggang

作者机构:国防科技大学计算机学院量子信息研究所兼高性能计算国家重点实验室湖南长沙410073 

基  金:国家重点研发计划资助项目(2017YFB0202403) 国家自然科学基金资助项目(61561146395,61772542) 

出 版 物:《国防科技大学学报》 (Journal of National University of Defense Technology)

年 卷 期:2020年第42卷第2期

页      码:31-40页

摘      要:对计算流体力学(Computational Fluid Dynamics,CFD)程序CNS提出一种Offload模式下对任务内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格-库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在“CPU(Intel Haswell Xeon E5-267012 cores×2)+加速器(Xeon Phi 7120A×2)”的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升至5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速至1.27倍,使用双加速器加速至1.45倍。讨论和分析了性能瓶颈与存在的问题。

主 题 词:高精度CFD程序 四阶龙格-库塔法 异构并行算法 内外子区域划分 性能分析 

学科分类:080904[080904] 0808[工学-自动化类] 0809[工学-计算机类] 08[工学] 0810[工学-土木类] 081105[081105] 0805[工学-能源动力学] 0802[工学-机械学] 081001[081001] 081002[081002] 0825[工学-环境科学与工程类] 0701[理学-数学类] 0811[工学-水利类] 0702[理学-物理学类] 0812[工学-测绘类] 0801[工学-力学类] 

核心收录:

D O I:10.11887/j.cn.202002004

馆 藏 号:203907697...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分