看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于申威众核处理器的海冰模式并行加速方法 收藏
基于申威众核处理器的海冰模式并行加速方法

基于申威众核处理器的海冰模式并行加速方法

作     者:李镔洋 李波 钱德沛 LI Bin-Yang;LI Bo;QIAN De-Pei

作者机构:北京航空航天大学计算机学院北京100191 

基  金:国家自然科学基金项目(61133004 61502019) 重点研发项目(2016YFB0200100)资助~~ 

出 版 物:《计算机学报》 (Chinese Journal of Computers)

年 卷 期:2018年第41卷第10期

页      码:2221-2235页

摘      要:海冰模式是地球模式的重要组成部分,其使用不同的网格和时间梯度来模拟海冰区域随时间的变化.海冰模式具有计算密集的特性,随着海冰模式计算精度的提升,传统的硬件已难以满足其计算需求.申威太湖之光超级计算机是第一台峰值性能超过100Pflops的超级计算机,其为高精度的海冰模式过程模拟提供了新的硬件平台,但在该平台上实现算法高效并行化仍面临着诸多问题.一些应用程序已经在众核平台上实现移植和并行化,但是相比其他领域,气候软件在众核平台移植和并行化的过程相对缓慢.有关气候模式在众核平台的并行化研究大多基于GPU实现.早期的研究多基于单个气候运算过程,该过程通常为计算密集型程序,通信过程相对较少,基于GPU的实现可以取得较好的并行效果.与单一的运算过程不同,海冰模式程序需要与多个气候模式进行交互,如何减少通信过程开销以及如何充分利用申威处理器所提供的并行性能是我们遇到的主要问题.为解决这一问题,该文基于申威众核处理器,设计了一种针对海冰模式算法移植和并行化的方法.每个申威众核处理器包含有4个核组,每个核组包含有一个管理核心和64个计算核心.为充分发掘申威众核处理器的并行特性,该方法分别对海冰模式数据分割方式,数据传输过程以及计算方式进行了改进和优化.该文利用该方法对海冰模式的两个算法进行了移植和并行化,并使用CICE测试数据集和COREv2数据集对该方法的性能进行测试.实验表明,并行优化后的两个算法相较其只在管理核心上运行分别可获得11.6倍和9.8倍的性能提升,且与基本并行化方法相比,该方法最高可获得40%的性能提升.

主 题 词:申威众核处理器 海冰模式 数据传输 数据分割 计算方式 

学科分类:0810[工学-土木类] 0808[工学-自动化类] 0839[0839] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 081202[081202] 

核心收录:

D O I:10.11897/SP.J.1016.2018.02221

馆 藏 号:203376439...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分