看过本文的还看了

相关文献

该作者的其他文献

文献详情 >申威众核处理器上的三对角并行求解器 收藏
申威众核处理器上的三对角并行求解器

申威众核处理器上的三对角并行求解器

作     者:刘侃 王欣亮 许平 薛巍 LIU Kan;WANG Xinliang;XU Ping;XUE Wei

作者机构:清华大学计算机科学与技术系北京100086 国家超级计算无锡中心江苏无锡214100 

基  金:国家重点研发计划 国家自然科学基金~~ 

出 版 物:《计算机科学与探索》 (Journal of Frontiers of Computer Science and Technology)

年 卷 期:2019年第13卷第10期

页      码:1654-1663页

摘      要:三对角方程求解器是一种在很多科学与工程领域广泛应用的数值计算核心。目前,CPU、GPU等主流硬件平台上都提出了高度优化的并行算法,但是对于中国自主研发的申威26010众核处理器,还没有一种算法能有效地利用其独特的硬件特性来达到最大化的性能。提出了一种分布式CR算法swDCR,来求解大量的、规模不大的三对角方程。该算法对每个三对角方程使用多个从核并行求解,通过联合多个从核的缓存使得运算过程中所有中间变量都能存储在缓存中,同时利用寄存器通信完成核间数据的高速传输。通过设计线程级数据划分机制,使得向量化的优化效果最大化。swDCR的吞吐率相比主核上的追赶法达到了单精度43.9倍和双精度36.7倍的加速,相比从核上的追赶法达到了单精度和双精度均2.07倍的加速。该算法在申威26010处理器单个核组上可以获得24GB/s的有效带宽。

主 题 词:三对角 申威众核处理器 循环消去(CR)算法 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

核心收录:

D O I:10.3778/j.issn.1673-9418.1811030

馆 藏 号:203787176...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分