看过本文的还看了

相关文献

该作者的其他文献

文献详情 >高性能计算节点中的同步操作加速引擎设计 收藏
高性能计算节点中的同步操作加速引擎设计

高性能计算节点中的同步操作加速引擎设计

作     者:陈飞 曹政 王凯 胡农达 安学军 CHEN Fei;CAO Zheng;WANG Kai;HU Nong-da;AN Xue-jun

作者机构:中国科学院计算技术研究所北京海淀区100190 

基  金:国家863计划(2009AA01A129) 国家自然科学基金(61100014) 

出 版 物:《电子科技大学学报》 (Journal of University of Electronic Science and Technology of China)

年 卷 期:2012年第41卷第1期

页      码:92-97页

摘      要:随着GPU等加速部件在超级计算领域的广泛应用,超级计算机单个节点的硬件并行度比单核时代高几倍甚至几十倍。在该环境下,并行应用于单个芯片、计算节点内和计算节点间的通信密度较单核时代急剧增加,通信瓶颈问题愈发突出。为应对高并行度带来的通信瓶颈问题,提出一种同步引擎的硬件设计,该同步引擎可有效地支持和加速计算节点内多任务间频繁小数据量传输(细粒度同步)以及计算节点内和节点间的Barrier、All-reduce集合操作,进而加速并行应用的性能。测试结果表明,在16进程规模下的集合操作测试中,同步引擎相比传统的软件实现有约4倍的加速,在三角矩阵分解(LU分解)测试程序中可以获得约20%的性能提升。

主 题 词:集合操作 通信系统 计算节点 细粒度同步 高性能计算机 混合编程 消息传递 

学科分类:0808[工学-自动化类] 0809[工学-计算机类] 08[工学] 081201[081201] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1001-0548.2012.01.018

馆 藏 号:203832671...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分