限定检索结果

检索条件"主题词=集合通信"
7 条 记 录,以下是1-10 订阅
视图:
排序:
MPI集合通信性能可扩展性研究与分析
收藏 引用
《计算机科学与探索》2017年 第2期11卷 252-261页
作者:罗红兵 张晓霞北京应用物理与计算数学研究所高性能计算中心北京100094 
集合通信性能是影响并行程序并行效率的重要因素之一,但对于大规模并行计算机上不同类别集合通信的评测和理论分析仍较为缺乏,许多应用程序的通信模块设计和使用不合理。基于某国产并行机平台,利用IMB测试程序,对各典型MPI(message pass...
来源:详细信息评论
Alltoall通信性能模型研究
收藏 引用
《计算机科学与探索》2018年 第4期12卷 559-566页
作者:罗红兵 张晓霞 魏勇北京应用物理与计算数学研究所高性能计算中心北京100094 
Alltoall是一种重要的MPI(message passing interface)集合通信类别,是影响许多并行程序并行效率的重要因素。但对于大规模并行计算机上Alltoall集合通信的评测和理论分析仍较为缺乏,导致许多应用程序的通信模块设计和使用不合理。首先...
来源:详细信息评论
高性能互联网络交换机研究与设计
收藏 引用
《计算机研究与发展》2008年 第12期45卷 2069-2078页
作者:王达伟 曹政 刘新春 游定山 孙凝晖中国科学院计算技术研究所北京100190 中国科学院计算机系统结构重点实验室北京100190 中国科学院研究生院北京100049 
高性能互联网络交换机是高性能计算机系统的核心部件.科学计算作为高性能计算机的上层应用,不仅要求交换机具有低延迟、高带宽的特性,还要求其在集合通信如广播、多播和同步操作等进行硬件级支持.HyperLink交换机,作为曙光5000计算机系...
来源:详细信息评论
一个轻量级分布式机器学习系统的设计与实现
收藏 引用
《计算机工程》2020年 第1期46卷 201-207页
作者:宋匡时 李翀 张士波中国科学院计算机网络信息中心北京100190 中国科学院大学计算机科学与技术学院北京100190 
为满足大规模机器学习系统高定制化、低耦合与低资源消耗的需求,设计并实现一个轻量级分布式机器学习系统。采用模块化分层设计并移植多种主流的机器学习与深度学习算法,同时提出参数服务器与动态Ring-AllReduce 2种可扩展梯度同步方案...
来源:详细信息评论
国产百万亿次机群系统Alltoall性能测试与分析
收藏 引用
《计算机科学》2010年 第8期37卷 186-188,207页
作者:饶立 张云泉 李玉成中国科学院软件研究所并行计算实验室北京100190 中国科学院软件研究所计算机科学国家重点实验室北京100190 
随着高性能计算机的应用和发展,并行应用程序所使用的处理器数越来越多,进程间的通信量也不断增多,这对应用程序的性能有很大影响。在采用一种快速傅里叶变换HFFT对曙光5000A进行性能测试时发现,MPI集合通信函数MPI Alltoall的巨大通信...
来源:详细信息评论
MPI_ALLTOALL实现算法的改进与性能分析
收藏 引用
《计算机工程与设计》2010年 第23期31卷 4947-4949页
作者:韩颖 杨雷 王佳辽宁师范大学计算机与信息技术学院辽宁大连116081 
通过分析全互换通信中4种算法的性能,提出了一种改进算法。该改进算法递归倍增的创建子进程,通过增加通信进程数目来减少通信次数。对比分析改进算法与成对互换算法的通信次数,改进算法的通信次数是成对互换算法的一半。实验机群是在版...
来源:详细信息评论
GRAPES_CUACE大气化学耦合模式并行优化
收藏 引用
《计算机科学》2019年 第S11期46卷 528-534页
作者:叶跃进 陈德训 胡江凯 马欣 张小曳江南计算技术研究所江苏无锡214083 中国气象局数值预报中心北京100081 中国气象科学研究院北京100081 
文中主要介绍了数值天气预报模式GRAPES_MESO(4.0版本)与大气化学模式CUACE在线耦合形成的GRAPES_CUACE大气化学耦合模型在不同版本的x86体系结构下的并行优化算法的研究与分析。借鉴目前国内外主流的并行优化设计方法,结合GRAPES_MESO...
来源:详细信息评论
聚类工具 回到顶部