限定检索结果

检索条件"作者=翟季冬"
5 条 记 录,以下是1-10 订阅
视图:
排序:
基于CUPTI接口的典型GPU程序负载特征分析
收藏 引用
《计算机研究与发展》2016年 第6期53卷 1249-1262页
作者:郑祯 翟季冬 李焱 陈文光清华大学计算机科学与技术系北京100084 
基于图形处理器(graphics processing unit,GPU)加速设备的高性能计算机已经成为目前高性能计算领域的一个重要发展趋势.然而,在当前的GPU设备上开发高效的并行程序仍然是一件非常复杂的事情.针对这一问题,1)总结了影响GPU程序性能的5...
来源:详细信息评论
异步感知的异构高性能计算机性能预测方法
收藏 引用
《计算物理》2024年 第1期41卷 40-51页
作者:金煜阳 马子轩 翟季冬清华大学计算机科学与技术系北京100084 
针对异步策略设计难的问题,提出面向异构超级计算机的高效异步性能预测方法,解耦异步与同步执行的性能,通过层次化建模等技术实现快速精确的性能预测,指导异步策略设计与性能优化。在国产神威异构高性能计算机上,以高性能计算领域典型...
来源:详细信息评论
基于消息传递的科学应用通信模式特征分析
收藏 引用
《华中科技大学学报(自然科学版)》2005年 第Z1期33卷 39-41页
作者:翟季冬 盛田维 商海峰 陈文光清华大学计算机科学与技术系北京100084 
对Grapes,Mx3dg和TH-PaPSM三种应用程序的通信模式进行了分析.重点讨论了点对点消息的数量、大小和目的进程的分布情况,对并行应用程序中的消息局部性进行了量化研究.本研究对设计符合真实应用的测试程序、优化科学应用程序具有较好的...
来源:详细信息评论
面向新一代神威超级计算机的高效内存分配器
收藏 引用
《清华大学学报(自然科学版)》2022年 第5期62卷 943-951页
作者:王豪杰 马子轩 郑立言 王元炜 王飞 翟季冬清华大学计算机科学与技术系北京100084 
随着应用程序规模的增大,应用程序对计算资源的需求也日益增加,超级计算机为满足这一需求提供了良好的平台。传统的超级计算机主要面向科学计算程序,而近年来应用的多样化对超级计算机的软硬件设计提出了新要求。该文在新一代神威超级...
来源:详细信息评论
华为昇腾神经网络加速器性能评测与优化
收藏 引用
《计算机学报》2022年 第8期45卷 1618-1637页
作者:鲁蔚征 张峰 贺寅烜 陈跃国 翟季冬 杜小勇中国人民大学大型科学仪器共享平台北京100872 数据工程与知识工程教育部重点实验室(中国人民大学)北京100872 中国人民大学信息学院北京100872 清华大学计算机科学与技术系北京100084 
华为昇腾是一款新型神经网络加速器.与GPU相比,昇腾加速器专门面向神经网络计算,设计了专用计算单元,核心算力集中在低精度,基于昇腾的软件栈与GPU有所差异.现有研究大多专注于GPU上的深度学习负载性能分析和优化,由于昇腾平台推出不久...
来源:详细信息评论
聚类工具 回到顶部