限定检索结果

检索条件"作者=陈道琨"
3 条 记 录,以下是1-10 订阅
视图:
排序:
国产SW26010-Pro处理器上3级BLAS函数众核并行优化
收藏 引用
《软件学报》2024年 第3期35卷 1569-1584页
作者:胡怡 陈道琨 杨超 马文静 刘芳芳 宋超博 孙强 史俊达中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院大学北京100049 北京大学数学科学学院北京100871 国家并行计算机工程技术研究中心北京100190 
BLAS(basic linear algebra subprograms)是最基本、最重要的底层数学库之一.在一个标准的BLAS库中,BLAS 3级函数涵盖的矩阵-矩阵运算尤为重要,在许多大规模科学与工程计算应用中被广泛调用.另外,BLAS 3级属于计算密集型函数,对充分发...
来源:详细信息评论
面向SW26010-Pro的1、2级BLAS函数众核并行优化技术
收藏 引用
《软件学报》2023年 第9期34卷 4421-4436页
作者:胡怡 陈道琨 杨超 刘芳芳 马文静 尹万旺 袁欣辉 林蓉芬中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院大学北京100049 北京大学数学科学学院北京100871 国家并行计算机工程技术研究中心北京100190 
BLAS (basic linear algebra subprograms)是高性能扩展数学库的一个重要模块,广泛应用于科学与工程计算领域. BLAS 1级提供向量-向量运算, BLAS 2级提供矩阵-向量运算.针对国产SW26010-Pro众核处理器设计并实现了高性能BLAS 1、2级函数...
来源:详细信息评论
面向新一代神威超级计算机平台的大气动力学问题全隐式求解器研究
收藏 引用
《数值计算与计算机应用》2023年 第2期44卷 198-213页
作者:陈道琨 刘芳芳 杨超中国科学院大学北京100049 中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院软件研究所计算机科学国家重点实验室北京100190 北京大学数学科学学院北京100871 
大气动力学问题的数值模拟在气象预报等领域具有广泛的应用.相关数值模拟依赖超级计算机平台实现高精度高分辨率的气象预报,隐式求解不受稳定性条件限制,相比显式求解更有优势.面向新的超级计算机架构特征研究隐式大气动力学问题中一系...
来源:详细信息评论
聚类工具 回到顶部