限定检索结果

检索条件"机构=中国科学院软件所并行软件与计算科学实验室"
24 条 记 录,以下是1-10 订阅
视图:
排序:
国产SW26010-Pro处理器上3级BLAS函数众核并行优化
收藏 引用
软件学报》2024年 第3期35卷 1569-1584页
作者:胡怡 陈道琨 杨超 马文静 刘芳芳 宋超博 孙强 史俊达中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院大学北京100049 北京大学数学科学学院北京100871 国家并行计算机工程技术研究中心北京100190 
BLAS(basic linear algebra subprograms)是最基本、最重要的底层数学库之一.在一个标准的BLAS库中,BLAS 3级函数涵盖的矩阵-矩阵运算尤为重要,在许多大规模科学与工程计算应用中被广泛调用.另外,BLAS 3级属于计算密集型函数,对充分发...
来源:详细信息评论
面向SW26010-Pro的1、2级BLAS函数众核并行优化技术
收藏 引用
软件学报》2023年 第9期34卷 4421-4436页
作者:胡怡 陈道琨 杨超 刘芳芳 马文静 尹万旺 袁欣辉 林蓉芬中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院大学北京100049 北京大学数学科学学院北京100871 国家并行计算机工程技术研究中心北京100190 
BLAS (basic linear algebra subprograms)是高性能扩展数学库的一个重要模块,广泛应用于科学与工程计算领域. BLAS 1级提供向量-向量运算, BLAS 2级提供矩阵-向量运算.针对国产SW26010-Pro众核处理器设计并实现了高性能BLAS 1、2级函数...
来源:详细信息评论
SW26010众核任务并行调度系统及其嵌套并行算法应用
收藏 引用
软件学报》2021年 第8期32卷 2352-2364页
作者:孙乔 黎雷生 赵海涛 赵慧 吴长茂中国科学院软件研究所并行软件与计算科学实验室北京100190 
任务并行并行程序设计的基础设计模式.但由于算法本身的复杂性及目标平台的特殊性,设计实现高效率的任务并行程序对程序员来说往往充满挑战.基于新兴的SW26010众核CPU,提出了支持任务嵌套并行模式的通用运行时框架***对任务并行程序...
来源:详细信息评论
复杂异构计算系统HPL的优化
收藏 引用
软件学报》2021年 第8期32卷 2307-2318页
作者:黎雷生 杨文浩 马文静 张娅 赵慧 赵海涛 李会元 孙家昶中国科学院软件研究所并行软件与计算科学实验室北京100190 计算机科学国家重点实验室(中国科学院软件研究所)北京100190 
当今世界的主流超级计算机越来越多地使用带有加速器的异构系统.随着加速器的浮点性能不断提高,超级计算机内计算节点的CPU、内存、总线、网络以及系统架构都要与之相适应.HPL(high performance Linpack)是高性能计算机评测的传统基准...
来源:详细信息评论
网络隐蔽信道关键技术研究综述
收藏 引用
软件学报》2019年 第8期30卷 2470-2490页
作者:李彦峰 丁丽萍 吴敬征 崔强 刘雪花 关贝 王永吉中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院大学北京100049 广州中国科学院软件应用技术研究所电子数据取证实验室广东广州511458 计算机科学国家重点实验室(中国科学院软件研究所)北京100190 中国科学院软件研究所智能软件研究中心北京100190 中国科学院软件研究所互联网软件技术实验室北京100190 中国科学院软件研究所协同创新中心北京100190 
网络隐蔽信道是在网络环境下违反通信限制规则进行隐蔽信息传输的信息通道,为网络信息安全带来了新的挑战,也为数据传输的安全性和隐私性带来了新的研究方向.首先介绍了网络隐蔽信道的定义、分类、能力维度等基本概念;进而从码元设计、...
来源:详细信息评论
融合宫颈细胞领域特征的多流卷积神经网络分类算法
收藏 引用
计算机辅助设计与图形学学报》2019年 第4期31卷 531-540页
作者:杨志明 李亚伟 杨冰 庞文博 田泽宁 王泳中国科学院软件研究所并行软件与计算科学实验室北京100080 中国科学院大学北京100049 深思考人工智能机器人科技(北京)有限公司北京100085 
细胞分类是宫颈癌计算机辅助诊断研究和应用的关键技术.针对通用深度学习分类算法在细胞分类中缺少领域知识指导这一局限性,提出一种基于数据驱动和宫颈细胞领域知识的多流卷积神经网络分类算法.文中算法以细胞和细胞核图像为输入,通过...
来源:详细信息评论
申威26010众核处理器上一维FFT实现与优化
收藏 引用
软件学报》2020年 第10期31卷 3184-3196页
作者:赵玉文 敖玉龙 杨超 刘芳芳 尹万旺 林蓉芬中国科学院软件研究所并行软件与计算科学实验室北京100190 北京大学数学科学学院北京100871 计算机科学国家重点实验室(中国科学院软件研究所)北京100190 中国科学院大学北京100049 国家并行计算机工程技术研究中心北京100190 
根据申威26010众核处理器的特点提出了基于两层分解的一维FFT众核并行算法.该算法基于迭代的Stockham FFT计算框架和Cooley-Tukey FFT算法,将大规模FFT分解成一系列的小规模FFT来计算,并通过设计合理的任务划分方式、寄存器通信、双缓...
来源:详细信息评论
面向国产申威26010众核处理器的SpMV实现与优化
收藏 引用
软件学报》2018年 第12期29卷 3921-3932页
作者:刘芳芳 杨超 袁欣辉 吴长茂 敖玉龙中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院大学北京100049 计算机科学国家重点实验室(中国科学院软件研究所)北京100190 北京大学数学科学学院北京100871 国家并行计算机工程技术研究中心北京100190 
世界首台峰值性能超过100P的超级计算机——神威太湖之光已经研制完成,该超级计算机采用了国产申威异构众核处理器,该处理器不同于现有的纯CPU,CPU-MIC,CPU-GPU架构,采用了主-从核架构,单处理器峰值计算能力为3TFlops/s,访存带宽为130GB...
来源:详细信息评论
面向新一代神威超级计算机平台的大气动力学问题全隐式求解器研究
收藏 引用
《数值计算计算机应用》2023年 第2期44卷 198-213页
作者:陈道琨 刘芳芳 杨超中国科学院大学北京100049 中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院软件研究所计算机科学国家重点实验室北京100190 北京大学数学科学学院北京100871 
大气动力学问题的数值模拟在气象预报等领域具有广泛的应用.相关数值模拟依赖超级计算机平台实现高精度高分辨率的气象预报,隐式求解不受稳定性条件限制,相比显式求解更有优势.面向新的超级计算机架构特征研究隐式大气动力学问题中一系...
来源:详细信息评论
基于MPI和CUDA的蛋白质定量软件的设计和分析
收藏 引用
计算科学2013年 第3期40卷 36-37,54页
作者:詹科 王靖 袁良 张云泉中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院研究生院北京100049 
介绍了蛋白质定量软件的设计及测试结果,分析结果表明:P-QuantWiz软件在曙光6000的Intel集群部分,测试规模达到2048核,在256核加速比仍在增加。相对P-QuantWiz软件在单CPU运行的结果,PG-QuantWiz软件在单GPU运行的加速比为8.1,在16个GP...
来源:详细信息评论
聚类工具 回到顶部