限定检索结果

检索条件"主题词=申威众核处理器"
7 条 记 录,以下是1-10 订阅
视图:
排序:
申威众核处理器访存与通信融合编译优化
收藏 引用
《软件学报》2024年 第6期35卷 2648-2667页
作者:方燕飞 李雁冰 董恩铭 王云飞 刘齐国家并行计算机工程技术研究中心北京100190 
申威片上多级存储层次是缓解“访存墙”的重要结构.完全由软件管理的SPM结构和片上RMA通信机制给应用性能提升带来很多机会,但也给应用程序开发优化与移植提出了很大挑战.为充分挖掘片上存储层次特点提升应用程序性能,同时减轻...
来源:详细信息评论
面向申威众核处理器的规则处理优化技术
收藏 引用
《计算机研究与发展》2024年 第1期61卷 66-85页
作者:张振东 王彤 刘鹏浙江大学信息与电子工程学院杭州310027 之江实验室智能超算研究中心杭州311100 数学工程与先进计算国家重点实验室江苏无锡214125 
高性能口令恢复系统是申威众核处理器的重要应用场景之一,规则处理是主流口令恢复工具中被广泛应用的一种口令生成方式.现有相关研究工作缺少对规则处理算法的优化,导致申威处理器上基于规则的口令生成速度成为口令恢复系统的性能瓶颈....
来源:详细信息评论
申威众核处理器上的三对角并行求解
收藏 引用
《计算机科学与探索》2019年 第10期13卷 1654-1663页
作者:刘侃 王欣亮 许平 薛巍清华大学计算机科学与技术系北京100086 国家超级计算无锡中心江苏无锡214100 
三对角方程求解是一种在很多科学与工程领域广泛应用的数值计算心。目前,CPU、GPU等主流硬件平台上都提出了高度优化的并行算法,但是对于中国自主研发的申威26010处理器,还没有一种算法能有效地利用其独特的硬件特性来达到最大...
来源:详细信息评论
基于申威众核处理器的海冰模式并行加速方法
收藏 引用
《计算机学报》2018年 第10期41卷 2221-2235页
作者:李镔洋 李波 钱德沛北京航空航天大学计算机学院北京100191 
海冰模式是地球模式的重要组成部分,其使用不同的网格和时间梯度来模拟海冰区域随时间的变化.海冰模式具有计算密集的特性,随着海冰模式计算精度的提升,传统的硬件已难以满足其计算需求.申威太湖之光超级计算机是第一台峰值性能超过100P...
来源:详细信息评论
基于申威众核处理器的NSGA-Ⅱ并行和优化方法
收藏 引用
《计算机应用研究》2020年 第1期37卷 96-101页
作者:刘垚 郑琳 郑凯 王肃 廖启丹华东师范大学数据科学与工程学院上海200062 数学工程与先进计算国家重点实验室江苏无锡214215 
申威众核处理器组成的"神威·太湖之光"是我国当前性能最高的超级计算机,可为大规模NSGA-Ⅱ求解提供硬件平台。基于硬件架构特点,设计了分岛/主从增强混合并行NSGA-Ⅱ。在主从模式基础上,利用从间寄存通信,实现...
来源:详细信息评论
基于HYB格式SpMV在新一代申威架构上的实现与优化
收藏 引用
《计算机工程与科学》2023年 第10期45卷 1754-1762页
作者:王鑫 彭健江南大学物联网工程学院江苏无锡214122 
稀疏矩阵与稠密向量乘SpMV在高性能计算领域有着广泛的应用。稀疏矩阵因其非零元素分布的稀疏性和不规则性,使得运算的并行化较稠密矩阵难度更大。因此,稀疏矩阵向量乘法的性能优化一直都是高性能计算领域中的研究重点。基于稀疏矩阵的...
来源:详细信息评论
稀疏矩阵向量乘法在申威架构上的性能优化
收藏 引用
《计算机学报》2020年 第6期43卷 1037-1051页
作者:李亿渊 薛巍 陈德训 王欣亮 许平 张武生 杨广文清华大学计算机科学与技术系北京100084 国家超级计算无锡中心江苏无锡214072 
计算机数值模拟是现代科学和技术发展的重要触发力量.在数值模拟中,求解大规模稀疏线性方程组是非常重要的一个环节.迭代求解过程中稀疏矩阵向量乘法是耗时最长的计算心之一,存在严重的数据局部性差、写冲突、负载不均衡等问题.因此,...
来源:详细信息评论
聚类工具 回到顶部