限定检索结果

检索条件"主题词=稀疏矩阵向量乘"
12 条 记 录,以下是1-10 订阅
视图:
排序:
稀疏矩阵向量乘的自动调优
收藏 引用
《计算物理》2024年 第1期41卷 33-39页
作者:杜臻 谭光明中国科学院大学计算机科学与技术学院北京101408 中国科学院计算技术研究所北京100190 
分析稀疏矩阵向量乘(SpMV)程序优化的难点,介绍两个自动调优的代表性工作:基于预实现模板的SMAT和从头设计程序的AlphaSparse。详细介绍了它们的设计思路、实现细节、测试结果以及各自的优缺点。最后,对SpMV自动调优的发展趋势进行了分...
来源:详细信息评论
基于深度学习的稀疏矩阵向量乘运算性能预测模型
收藏 引用
《计算机工程》2022年 第2期48卷 86-91页
作者:曹中潇 冯仰德 王珏 闵维潇 姚铁锤 高岳 王丽华 高付海中国科学院计算机网络信息中心北京100190 中国科学院大学北京100049 北京航空航天大学软件学院北京100191 中国原子能科学研究院北京102413 
稀疏矩阵向量乘(SpMV)是求解稀疏线性方程组的计算核心,被广泛应用在经济学模型、信号处理等科学计算和工程应用中,对于SpMV及其调优技术的研究有助于提升解决相关领域问题的运算效率。传统SpMV自动调优方法基于硬件平台的体系结构参数...
来源:详细信息评论
稀疏矩阵向量乘的FPGA设计与实现
收藏 引用
《计算机工程》2011年 第23期37卷 214-216页
作者:宋庆增 顾军华河北工业大学电气工程学院天津300401 河北工业大学计算机科学与软件学院天津300401 
针对传统的通用处理器(GPP)平台上执行稀疏矩阵向量乘计算效率低的问题,提出一种基于可重构计算平台的SpMXV协处理器设计。方案采用二叉树结构高度流水的数据流、IEEE-754的32 bit浮点数数据格式和对角存储格式。数据通路以流水线方式...
来源:详细信息评论
基于FPGA的稀疏矩阵向量乘的设计研究
收藏 引用
《计算机应用研究》2014年 第6期31卷 1756-1759页
作者:张禾 陈客松西南石油大学电气信息学院成都610500 电子科技大学电子工程学院成都610005 
作为典型的不规则算法,稀疏矩阵向量乘的计算过程具有非常低的访存局部性和计算访存比,因此在基于cache的通用处理器上计算效率很低。提出了一种面向可重构计算平台的基于IEEE-754浮点数据格式标准的稀疏矩阵向量乘算法加速器的设计。...
来源:详细信息评论
二元域大型稀疏矩阵向量乘的FPGA设计与实现
收藏 引用
《计算机工程与科学》2016年 第8期38卷 1530-1535页
作者:苏锦柱 邬贵明 贾迅数学工程与先进计算国家重点实验室江苏无锡214125 
作为Wiedemannn算法的核心部分,稀疏矩阵向量乘是求解二元域上大型稀疏线性方程组的主要步骤。提出了一种基于FPGA的二元域大型稀疏矩阵向量乘的环网硬件系统架构,为解决Wiedemannn算法重复计算稀疏矩阵向量乘,提出了新的并行计算结构...
来源:详细信息评论
基于CUDA编程模型的稀疏对角矩阵向量优化
收藏 引用
《计算机工程与科学》2012年 第7期34卷 78-83页
作者:秦晋 龚春叶 胡庆丰 刘杰国防科学技术大学计算机学院湖南长沙410073 
稀疏矩阵向量乘是很多科学计算问题中的核心问题。本文针对稀疏对角矩阵,在DIA存储格式的基础上,设计了一种新型压缩存储格式CDIA,结合CUDA编程模型的特点,在计算线程上进行了细粒度的任务分配,同时为满足CUDA对存储器的合并访问要求,...
来源:详细信息评论
大规模稀疏矩阵的主特征向量计算优化方法
收藏 引用
《计算机科学与探索》2012年 第2期6卷 118-124页
作者:王伟 陈建平 曾国荪 俞莉花 谭一鸣同济大学计算机科学与技术系上海200092 国家高性能计算机工程技术中心同济分中心上海200092 同济大学嵌入式系统与服务计算教育部重点实验室上海200092 
矩阵主特征向量(principal eigenvectors computing,PEC)的求解是科学与工程计算中的一个重要问题。随着图形处理单元通用计算(general-purpose computing on graphics pro cessing unit,GPGPU)的兴起,利用GPU来优化大规模稀疏矩阵的图...
来源:详细信息评论
面向国产申威26010众核处理器的SpMV实现与优化
收藏 引用
《软件学报》2018年 第12期29卷 3921-3932页
作者:刘芳芳 杨超 袁欣辉 吴长茂 敖玉龙中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院大学北京100049 计算机科学国家重点实验室(中国科学院软件研究所)北京100190 北京大学数学科学学院北京100871 国家并行计算机工程技术研究中心北京100190 
世界首台峰值性能超过100P的超级计算机——神威太湖之光已经研制完成,该超级计算机采用了国产申威异构众核处理器,该处理器不同于现有的纯CPU,CPU-MIC,CPU-GPU架构,采用了主-从核架构,单处理器峰值计算能力为3TFlops/s,访存带宽为130GB...
来源:详细信息评论
基于GPU的稀疏矩阵存储格式优化研究
收藏 引用
《计算机工程》2019年 第9期45卷 23-31,39页
作者:杨世伟 蒋国平 宋玉蓉 涂潇南京邮电大学计算机学院南京210023 南京邮电大学自动化学院南京210023 
稀疏矩阵存储格式中的稀疏矩阵向量乘(SpMV)计算效率低下,且分块行列(BRC)存储格式的计算结果缺少再现性和确定性。为此,提出一种改进的BRCP存储格式。采用不同的二维分块策略,根据矩阵各行非零元素分布的统计特性自适应调节分块参数,提...
来源:详细信息评论
系统中浮点累加PE的设计与实现
收藏 引用
《计算机工程与应用》2006年 第35期42卷 107-109页
作者:金席 高小鹏 龙翔北京航空航天大学计算机学院北京100083 
稀疏矩阵向量乘(Sparse Matrix-Vector Multiply,SMVM),形如Ab=x,在科学计算、信息检索、数据挖掘等领域中都是重要的计算核心之一。稀疏矩阵中非零元素的稀疏性,使得在微处理器上实现该类运算时,存在Cache缺失率高等问题,导致性能并不...
来源:详细信息评论
聚类工具 回到顶部