限定检索结果

检索条件"作者=贾迅"
8 条 记 录,以下是1-10 订阅
视图:
排序:
双精度浮点矩阵乘协处理器研究
收藏 引用
《计算机研究与发展》2019年 第2期56卷 410-420页
作者:贾迅 邬贵明 谢向辉 吴东数学工程与先进计算国家重点实验室江苏无锡214125 
矩阵乘运算在多个应用领域特别是数值计算领域被广泛使用,但双精度浮点矩阵乘在CPU,GPGPU,FPGA等现有计算平台上的性能和效率受限,其往往成为大规模数值计算应用的性能瓶颈.针对该问题,以线性阵列计算结构为基础,研究了双精度浮点矩阵...
来源:详细信息评论
异构高性能计算系统Linpack效率受限因素分析
收藏 引用
《计算机工程与科学》2018年 第2期40卷 224-230页
作者:贾迅 邬贵明 谢向辉数学工程与先进计算国家重点实验室江苏无锡214125 
能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构...
来源:详细信息评论
二元域大型稀疏矩阵向量乘的FPGA设计与实现
收藏 引用
《计算机工程与科学》2016年 第8期38卷 1530-1535页
作者:苏锦柱 邬贵明 贾迅数学工程与先进计算国家重点实验室江苏无锡214125 
作为Wiedemannn算法的核心部分,稀疏矩阵向量乘是求解二元域上大型稀疏线性方程组的主要步骤。提出了一种基于FPGA的二元域大型稀疏矩阵向量乘的环网硬件系统架构,为解决Wiedemannn算法重复计算稀疏矩阵向量乘,提出了新的并行计算结构...
来源:详细信息评论
矩阵乘协处理器上BLAS level-3运算的设计
收藏 引用
《计算机工程与科学》2020年 第11期42卷 1913-1921页
作者:贾迅 钱磊 原昊 张昆 吴东数学工程与先进计算国家重点实验室江苏无锡214125 
BLAS level-3运算的计算复杂度较高,其往往成为应用的性能瓶颈。采用线性阵列结构的矩阵乘协处理器可实现高性能、高效的矩阵乘运算。在矩阵乘协处理器上高效实现BLAS level-3运算,对大规模科学与工程仿真应用的计算加速至关重要。以矩...
来源:详细信息评论
申威处理器硬件数据预取技术的实现
收藏 引用
《计算机工程与科学》2015年 第11期37卷 2013-2017页
作者:贾迅 胡向东 尹飞上海高性能集成电路设计中心上海201204 
硬件数据预取技术可以有效提升处理器的访存性能,是申威处理器性能优化过程中亟需突破的一项技术。硬件开销和处理器架构的制约是硬件预取技术实现中的主要难点。借鉴学术界对硬件预取技术的研究成果和工业界的应用现状,紧密结合申威处...
来源:详细信息评论
基于流访问特征的多级硬件预取
收藏 引用
《计算机工程》2016年 第1期42卷 51-55页
作者:贾迅 翁志强 胡向东上海高性能集成电路设计中心上海201204 
硬件数据预取技术将处理器可能访问的数据提前装入Cache中,使得处理器访存时尽量命中Cache,提升系统性能。但现有研究和应用主要对一级Cache进行预取,预取的数据可能在使用前无法及时装入Cache,从而降低硬件预取对系统性能的提升效果。...
来源:详细信息评论
大规模三角线性方程的高效求解
收藏 引用
《计算机工程与科学》2019年 第2期41卷 240-245页
作者:贾迅 邬贵明 钱磊 谢向辉 吴东数学工程与先进计算国家重点实验室江苏无锡214125 
大规模三角线性方程求解是科学与工程应用中重要的计算核心,受限于处理器的缓存容量和结构设计,其在CPU和GPU等平台上的计算效率不高。大规模三角线性方程的分块求解中,矩阵乘是主要运算,其计算效率对提升三角线性方程求解的计算效率至...
来源:详细信息评论
高校课程思政建设的目标建构与实践路径探索
收藏 引用
《大学(思政教研)》2021年 第12期 104-106页
作者:杨旭娇 黄鼎 贾迅无锡城市职业技术学院江苏无锡214153 
高校课程思政建设是新时代高校思想政治教育工作的重大创新。高校可通过树立立德树人的综合教育理念、培养青年学生的社会价值认同、提升青年学生的精神境界追求来构建课程思政育人的价值与多维度目标。在具体的教学实践中,教师要更新观...
来源:详细信息评论
聚类工具 回到顶部