文献检索-宁波市创意产业特色资源库

双精度浮点矩阵乘协处理器研究: 收藏
分享
引用; 《计算机研究与发展》2019年第2期56卷 410-420页; 作者：贾迅邬贵明谢向辉吴东数学工程与先进计算国家重点实验室江苏无锡214125; 矩阵乘运算在多个应用领域特别是数值计算领域被广泛使用,但双精度浮点矩阵乘在CPU,GPGPU,FPGA等现有计算平台上的性能和效率受限,其往往成为大规模数值计算应用的性能瓶颈.针对该问题,以线性阵列计算结构为基础,研究了双精度浮点矩阵...; 矩阵乘运算在多个应用领域特别是数值计算领域被广泛使用,但双精度浮点矩阵乘在CPU,GPGPU,FPGA等现有计算平台上的性能和效率受限,其往往成为大规模数值计算应用的性能瓶颈.针对该问题,以线性阵列计算结构为基础,研究了双精度浮点矩阵乘的定制加速.首先,对线性阵列计算结构进行了双缓冲优化并设计了针对双缓冲的存储访问调度,以提高结构的计算效率.其次,提出了矩阵乘协处理器和加速计算系统的结构,构建了协处理器的性能模型并对其结构设计空间进行了探索.最后,验证了协处理器的功能正确性并在某主流工艺下评估了其硬件开销.实验结果表明,设计的双精度浮点矩阵乘协处理器可以达到3 TFLOPS的计算性能和99%的计算效率.与NVIDIA K40 GPGPU相比,协处理器执行双精度浮点矩阵乘的性能是K40的1.95倍,而面积开销仅为K40的21.05%.探索了定制加速结构设计在高性能计算中的应用,对现有计算系统的性能提升具有一定的参考价值.; 来源：详细信息评论

异构高性能计算系统Linpack效率受限因素分析: 收藏
分享
引用; 《计算机工程与科学》2018年第2期40卷 224-230页; 作者：贾迅邬贵明谢向辉数学工程与先进计算国家重点实验室江苏无锡214125; 能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构...; 能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构设计的角度,基于真实计算系统的设计参数和性能数据,分析了大规模异构高性能计算系统Linpack效率受限的主要因素及其对结构设计的需求,并构建了针对异构计算系统的Linpack性能模型对分析结论进行了验证。研究成果对异构计算系统Linpack的性能优化以及未来高效异构架构的设计具有一定的指导意义。; 来源：详细信息评论

二元域大型稀疏矩阵向量乘的FPGA设计与实现: 收藏
分享
引用; 《计算机工程与科学》2016年第8期38卷 1530-1535页; 作者：苏锦柱邬贵明贾迅数学工程与先进计算国家重点实验室江苏无锡214125; 作为Wiedemannn算法的核心部分,稀疏矩阵向量乘是求解二元域上大型稀疏线性方程组的主要步骤。提出了一种基于FPGA的二元域大型稀疏矩阵向量乘的环网硬件系统架构,为解决Wiedemannn算法重复计算稀疏矩阵向量乘,提出了新的并行计算结构...; 作为Wiedemannn算法的核心部分,稀疏矩阵向量乘是求解二元域上大型稀疏线性方程组的主要步骤。提出了一种基于FPGA的二元域大型稀疏矩阵向量乘的环网硬件系统架构,为解决Wiedemannn算法重复计算稀疏矩阵向量乘,提出了新的并行计算结构。实验分析表明,提出的架构提高了Wiedemannn算法中稀疏矩阵向量乘的并行性,同时充分利用了FPGA的片内存储器和吉比特收发器,与目前性能最好的部分可重构计算PR模型相比,实现了2.65倍的加速性能。; 来源：详细信息评论

矩阵乘协处理器上BLAS level-3运算的设计: 收藏
分享
引用; 《计算机工程与科学》2020年第11期42卷 1913-1921页; 作者：贾迅钱磊原昊张昆吴东数学工程与先进计算国家重点实验室江苏无锡214125; BLAS level-3运算的计算复杂度较高,其往往成为应用的性能瓶颈。采用线性阵列结构的矩阵乘协处理器可实现高性能、高效的矩阵乘运算。在矩阵乘协处理器上高效实现BLAS level-3运算,对大规模科学与工程仿真应用的计算加速至关重要。以矩...; BLAS level-3运算的计算复杂度较高,其往往成为应用的性能瓶颈。采用线性阵列结构的矩阵乘协处理器可实现高性能、高效的矩阵乘运算。在矩阵乘协处理器上高效实现BLAS level-3运算,对大规模科学与工程仿真应用的计算加速至关重要。以矩阵乘为核心运算,结合线性阵列的结构特点,提出了矩阵乘协处理器上BLAS level-3运算的设计,并构建了相应的性能分析模型。实验结果表明,矩阵乘协处理器上SYMM、SYRK和TRMM运算的计算效率分别达到了99%,98%和80%,与SW26010和NVIDIA V100 GPU上矩阵运算的计算效率相比,最高提升了31%。; 来源：详细信息评论

申威处理器硬件数据预取技术的实现: 收藏
分享
引用; 《计算机工程与科学》2015年第11期37卷 2013-2017页; 作者：贾迅胡向东尹飞上海高性能集成电路设计中心上海201204; 硬件数据预取技术可以有效提升处理器的访存性能,是申威处理器性能优化过程中亟需突破的一项技术。硬件开销和处理器架构的制约是硬件预取技术实现中的主要难点。借鉴学术界对硬件预取技术的研究成果和工业界的应用现状,紧密结合申威处...; 硬件数据预取技术可以有效提升处理器的访存性能,是申威处理器性能优化过程中亟需突破的一项技术。硬件开销和处理器架构的制约是硬件预取技术实现中的主要难点。借鉴学术界对硬件预取技术的研究成果和工业界的应用现状,紧密结合申威处理器的结构特点,研究了申威处理器硬件预取技术的实现方法。以流预取为例,在处理器核心面积增加0.97%的情况下,硬件预取技术的应用可以将目前申威处理器的整数性能平均提升5.17%,最高提升28.88%;浮点性能平均提升6.39%,最高提升30.11%。; 来源：详细信息评论

基于流访问特征的多级硬件预取: 收藏
分享
引用; 《计算机工程》2016年第1期42卷 51-55页; 作者：贾迅翁志强胡向东上海高性能集成电路设计中心上海201204; 硬件数据预取技术将处理器可能访问的数据提前装入Cache中,使得处理器访存时尽量命中Cache,提升系统性能。但现有研究和应用主要对一级Cache进行预取,预取的数据可能在使用前无法及时装入Cache,从而降低硬件预取对系统性能的提升效果。...; 硬件数据预取技术将处理器可能访问的数据提前装入Cache中,使得处理器访存时尽量命中Cache,提升系统性能。但现有研究和应用主要对一级Cache进行预取,预取的数据可能在使用前无法及时装入Cache,从而降低硬件预取对系统性能的提升效果。针对上述问题,以流访问特征的预取为基础,提出一种同时对多级Cache进行预取的方法,并对流访问特征的预取进行实现。基于SPEC CPU2000测试程序集的实验结果表明,与仅对一级Cache进行预取相比,对多级Cache同时进行预取可以将整数程序的性能平均提升2.11%,最高提升11.19%,浮点程序的性能平均提升3.08%,最高提升12.77%。; 来源：详细信息评论

大规模三角线性方程的高效求解: 收藏
分享
引用; 《计算机工程与科学》2019年第2期41卷 240-245页; 作者：贾迅邬贵明钱磊谢向辉吴东数学工程与先进计算国家重点实验室江苏无锡214125; 大规模三角线性方程求解是科学与工程应用中重要的计算核心,受限于处理器的缓存容量和结构设计,其在CPU和GPU等平台上的计算效率不高。大规模三角线性方程的分块求解中,矩阵乘是主要运算,其计算效率对提升三角线性方程求解的计算效率至...; 大规模三角线性方程求解是科学与工程应用中重要的计算核心,受限于处理器的缓存容量和结构设计,其在CPU和GPU等平台上的计算效率不高。大规模三角线性方程的分块求解中,矩阵乘是主要运算,其计算效率对提升三角线性方程求解的计算效率至关重要。以矩阵乘计算效率较高的矩阵乘协处理器为计算平台,针对其结构特点提出了矩阵乘协处理器上大规模三角线性方程分块求解的实现方法和性能分析模型。实验结果表明,矩阵乘协处理器上大规模三角线性方程求解的计算效率最高可达85.9%,其实际性能和资源利用率分别为同等工艺下GPU的2.42倍和10.72倍。; 来源：详细信息评论

高校课程思政建设的目标建构与实践路径探索: 收藏
分享
引用; 《大学（思政教研）》2021年第12期 104-106页; 作者：杨旭娇黄鼎贾迅无锡城市职业技术学院江苏无锡214153; 高校课程思政建设是新时代高校思想政治教育工作的重大创新。高校可通过树立立德树人的综合教育理念、培养青年学生的社会价值认同、提升青年学生的精神境界追求来构建课程思政育人的价值与多维度目标。在具体的教学实践中,教师要更新观...; 高校课程思政建设是新时代高校思想政治教育工作的重大创新。高校可通过树立立德树人的综合教育理念、培养青年学生的社会价值认同、提升青年学生的精神境界追求来构建课程思政育人的价值与多维度目标。在具体的教学实践中,教师要更新观念,拓宽视野,不断提高课程思政的教育教学水平;强化课程思政与思政课程在教学目标上的同向同行;优化课程思政的教学设计,提高课程思政内涵融入课堂教学水平。此外,还需要建立完善课程思政的课程评价体系和激励机制。; 来源：详细信息评论

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

限定检索结果

保存检索档案

请选择保存的检索档案：

收藏书架

请选择收藏分类：

检索条件订阅

申请转借

引用

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

限定检索结果

保存检索档案

请选择保存的检索档案： 新增检索档案 确定 取消

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

检索条件订阅

申请转借

引用

高级检索表达式检索

高级检索表达式检索

请选择保存的检索档案：

请选择收藏分类：