限定检索结果

检索条件"作者=雷元武"
11 条 记 录,以下是1-10 订阅
视图:
排序:
基于FPGA的高精度科学计算加速器研究
收藏 引用
《计算机学报》2012年 第1期35卷 112-122页
作者:雷元武 窦勇 郭松国防科学技术大学计算机学院长沙410073 
探索了FPGA平台加速高精度科学计算应用的能力和灵活性.首先,研究科学计算中最常用的操作——向量内积,提出基于定点操作的精确向量内积算法.以IEEE 754-2008标准的四精度(Quadruple Precision)浮点算术为例,在FPGA平台上设计了一个基...
来源:详细信息评论
可选主元LU分解流水线算法设计与FPGA实现
收藏 引用
《高技术通讯》2009年 第5期19卷 511-518页
作者:牛新 周杰 窦勇 雷元武国防科技大学计算机学院长沙410073 
提出了一种可以进行列主元选取的细粒度LU分解流水线算法并在现场编程门阵列(FPGA)上得到了实现。该算法可以在进行列主元选取的同时,充分利用数据的重用性,以减少数据读写次数。对其中的关键运算实现了细粒度全流水,提高了分解性能。与...
来源:详细信息评论
DSP芯片中的高能效FFT加速器
收藏 引用
《计算机研究与发展》2016年 第7期53卷 1438-1446页
作者:雷元武 陈小文 彭元喜国防科学技术大学计算机学院长沙410073 
快速傅里叶变换(fast Fourier transform,FFT)是数字信号处理(digital signal processing,DSP)领域中最耗时的核心算法,该算法的计算性能和计算效率将影响整个应用的执行效率.因此,在DSP芯片上设计实现了一个基于矩阵转置操作的高能效...
来源:详细信息评论
定制VLIW结构实现四精度浮点基本函数
收藏 引用
《电子学报》2012年 第9期40卷 1715-1722页
作者:雷元武 窦勇 倪时策 周杰国防科学技术大学计算机学院湖南长沙410073 
本文针对科学应用中基本函数种类多、实现复杂、使用频率低的特点,提出一种定制VLIW结构四精度浮点基本函数协处理器(QPC-Processor).该结构通过显示并行技术挖掘基本函数实现算法的并行性,在同一硬件平台上通过元操作的不同组合来计算...
来源:详细信息评论
支持多种传输模式的双通路串行RapidIO设计与实现
收藏 引用
《计算机工程与科学》2019年 第2期41卷 233-239页
作者:郭欣童 雷元武 郭阳国防科技大学计算机学院湖南长沙410073 
传统的串行RapidIO2.1接口支持3种通道模式(1×、2×、4×)。在2×或1×模式下,4条物理链路只有2条或1条在进行数据传输,其余链路被闲置,造成带宽浪费;另外,一个RapidIO接口只能与一个目的端互连。基于传统的串行Ra...
来源:详细信息评论
基于高精度乘累加的LU分解加速器的设计
收藏 引用
《计算机工程与科学》2009年 第11期31卷 33-36页
作者:雷元武 窦勇 郭松 李鑫 雷国庆国防科技大学计算机学院湖南长沙410073 
本文首先分析LU分解中舍入误差的积累过程,建立精度损失与矩阵规模的关系模型来预测大规模LU分解的精度;然后,根据定点加法的简单、快速、无精度损失的特点,设计高精度乘累加器(HPMAcc),并基于此实现一个细粒度并行LU分解加速器。实验...
来源:详细信息评论
基于FPGA的细粒度并行K-means算法加速器的设计与实现
收藏 引用
《计算机工程与科学》2009年 第A1期31卷 64-67页
作者:倪时策 窦勇 雷元武 赵建勋国防科技大学计算机学院湖南长沙410073 装甲兵工程学院北京100072 
本文在深入分析K-means算法计算特征的基础上,基于FPGA平台提出并实现了一种细粒度的并行浮点K-means算法。设计采用了阵列多PE并行处理的任务划分策略,实现了处理单元间的负载平衡,采用数据驱动的流水线隐藏片外存储访问,设计了一种基...
来源:详细信息评论
一种基于SRT-8算法的SIMD浮点除法器的设计与实现
收藏 引用
《计算机工程与科学》2014年 第5期36卷 797-803页
作者:邓子椰 陈书明 彭元喜 雷元武国防科学技术大学计算机学院湖南长沙410073 
在科学计算、数字信号处理、通信和图像处理等应用中,除法运算是常用的基本操作之一。基于SRT-8除法算法,设计一个SIMD结构的IEEE-754标准浮点除法器,在同一硬件平台上能够实现双精度浮点除法和两个并行的单精度浮点除法。通过优化SRT-...
来源:详细信息评论
基于Goldschmidt算法的高性能双精度浮点除法器设计
收藏 引用
《计算机应用》2015年 第7期35卷 1854-1857,1887页
作者:何婷婷 彭元喜 雷元武国防科学技术大学计算机学院长沙410073 
针对双精度浮点除法通常运算过程复杂、延时较大这一问题,提出一种基于Goldschmidt算法设计支持IEEE-754标准的高性能双精度浮点除法器方法。首先,分析Goldschmidt算法运算除法的过程以及迭代运算产生的误差;然后,提出了控制误差的方法...
来源:详细信息评论
一种自主设计的面向E级高性能计算的异构融合加速器
收藏 引用
《计算机研究与发展》2021年 第6期58卷 1234-1237页
作者:刘胜 卢凯 郭阳 刘仲 陈海燕 雷元武 孙海燕 杨乾明 陈小文 陈胜刚 刘必慰 鲁建壮国防科技大学计算机学院长沙410073 
高性能计算(high performance computing,HPC)是推动科学技术发展的基础性领域之一,当前,作为超级计算机系统“下一个明珠”的E级高性能计算时代已经来临.面向E级高性能计算的加速器领域成为了全球高端芯片的竞技场.国际上,AMD、英伟达...
来源:详细信息评论
聚类工具 回到顶部