看过本文的还看了

相关文献

该作者的其他文献

文献详情 >申威26010众核处理器上一维FFT实现与优化 收藏
申威26010众核处理器上一维FFT实现与优化

申威26010众核处理器上一维FFT实现与优化

作     者:赵玉文 敖玉龙 杨超 刘芳芳 尹万旺 林蓉芬 ZHAO Yu-Wen;AO Yu-Long;YANG Chao;LIU Fang-Fang;YIN Wan-Wang;LIN Rong-Fen

作者机构:中国科学院软件研究所并行软件与计算科学实验室北京100190 北京大学数学科学学院北京100871 计算机科学国家重点实验室(中国科学院软件研究所)北京100190 中国科学院大学北京100049 国家并行计算机工程技术研究中心北京100190 

基  金:国家重点研发计划(2016YFB0200603) 北京市自然科学基金(JQ18001) 

出 版 物:《软件学报》 (Journal of Software)

年 卷 期:2020年第31卷第10期

页      码:3184-3196页

摘      要:根据申威26010众核处理器的特点提出了基于两层分解的一维FFT众核并行算法.该算法基于迭代的Stockham FFT计算框架和Cooley-Tukey FFT算法,将大规模FFT分解成一系列的小规模FFT来计算,并通过设计合理的任务划分方式、寄存器通信、双缓冲以及SIMD向量化等与计算平台相关的优化方法来提高FFT的计算性能.最后对所提出算法的性能进行了测试,相比于单主核上运行的FFTW3.3.4库,获得了平均44.53x的加速比,最高加速比可达56.33x,且其带宽利用率最高可达83.45%.

主 题 词:申威26010处理器 一维FFT 两层分解 Cooley-Tukey 众核并行 

学科分类:08[工学] 081202[081202] 0812[工学-测绘类] 

核心收录:

D O I:10.13328/j.cnki.jos.005848

馆 藏 号:203984676...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分