看过本文的还看了

相关文献

该作者的其他文献

文献详情 >GCC非满载SLP向量化 收藏
GCC非满载SLP向量化

GCC非满载SLP向量化

作     者:刘浩浩 韩林 崔平非 LIU Hao-Hao;HAN Lin;CUI Ping-Fei

作者机构:中原工学院前沿信息技术研究院郑州450007 

出 版 物:《计算机系统应用》 (Computer Systems & Applications)

年 卷 期:2022年第31卷第9期

页      码:265-271页

摘      要:随着向量长度的不断增长, SIMD扩展部件得以处理更为庞大的数据级并行,但程序的并行阈值也随之提高.对于现有的自动向量化编译器,如果在分析阶段不能从串行代码中发掘出足够的数据级并行以完全填充向量寄存器,则不会进入相应的向量代码变换阶段,从而无法向量化.较长的向量长度使得某些并行性不足的程序失去了向量化的机会,造成了性能下降.为了更加充分的利用SIMD部件,介绍了一种面向基本块的非满载向量化方法ISLP.基于开源GCC编译器,从并行性检测、代码生成和代价模型3个方面详细阐述了ISLP的设计与实现.在标准测试集上的实验结果表明,该方法可以有效地对超字级并行性不足的程序进行向量化处理,提高程序执行效率.选取的测试用例在向量化后的平均加速比达到1.14,性能较常规SLP方法提升11.8%.

主 题 词:GCC SIMD扩展 非满载向量化 超字级并行性 代码生成 SLP 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

D O I:10.15888/j.cnki.csa.008686

馆 藏 号:203114382...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分