-
题名GCC非满载SLP向量化
- 1
-
-
作者
刘浩浩
韩林
崔平非
-
机构
中原工学院前沿信息技术研究院
-
出处
《计算机系统应用》
2022年第9期265-271,共7页
-
文摘
随着向量长度的不断增长, SIMD扩展部件得以处理更为庞大的数据级并行,但程序的并行阈值也随之提高.对于现有的自动向量化编译器,如果在分析阶段不能从串行代码中发掘出足够的数据级并行以完全填充向量寄存器,则不会进入相应的向量代码变换阶段,从而无法向量化.较长的向量长度使得某些并行性不足的程序失去了向量化的机会,造成了性能下降.为了更加充分的利用SIMD部件,介绍了一种面向基本块的非满载向量化方法ISLP.基于开源GCC编译器,从并行性检测、代码生成和代价模型3个方面详细阐述了ISLP的设计与实现.在标准测试集上的实验结果表明,该方法可以有效地对超字级并行性不足的程序进行向量化处理,提高程序执行效率.选取的测试用例在向量化后的平均加速比达到1.14,性能较常规SLP方法提升11.8%.
-
关键词
GCC
SIMD扩展
非满载向量化
超字级并行性
代码生成
SLP
-
Keywords
GNU compiler collection(GCC)
SIMD extension
insufficient vectorization
superword level parallelism
code generation
SLP
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于全局数据重组的循环倾斜优化
- 2
-
-
作者
陈华军
王琦
洪超
方萌
-
机构
南方电网科学研究院有限责任公司
电力行业信息安全等级保护测评中心第五实验室
数学工程与先进计算国家重点实验室
-
出处
《计算机与现代化》
2017年第6期45-49,共5页
-
文摘
循环倾斜是程序优化中一种循环变换的手段,它改变空间迭代形式,将循环存在的跨迭代的并行用传统的并行标识出来,使得循环可以并行执行。但是循环倾斜后,并行执行的数据在内存中是离散的,而且每次迭代执行的次数是不一致的。为了更有效地利用SIMD,本文提出一种基于全局数据重组的循环倾斜优化方法。首先分析循环倾斜优化,针对数据离散的问题实现全局数据重组,改善数据局部性,循环易于向量化操作;针对迭代执行次数不一致问题,实现非满载向量操作,使尾循环得以向量执行。最后选择wavefront程序进行测试,优化后,程序计算可以获得平均10.73倍的加速效果。
-
关键词
单指令多数据流
循环倾斜
数据重组
非满载向量化
-
Keywords
SIMD
loop skew
data regroup
non-full vector operation
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-