-
题名面向DSP的超字并行指令分析和冗余优化算法
被引量:1
- 1
-
-
作者
索维毅
赵荣彩
姚远
刘鹏
-
机构
信息工程大学
-
出处
《计算机应用》
CSCD
北大核心
2012年第12期3303-3307,共5页
-
基金
核高基重大专项(2009ZX01036-001-001-2)
-
文摘
如今单指令多数据流(SIMD)技术在数字信号处理器(DSP)上得到了广泛的应用,现有的向量化编译器大多都实现了自动向量化的功能,但是编译器并不适合支持DSP为特征的SIMD自动向量化,主要由于DSP复杂的指令集、特有的寻址模型,以及依赖关系或者数据非对齐等原因而导致向量化效率不高。为了解决此问题,在基于Open64的超字并行(SLP)自动向量化编译系统后端,对SLP自动向量化中的指令分析和冗余优化算法进行了添加和改进,生成更加高效的向量化源程序。实验结果表明,该优化方法能有效提高DSP性能并降低功耗。
-
关键词
单指令多数据流
数字信号处理器
自动向量化
冗余优化
Open64
-
Keywords
Single Instruction Multiple Data(SIMD)
Digital Signal Processing(DSP)
automatic vectorization
redundancy optimization
Open64
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于跨基本块变换和循环分布的SLP优化技术
- 2
-
-
作者
索维毅
赵荣彩
姚远
张小妹
-
机构
解放军信息工程大学
解放军
-
出处
《计算机科学》
CSCD
北大核心
2013年第10期24-28,60,共6页
-
基金
核高基重大专项(2009ZX01036-001-001-2)资助
-
文摘
现有的SLP优化算法无法处理内层循环中存在的依赖环和归约,并且在基本块边界产生大量的冗余拆包和赋值语句,从而导致向量化效率不高。针对该问题,提出了一种基于跨基本块变换和循环分布的SLP优化算法。该算法以控制流图为基础,根据基本块间各数组变量的Define-Use关系以及跨越基本块之间的数据依赖关系进行跨基本块的向量化变换,有序地采用跨基本块变换和循环分布,尽可能发掘最内层循环基本块内语句的并行性,使SLP自动向量化编译器生成具有更多SIMD指令的向量化代码。实验结果表明,该算法能够隐藏更多跨基本块冗余操作的开销,同时利用跨基本块的数据依赖生成更优的SIMD指令,有效地提高了向量化程序的加速比。
-
关键词
SLP
跨基本块变换
循环分布
数据依赖
控制流图
Define-Use关系
-
Keywords
SLP, Cross basic block, Loop distribution, Data dependence, Control flow graph, Define-Use relationship
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-