一种基于剪切的SLP向量化方法

SLP vectorization method based on throttling

下载PDF

导出

摘要作为多媒体和科学计算等领域重要的程序加速器件之一,SIMD扩展部件现已广泛集成于各类处理器中。自动向量化方法是目前生成SIMD向量化程序的重要手段。超字并行SLP(superword level parallelism)方法现已广泛应用于编译器中,并成为实现基本块级代码向量化的主要手段。SLP在进行收益评估时仅考虑代码段整体向量化的收益,并没有考虑到向量化收益为负的片段会降低最终整体的向量化收益,从而导致SLP方法无法达到最好的向量化效果。基于此,提出了一种基于剪切的SLP向量化方法(throttling SLP,TSLP)。通过寻找最优的向量化子图,去除了向量化收益为负的代码段,从而可以获得更好的向量化效果。通过标准测试程序的实验结果表明,与原来的SLP方法相比,TSLP方法平均能够获得9%的性能提升。 SIMD vectors are widely adopted in modern general purpose processors as they can boost performance and energy efficiency for media and scientific applications.Compiler-based automatic vectorization is one approach for generating code that makes efficient use of the SIMD units.The SLP vectorization algorithm is the most well-known implementation of automatic vectorization.Choosing whether to vectorize is a one-off decision for the whole graph that has been generated.However,this is sub-optimal because the graph may contain code that is harmful to vectorization due to the need to move data from scalar registers into vectors.Therefore,this paper proposed a solution to overcome this limitation by introducing throttling SLP(TSLP),a novel vectorization algorithm that finds the optimal graph to vectorize.The decision did not consider the potential benefits of throttling the graph by removing this harmful code.The experiments show that TSLP can decrease execution time by 9%compared to SLP on average.

作者李颖颖奚慧兴高伟李伟翟胜伟 Li Yingying;Xi Huixing;Gao Wei;Li Wei;Zhai Shengwei(Information Engineering University,Zhengzhou 450002,China;State Key Laboratory of Mathematical Engineering&Advanced Computing,Zhengzhou 450002,China;Anshan Normal University,Anshan Liaoning 114007,China;The 27th Research Institute,China Electronics Technology Group Corporation,Zhengzhou 450047,China)

机构地区信息工程大学数学工程与先进计算国家重点实验室鞍山师范学院中国电子科技集团公司第二十七研究所

出处《计算机应用研究》 CSCD 北大核心 2018年第9期2578-2582,共5页 Application Research of Computers

基金国家自然科学基金资助项目(61472447) 国家"863"计划资助项目(2014AA01A300) 国家"核高基"重大专项资助项目(2013ZX0102-8001-001-001)

关键词单指令多数据扩展部件自动向量化超字并行代价模型 SIMD extension auto-vectorization superword level parallelism(SLP) cost model

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1高伟,赵荣彩,韩林,庞建民,丁锐.SIMD自动向量化编译优化概述[J].软件学报,2015,26(6):1265-1284. 被引量：30

二级参考文献4

1李玉祥,施慧,陈莉.面向向量化的局部数据重组[J].小型微型计算机系统,2009,30(8):1528-1534. 被引量：10
2辛乃军,陈旭灿,孙海燕,阳柳,罗杰,淡孝强,王霁.基于GCC的高性能DSP Matrix向量指令集扩展[J].计算机工程与科学,2012,34(1):58-63. 被引量：9
3彭飞,顾乃杰,高翔,孙明明.龙芯3B的SIMD编译优化及分析[J].小型微型计算机系统,2012,33(12):2733-2737. 被引量：9
4徐华叶,郑启龙,丁陈飞,徐东鹏.面向多簇超长指令字DSP的向量化优化算法[J].计算机系统应用,2013,22(12):140-143. 被引量：3

共引文献29

1唐佳,王凡,刘福烈.三维波动方程正演的三级并行加速[J].石油地球物理勘探,2016,51(5):1049-1054. 被引量：8
2贺婷.基于数据级自动向量化的编译优化研究综述[J].智能计算机与应用,2016,6(6):68-71. 被引量：1
3张素平,王冬,丁丽丽,王鹏翔,宫一,于海宁.一种基于SLP的新型编译框架[J].计算机应用研究,2017,34(1):21-26. 被引量：1
4张素平,韩林,丁丽丽,王鹏翔.新型超字级并行改进算法[J].计算机应用,2017,37(2):450-456.
5吕鹏伟,刘从新,沈绪榜.一种新型自动向量化编译算法[J].武汉大学学报（理学版）,2016,62(5):456-463.
6丁丽丽,韩林,王冬,张素平,王鹏翔,于海宁.依赖距离主导的向量化方法研究[J].计算机应用研究,2017,34(5):1311-1315.
7高伟,韩林,赵荣彩,徐金龙,陈超然.向量并行度指导的循环SIMD向量化方法[J].软件学报,2017,28(4):925-939. 被引量：5
8陈华军,王琦,洪超,方萌.基于全局数据重组的循环倾斜优化[J].计算机与现代化,2017(6):45-49.
9吕鹏伟,刘从新,赵一明,沈绪榜.基于动态规划的自动向量化方法[J].北京理工大学学报,2017,37(5):544-550. 被引量：1
10韩林,高伟,王冬,王鹏翔,李颖颖.一种单指令多数据向量化归约方法[J].计算机工程,2017,34(7):9-14. 被引量：1

1彭振,吴百锋.基于数据并行的碰撞检测[J].计算机工程,2017,43(9):1-6.
2邢志平.企业出口规模越大全要素生产率越高吗?——基于中国出口企业的经验分析[J].大连理工大学学报（社会科学版）,2018,39(4):21-28. 被引量：5
3刘有耀,张仲伟.基于SIMD体系结构的指令级并行结构设计[J].电子设计工程,2017,25(21):152-156. 被引量：4
4季朋,李晖,陈梅,戴震宇.DoFFT:一种基于分布式数据库的快速傅里叶变换方法[J].计算机与现代化,2018(6):19-24. 被引量：1
5岑淑阳,吴素芳.Parallelism在《怦然心动》中的修辞效果研究[J].海外英语,2018(18):75-77. 被引量：1
6Dong Dong,Wenhe Su,Wenqiang Shi,Quan Zou,Shaoliang Peng.VCSRA:A fast and accurate multiple sequence alignment algorithm with a high degree of parallelism[J].Journal of Genetics and Genomics,2018,45(7):407-410.
7陈思润,顾乃杰,苏俊杰,贺爱香.基于ARM架构的滤波函数优化[J].计算机应用与软件,2018,35(9):138-143. 被引量：4
8王琦,韩林,姚金阳,陶小涵.不充分SIMD向量化技术研究[J].计算机应用与软件,2018,35(9):108-112. 被引量：4
9蒋荣辉.电力调度自动化系统数据注入攻击的保护策略[J].自动化应用,2018(5):83-85. 被引量：3
10刘正涛,王建东.Web大数据系统数据源选择[J].计算机科学与探索,2018,12(3):360-369.

计算机应用研究

2018年第9期

浏览历史

内容加载中请稍等...

一种基于剪切的SLP向量化方法

参考文献1

二级参考文献4

共引文献29

相关作者

相关机构

相关主题

浏览历史