基于动态规划的自动向量化方法被引量：1

Auto-Vectorization Method Based on Dynamic Programming

下载PDF

导出

摘要由于SLP自动向量化算法使用的启发式策略会丢失一定的向量化机会,本文提出一种基于动态规划的自动向量化方法DPSLP,该方法采用比SLP更加激进的策略在基本块内寻找候选的SIMD指令分组,依据动态规划方程计算指令分组的代价并从众多指令分组中选择最优的分组进行向量化转换.实验结果显示,DPSLP与SLP相比测试程序的运行时间平均减少了8%,静态指令代价平均减少10%,平均向量宽度增加66.4%. As SLP（super-word level parallelism）auto-vectorization algorithm will lose some vectorization opportunities by using heuristic strategy,an auto-vectorization method named DPSLP that based on dynamic programming was proposed in this paper.In this method,the candidate statement groups were searched for SIMD（single instruction multiple data）instruction by using more aggressive strategy than SLP,and the optimal statement groups were selected to vectorize according to the cost of which calculated by dynamic programming formula.Experimental result show that DPSLP achieves on average a total decrease of 8% in execution time,10%in static instruction cost and increase of 66.4%in vector width,compared with SLP.

作者吕鹏伟刘从新赵一明沈绪榜

机构地区西安微电子技术研究所

出处《北京理工大学学报》 EI CAS CSCD 北大核心 2017年第5期544-550,共7页 Transactions of Beijing Institute of Technology

基金国家部委重大专项基金资助项目(2014ZX01020-003) 国家自然科学基金资助项目(61136002)

关键词自动向量化动态规划指令代价 auto-vectorization dynamic programming instruction cost

分类号 TP314 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1徐金龙,赵荣彩,韩林.分段约束的超字并行向量发掘路径优化算法[J].计算机应用,2015,35(4):950-955. 被引量：11
2魏帅,赵荣彩,姚远.面向SLP的多重循环向量化[J].软件学报,2012,23(7):1717-1728. 被引量：13
3高伟,赵荣彩,韩林,庞建民,丁锐.SIMD自动向量化编译优化概述[J].软件学报,2015,26(6):1265-1284. 被引量：30

二级参考文献29

1Stewart J. An investigation of SIMD instruction sets. University of Ballarat School of Information Technology and Mathematical Sciences, 2005. http://noisymime.org/blogimages/SIMD.pdf.
2Nuzman D, Rosen I, Zaks A. Auto-Vectorization of interleaved data for SIMD, In: Proc. of the ACM SIGPLAN Conf. on Programming Language Design and Implementation. Ottawa: ACM Press, 2006. 132-143. [doi: 10.1145/1133981.1133996].
3Zheng WM, Tang ZZ. Compiler Archtecture. Beijing: Tsinghua University Press, 1998 (in Chinese).
4Allen R, Kennedy K. Optimizing Compilers for Modern Architectures--A Dependence-Based Approach. San Francisco: Morgan Kaufmann Publishers, 2001.
5Shen ZY, Hu ZA, Liao XK, Wu HP, Zhao KJ, Lu YT. Methods of Parallel Compilation. Beijing: National Defence Industry Press, 2000 (in Chinese).
6Bik AJC. The Software Vectorization Handbook--Applying Multimedia Extensions for Maximum Performance. Intel Press, 2004.
7Hampton M, Asanovic K. Compiling for vector-thread architectures. In: Proc. of the 6th Annual IEEE/ACM Int'l Symp. on Code Generation and Optimization. Boston: ACM Press, 2008.205-215. [doi: 10.1145/1356058.1356085].
8Naishlos D, Biberstein M, Ben-David S, Zaks A. Vectorizing for a SIMdD DSP architecture. In: Proc. of the 2003 Int'l ConL on Compilers, Architecture and Synthesis for Embedded Systems. San Jose: ACM Press, 2003.2-11. [doi: 10.1145/951710.951714].
9Bik AJC, GirKar M, Grey PM, Tian XM. Automatic intra-register vectorization for the Intel architecture. Int'l Journal of Parallel Programming, 2002,30(2):65-98. [doi: 10.1023/A:1014230429447].
10Wu P, Eichenberger AE, Wang A, Zhao P. An integrated simdization framework using virtual vectors. In: Proc. of the 19th Annual Int'l Conf. on Supercomputing. Cambridge: ACM Press, 2005. 169-178. [doi: 10.1145/1088149.1088172].

共引文献43

1侯永生,赵荣彩,高伟,高伟.非正规化循环的单指令多数据向量化[J].计算机应用,2013,33(11):3149-3154. 被引量：1
2赵博,赵荣彩,李雁冰,高伟.类型转换语句的SLP发掘方法[J].计算机科学,2014,41(11):16-21. 被引量：2
3赵博,赵荣彩,徐金龙,高伟.渐进式智能回溯向量化代码调优方法[J].计算机科学,2015,42(1):50-53.
4王向前,洪一,郑启龙.分块内存的数据分布优化[J].小型微型计算机系统,2015,36(4):815-819. 被引量：1
5沈凤仙,孙勤红.嵌入式路由冲突下链路分离语义检索优化模型[J].微电子学与计算机,2015,32(7):142-146. 被引量：1
6王向前,洪一,王昊,郑启龙.魂芯DSP的编译器设计与优化[J].电子学报,2015,43(8):1656-1661. 被引量：7
7杨秀荣.并行数据库中异常数据优化分类挖掘方法研究[J].微电子学与计算机,2015,32(10):125-128. 被引量：4
8李晓东,魏惠茹.支持多模推荐的多层数据库优化访问技术[J].科技通报,2015,31(12):110-112. 被引量：2
9林荫,朱莹莹.基于小波包分解正态谐振数据库优化访问控制[J].科技通报,2015,31(12):113-114. 被引量：2
10唐佳,王凡,刘福烈.三维波动方程正演的三级并行加速[J].石油地球物理勘探,2016,51(5):1049-1054. 被引量：8

同被引文献8

1李玉祥,施慧,陈莉.面向向量化的局部数据重组[J].小型微型计算机系统,2009,30(8):1528-1534. 被引量：10
2魏帅,赵荣彩,姚远.面向SLP的多重循环向量化[J].软件学报,2012,23(7):1717-1728. 被引量：13
3赵博,赵荣彩,李雁冰,高伟.类型转换语句的SLP发掘方法[J].计算机科学,2014,41(11):16-21. 被引量：2
4高伟,赵荣彩,韩林,庞建民,丁锐.SIMD自动向量化编译优化概述[J].软件学报,2015,26(6):1265-1284. 被引量：30
5赵捷,赵荣彩.基于有向图可达性的SLP向量化识别方法[J].中国科学：信息科学,2017,47(3):310-325. 被引量：2
6高伟,韩林,赵荣彩,徐金龙,陈超然.向量并行度指导的循环SIMD向量化方法[J].软件学报,2017,28(4):925-939. 被引量：5
7纪守领,李进锋,杜天宇,李博.机器学习模型可解释性方法、应用与安全研究综述[J].计算机研究与发展,2019,56(10):2071-2096. 被引量：138
8冯竞舸,贺也平,陶秋铭.自动向量化:近期进展与展望[J].通信学报,2022,43(3):180-195. 被引量：5

引证文献1

1冯竞舸,贺也平,陶秋铭,马恒太.基于多种同构化变换的SLP向量化方法[J].计算机研究与发展,2023,60(12):2907-2927.

1汪伟中.一种Fortran程序自动向量化的方法[J].系统工程与电子技术,1990,12(10):48-52.
2有派(Pad)才够味小米平板3PK华为平板M3[J].电脑爱好者,2017,0(11):70-71.
3莫保锋,黄美发,肖萌萌,杨武军.Pro/E与ADAMS之间的数据传递方法研究[J].电子机械工程,2014,30(2):57-60. 被引量：2
4陈能仑,舒振宇,陈双敏,刘邦权,赵杰煜,辛士庆.几何质心的定义和计算[J].计算机辅助设计与图形学学报,2017,29(5):914-920. 被引量：1
5徐伟,熊邦书,欧巧凤.高精度线路板夹角测量算法[J].微计算机信息,2010,26(5):186-188.
6王向前,王昊.分簇结构向量寄存器分配策略研究[J].单片机与嵌入式系统应用,2017,17(7):10-12. 被引量：1
7袁昱纬,刘传辉,全吉成,王宏伟,吴晨.基于空间自适应剖分的Lightcuts多光源聚类算法[J].海军航空工程学院学报,2017,32(2):181-186.
8Dan Prosser,徐博英.迈凯伦570S Track Pack[J].汽车与运动,2017,0(7):36-39.

北京理工大学学报

2017年第5期

浏览历史

内容加载中请稍等...

基于动态规划的自动向量化方法被引量：1

参考文献3

二级参考文献29

共引文献43

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于动态规划的自动向量化方法 被引量：1

参考文献3

二级参考文献29

共引文献43

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于动态规划的自动向量化方法被引量：1