-
题名自动向量化:近期进展与展望
被引量:6
- 1
-
-
作者
冯竞舸
贺也平
陶秋铭
-
机构
中国科学院软件研究所基础软件国家工程研究中心
中国科学院大学研究生院
中国科学院软件研究所计算机科学国家重点实验室
-
出处
《通信学报》
EI
CSCD
北大核心
2022年第3期180-195,共16页
-
基金
中国科学院战略性先导科技专项基金资助项目(No.XDA-Y01-01,No.XDC02010600)。
-
文摘
随着单指令流多数据流(SIMD)技术的迅速发展,近年来许多面向SIMD扩展部件的自动向量化编译方法被提出,有效缓解了程序员手写向量程序的压力,并发挥了SIMD扩展部件的加速效能。基于此,分析总结了自动向量化领域近10年的研究成果,从保义分析和变换、向量化分组分析和变换、面向处理器支持特性的分析和变换以及性能评估分析这4个方面分类归纳了自动向量化的关键问题和主要突破,进而对4个方面的发展趋势和研究方向进行了展望。
-
关键词
自动向量化
SIMD扩展
编译技术
数据级并行
性能优化
-
Keywords
auto-vectorization
SIMD extension
compiling technology
data level parallelism
performance optimization
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于多种同构化变换的SLP向量化方法
- 2
-
-
作者
冯竞舸
贺也平
陶秋铭
马恒太
-
机构
基础软件国家工程研究中心(中国科学院软件研究所)
计算机科学国家重点实验室(中国科学院软件研究所)
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2023年第12期2907-2927,共21页
-
基金
中国科学院战略性先导科技专项(XDA-Y01-01,XDC02010600)。
-
文摘
超字级并行(superword level parallelism,SLP)是一种面向处理器单指令多数据(single instruction multiple data,SIMD)扩展部件实现程序自动向量化的方法,这种方法被广泛应用于主流编译器中.SLP方法有赖于先找到同构指令序列再对之进行自动向量化.将非同构指令序列等价转为同构指令序列以扩展SLP方法的适用范围是当前研究趋势之一.提出SLP的一种扩展方法──SLP-M向量化方法,引入二元表达式替换同构转换方式,基于条件判断和收益计算的选择,利用多种指令序列同构化转换,将满足特定条件的非同构指令序列转换为同构指令序列,再进一步实施自动向量化,从而提升SLP的适用范围和收益.在LLVM中实现了SLP-M方法,并利用SPEC CPU 2017等标准测试集进行了测试评估.实验结果表明,SLPM方法相比于已有方法在核心函数测试中性能提升了21.8%,在基准测试程序整体测试中性能提升了4.1%.
-
关键词
SIMD扩展
自动向量化
超字级并行
非同构指令序列
同构化变换
-
Keywords
SIMD extension
auto-vectorization
superword level parallelism(SLP)
sequence of non-isomorphism instructions
isomorphic transformation
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名率失真优化和系数移位结合的ROI编码方法
- 3
-
-
作者
冯竞舸
刘峰
-
机构
南京邮电大学江苏省图像处理与图像通信重点实验室
-
出处
《计算机技术与发展》
2013年第11期91-94,98,共5页
-
基金
国家自然科学基金资助项目(61071166)
国家青年科学基金(61001152)
广州市软件和信息服务产业专项资金资助项目
-
文摘
感兴趣区域图像编码技术是数字图像压缩编码领域的研究热点。文中提出了一种基于JPEG2000标准的率失真斜率优化和系数移位相结合的感兴趣编码改进方法,它结合了两者编码方式的优势,并在率失真斜率优化算法中充分考虑到ROI区域的比例并影响率失真函数的加权值。该方法提高了图像编码的信噪比,支持多个感兴趣区域,并且ROI的形状不受限制。实验证明:该方法不仅在低码率条件下提高了感兴趣区域的信噪比,在高码率下整幅图像的信噪比也得到了改善。
-
关键词
感兴趣区域
JPEG2000
率失真优化
系数位移
-
Keywords
ROI
JPEG2000
rate-distortion optimzation
shifting coefficients
-
分类号
TP277
[自动化与计算机技术—检测技术与自动化装置]
-