期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
自动向量化:近期进展与展望 被引量:6
1
作者 冯竞舸 贺也平 陶秋铭 《通信学报》 EI CSCD 北大核心 2022年第3期180-195,共16页
随着单指令流多数据流(SIMD)技术的迅速发展,近年来许多面向SIMD扩展部件的自动向量化编译方法被提出,有效缓解了程序员手写向量程序的压力,并发挥了SIMD扩展部件的加速效能。基于此,分析总结了自动向量化领域近10年的研究成果,从保义... 随着单指令流多数据流(SIMD)技术的迅速发展,近年来许多面向SIMD扩展部件的自动向量化编译方法被提出,有效缓解了程序员手写向量程序的压力,并发挥了SIMD扩展部件的加速效能。基于此,分析总结了自动向量化领域近10年的研究成果,从保义分析和变换、向量化分组分析和变换、面向处理器支持特性的分析和变换以及性能评估分析这4个方面分类归纳了自动向量化的关键问题和主要突破,进而对4个方面的发展趋势和研究方向进行了展望。 展开更多
关键词 自动向量化 SIMD扩展 编译技术 数据级并行 性能优化
下载PDF
基于多种同构化变换的SLP向量化方法
2
作者 冯竞舸 贺也平 +1 位作者 陶秋铭 马恒太 《计算机研究与发展》 EI CSCD 北大核心 2023年第12期2907-2927,共21页
超字级并行(superword level parallelism,SLP)是一种面向处理器单指令多数据(single instruction multiple data,SIMD)扩展部件实现程序自动向量化的方法,这种方法被广泛应用于主流编译器中.SLP方法有赖于先找到同构指令序列再对之进... 超字级并行(superword level parallelism,SLP)是一种面向处理器单指令多数据(single instruction multiple data,SIMD)扩展部件实现程序自动向量化的方法,这种方法被广泛应用于主流编译器中.SLP方法有赖于先找到同构指令序列再对之进行自动向量化.将非同构指令序列等价转为同构指令序列以扩展SLP方法的适用范围是当前研究趋势之一.提出SLP的一种扩展方法──SLP-M向量化方法,引入二元表达式替换同构转换方式,基于条件判断和收益计算的选择,利用多种指令序列同构化转换,将满足特定条件的非同构指令序列转换为同构指令序列,再进一步实施自动向量化,从而提升SLP的适用范围和收益.在LLVM中实现了SLP-M方法,并利用SPEC CPU 2017等标准测试集进行了测试评估.实验结果表明,SLPM方法相比于已有方法在核心函数测试中性能提升了21.8%,在基准测试程序整体测试中性能提升了4.1%. 展开更多
关键词 SIMD扩展 自动向量化 超字级并行 非同构指令序列 同构化变换
下载PDF
率失真优化和系数移位结合的ROI编码方法
3
作者 冯竞舸 刘峰 《计算机技术与发展》 2013年第11期91-94,98,共5页
感兴趣区域图像编码技术是数字图像压缩编码领域的研究热点。文中提出了一种基于JPEG2000标准的率失真斜率优化和系数移位相结合的感兴趣编码改进方法,它结合了两者编码方式的优势,并在率失真斜率优化算法中充分考虑到ROI区域的比例并... 感兴趣区域图像编码技术是数字图像压缩编码领域的研究热点。文中提出了一种基于JPEG2000标准的率失真斜率优化和系数移位相结合的感兴趣编码改进方法,它结合了两者编码方式的优势,并在率失真斜率优化算法中充分考虑到ROI区域的比例并影响率失真函数的加权值。该方法提高了图像编码的信噪比,支持多个感兴趣区域,并且ROI的形状不受限制。实验证明:该方法不仅在低码率条件下提高了感兴趣区域的信噪比,在高码率下整幅图像的信噪比也得到了改善。 展开更多
关键词 感兴趣区域 JPEG2000 率失真优化 系数位移
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部