-
题名基于ARM的图像几何变换算法库实现和优化技术研究
被引量:1
- 1
-
-
作者
王麓涵
贾海鹏
张云泉
张广婷
-
机构
中国科学院计算技术研究所计算机体系结构国家重点实验室
中国科学院大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2022年第10期10-17,共8页
-
基金
国家重点研发计划(2017YFB0202105)
国家自然科学基金(61972376)
北京市自然科学基金(L182053)。
-
文摘
高性能原语基础算法库(Intel■Integrated Performance Primitives, Intel IPP)是面向信号、图像处理领域的高性能多媒体加速库。然而,截至目前,暂时没有基于ARM架构的高性能IPP库。文中针对镜像变换、重映射、仿射、透视变换等基础图像几何变换算法,实现了一个基于ARM计算平台的高性能算法库PerfIPP,并通过SIMD汇编优化、内存对齐、数据预计算、高性能矩阵转置等优化技术,显著提升了上述算法的性能。同时,通过对比不同指令组合、不同指令排列、不同取数存储方式等所带来的性能差异,总结图像几何变换算法在ARM计算平台上实现与优化的关键技术。实验结果表明,在华为鲲鹏920平台上,相比开源计算机视觉库OpenCV,PerfIPP在满足精度要求的同时,在上述基础图像几何变换上获得了108.08%~435.5%的性能提升,并达到了在英特尔至强E5-2640处理器上Intel IPP库平均性能的83.79%。
-
关键词
IPP
ARM
neon
intrinsic
几何变换
插值
-
Keywords
IPP
ARM
neon intrinsic
Geometry Transforms
Interpolation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-