-
题名基于SIMD的三角函数高性能实现与优化
被引量:3
- 1
-
-
作者
姚建宇
张祎维
张广婷
贾海鹏
-
机构
中国科学院计算技术研究所计算机体系结构国家重点实验室
中国科学院大学计算机与控制学院
清华大学计算机科学与技术系
-
出处
《计算机科学》
CSCD
北大核心
2021年第12期29-35,共7页
-
基金
国家重点研发计划(2017YFB0202502,2018YFC0809306,2017YFB0202105,2016YFB0200803,2017YFB0202302)
国家自然科学基金(61972376)
北京自然科学基金(L182053)。
-
文摘
作为基本的数学运算,三角函数的高性能实现对构建处理器的基础软件生态具有重要意义,特别是当前处理器都采用了SIMD架构,基于SIMD实现高性能三角函数具有重要的研究意义和应用价值。对此,文中采用数值分析的方法,对5个常用的三角函数sin,cos,tan,atan,atan2进行了高性能的实现与优化。首先通过分析浮点数IEEE754标准,设计了高效的三角函数算法;然后通过多项式逼近算法中的泰勒公式、帕德近似及雷米兹算法提升了算法精度;最后利用指令流水线与SIMD优化进一步提升了算法性能。实验结果表明,在满足精度的前提下,所实现的三角函数,相较于libm算法库和ARM;算法库,在ARM V8计算平台上都获得了较大的性能提升,其中相比libm算法库有1.77~6.26倍的时间性能提升,相比ARM;算法库有1.34~1.5倍的时间性能提升。
-
关键词
三角函数
SIMD
高性能
数值分析
ARM
V8架构
-
Keywords
Trigonometric function
SIMD
High performance
Numerical analysis
ARM V8 architecture
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-