期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
面向64位RISC-V的基础数学库自动化移植
1
作者 曹浩 郭绍忠 +1 位作者 刘聃 许瑾晨 《计算机科学》 CSCD 北大核心 2021年第6期41-47,共7页
受制于核心技术和知识产权等客观条件,国产自主芯片的研发困难重重。RISC-V作为一个开源指令集架构(ISA),具有简洁、模块化等优点,成为了国产处理器的新选择。基础数学库作为计算机系统最基础的核心软件库之一,对国产处理器的软件生态... 受制于核心技术和知识产权等客观条件,国产自主芯片的研发困难重重。RISC-V作为一个开源指令集架构(ISA),具有简洁、模块化等优点,成为了国产处理器的新选择。基础数学库作为计算机系统最基础的核心软件库之一,对国产处理器的软件生态建设和健康发展尤为重要,而目前RISC-V还没有相关的基础数学库。因此,文中旨在将基于国产申威处理器的基础数学库移植到64位RISC-V平台。为了解决基础数学库的高效移植问题,首先设计了一个自动化移植框架,该框架通过功能模块间的松耦合,来实现高可扩展性;然后根据64位RISC-V指令集架构的特点,提出了基于全局的主动式寄存器分配方法和基于层次的指令选择策略;最后应用该框架,实现了对申威平台基础数学库中典型函数的移植,测试结果表明移植后函数功能正确且相对于GLIBC库在性能上有一定的提升。 展开更多
关键词 RISC-V 基础数学库 汇编 自动化移植
下载PDF
一种改进的超越函数通用算法 被引量:7
2
作者 郭绍忠 许瑾晨 陈建勋 《计算机工程》 CAS CSCD 2012年第15期31-34,共4页
提出一种适用于高性能计算的基础数学库超越函数通用算法。基于转换、近似、重建等技术,对级数法和迭代法进行改进,运用函数收敛性最好的一段区间进行函数算法设计,通过减少运算次数来降低因多次运算导致的累积误差,保证函数算法的精度... 提出一种适用于高性能计算的基础数学库超越函数通用算法。基于转换、近似、重建等技术,对级数法和迭代法进行改进,运用函数收敛性最好的一段区间进行函数算法设计,通过减少运算次数来降低因多次运算导致的累积误差,保证函数算法的精度。利用查表法构造辅助表参与运算,减少算法开销。测试结果表明,与GNU数学库函数相比,基于该算法的数学库函数运行效率平均提升50.91%。 展开更多
关键词 基础数学库 超越函数 算法转换 级数法 迭代法 查表法
下载PDF
基于SIMD扩展部件的长向量超越函数实现方法 被引量:1
3
作者 刘聃 郭绍忠 +1 位作者 郝江伟 许瑾晨 《计算机科学》 CSCD 北大核心 2021年第6期26-33,共8页
基础数学函数库是计算机系统非常关键的软件模块,然而国产申威平台上的长向量超越函数只能依靠循环调用系统标量函数来间接实现,该方法无法充分发挥申威平台SIMD扩展部件的计算性能。为了有效解决此问题,实现了申威平台基于SIMD扩展部... 基础数学函数库是计算机系统非常关键的软件模块,然而国产申威平台上的长向量超越函数只能依靠循环调用系统标量函数来间接实现,该方法无法充分发挥申威平台SIMD扩展部件的计算性能。为了有效解决此问题,实现了申威平台基于SIMD扩展部件底层优化的长向量超越函数,提出了浮点计算融合算法,解决了两分支结构算法难以向量化的问题;提出了基于Estrin算法动态分组的大阶数多项式实现方法,提高了多项式汇编计算的流水性能。这是在国产申威平台上首次实现长向量超越函数库,提供的函数接口包含三角函数、反三角函数、对数函数、指数函数等。实验结果表明,双精度版本最大误差控制在3.5ULP(unit in the last place)以下,单精度版本最大误差控制在0.5ULP以下,该性能与申威平台直接循环调用系统标量函数相比有显著提高,平均加速比为3.71。 展开更多
关键词 基础数学库 向量超越函数 国产平台 流水优化 浮点计算
下载PDF
基于申威1621的半精度超越函数设计 被引量:1
4
作者 曹克乾 赵荣彩 王磊 《计算机应用》 CSCD 北大核心 2022年第S01期221-225,共5页
低精度浮点数常用于深度学习加速,目前申威平台缺乏对低精度浮点数的支持,数学库的设计往往需要结合数据类型与处理器特点定制算法才能发挥出最大优势,旨在为申威1621平台设计一套支持半精度计算的超越函数。通过分析各类浮点数特性,结... 低精度浮点数常用于深度学习加速,目前申威平台缺乏对低精度浮点数的支持,数学库的设计往往需要结合数据类型与处理器特点定制算法才能发挥出最大优势,旨在为申威1621平台设计一套支持半精度计算的超越函数。通过分析各类浮点数特性,结合申威1621的结构特点提出一种基于回乘取余查表算法。首先,对函数的定义域进行归约,生成精简的数据表;然后将回乘取余后的数值按照sign、exponent、mantissa三部分拆分计算索引;最后,查表返回结果。测试结果表明,使用回乘取余查表算法实现的半精度超越函数,相较于基于多项式近似、移位相加等算法的申威数学库及GLIBC开源数学库,性能分别提升了116%和215%。在精度需求不高的应用中既保证了正确性又大幅度提升了数学函数计算效率。 展开更多
关键词 半精度 基础数学库 查表法 归约算法 超越函数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部