期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向FT-M6678的对称矩阵特征值求解算法实现与优化
1
作者 于立 韩林 +1 位作者 罗有才 商建东 《计算机工程》 CAS CSCD 北大核心 2024年第2期51-58,共8页
目前国产自主可控FT-M6678平台上没有对称矩阵特征值求解相关的实现,且平台上现有数学计算库不能很好地满足类似问题求解的需求。面向国产FT-M6678处理器,对对称矩阵特征值求解(SYEV)算法进行实现与优化,完善FT-M6678平台的线性代数计... 目前国产自主可控FT-M6678平台上没有对称矩阵特征值求解相关的实现,且平台上现有数学计算库不能很好地满足类似问题求解的需求。面向国产FT-M6678处理器,对对称矩阵特征值求解(SYEV)算法进行实现与优化,完善FT-M6678平台的线性代数计算库。通过对SYEV算法的实现过程以及运行热点的分析,基于FT-M6678平台进行编译优化、访存优化以及向量并行化优化,其中:编译优化是根据不同的编译选项指导编译器对程序优化以达到加速效果;访存优化包括缓存优化以及数据段与程序段的分配优化,用于提高矩阵数据的访存效率;向量并行化优化包括循环展开以及适配FT-M6678平台的单指令多数据流(SIMD)指令并行优化,用于提升程序的计算效率。在FT-M6678平台上对所实现并优化的算法进行正确性验证与优化性能分析,结果表明,算法能够正确通过LAPACK官方测试集测试,并且在FT-M6678平台上的加速效果可达到58.346倍,对比TMS320C6678平台速度可提升2.053倍。 展开更多
关键词 对称矩阵特征值 FT-m6678平台 热点分析 缓存优化 向量并行
下载PDF
基于飞腾M6678的向量数学库优化技术研究 被引量:2
2
作者 王正行 曾令将 《舰船电子工程》 2021年第3期102-106,共5页
不同于传统的标量数学计算,向量数学库提供的加速比高,能够充分利用飞腾M6678的并行计算能力。文章比较了现有的数学函数库,包括标准C数学函数库和TI公司的MAHLIB函数库的运算性能,发现MATHLIB函数库部分函数向量化程度低,可向量化的空... 不同于传统的标量数学计算,向量数学库提供的加速比高,能够充分利用飞腾M6678的并行计算能力。文章比较了现有的数学函数库,包括标准C数学函数库和TI公司的MAHLIB函数库的运算性能,发现MATHLIB函数库部分函数向量化程度低,可向量化的空间较大。向量函数库选择级数法实现,为使用飞腾M6678的指令集RCPSP和RSQRSP,引入了牛顿迭代法。以开平方运算为例,文章通过深入分析单次循环体内资源占用的情况,详细说明了如何确定一个函数的计算瓶颈。根据瓶颈的不同,选择对应的SIMD优化方法,以及基于飞腾M6678硬件特性的优化方法,构建了一个高性能的向量数学库。测试结果表明,向量数学库典型函数的性能提升可达150%至700%。 展开更多
关键词 性能优化 m6678 向量数学库 牛顿迭代法 SIMD
下载PDF
M6678 DSP的两种备份启动方案设计
3
作者 李雷 王正行 +1 位作者 汪智 陈俊磊 《单片机与嵌入式系统应用》 2023年第1期11-14,25,共5页
随着搭载DSP的系统多样化,因DSP启动失败导致无法正常工作已成为一个重要问题。为了提高DSP系统的可靠性和可维护性,结合飞腾M6678 DSP硬件特征,根据DSP的启动原理设计了两种备份启动方案。一种基于SPI NOR FLASH及EMIF NOR FLASH结合... 随着搭载DSP的系统多样化,因DSP启动失败导致无法正常工作已成为一个重要问题。为了提高DSP系统的可靠性和可维护性,结合飞腾M6678 DSP硬件特征,根据DSP的启动原理设计了两种备份启动方案。一种基于SPI NOR FLASH及EMIF NOR FLASH结合的方式,通过外部控制器在线切换DSP启动模式,实现DSP从SPI NOR FLASH或EMIF NOR FLASH的程序启动。另一种基于单片SPI NOR FLASH三次引导加载实现备份启动的方式,将UBOOT程序、应用程序和备份应用程序分别存储在SPI NOR FLASH的三段空间,DSP上电后通过RBL程序加载SPI NOR FLASH首段空间中的UBOOT程序,UBOOT运行后,根据外部信号完成不同FLASH地址的应用程序加载。测试结果表明,两种方案均能实现DSP备份启动的功能,提高了系统的可靠性,对比两种方式,单片SPI NOR FLASH方式具有更好的收益。 展开更多
关键词 m6678 SPI EMIF 三次引导 FLASH分区
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部