-
题名面向FT-M7002的高斯滤波算法优化实现
被引量:7
- 1
-
-
作者
陈云
王梦园
柴晓楠
商建东
-
机构
郑州大学信息工程学院
河南省超级计算中心(郑州大学)
-
出处
《计算机工程与科学》
CSCD
北大核心
2021年第5期799-806,共8页
-
文摘
国产自主研发的飞腾系列高性能DSP处理器在图像处理领域的应用,对面向该平台的高性能图像处理算法提出了强烈需求。高斯滤波作为图像处理的基础算法,能有效滤除图像中的高斯噪声,在图像处理领域具有广泛应用。针对飞腾高性能DSP的体系结构特点与高斯滤波算法特性,实现了面向飞腾高性能DSP的高斯滤波算法优化。通过手工向量化、控制流消除和循环展开等优化手段充分利用数据级与指令级并行性,从而减少数据访存次数,提高指令执行效率。针对FT-MT2内核中的DMA硬件及向量存储器结构特点,进行了“乒-乓”缓存、DMA数组转置等优化,以减少数据传输时间,提高数据局部性。多种滤波核大小及图像矩阵规模下的测试结果表明,相对于高斯滤波算法的串行实现,该并行优化实现获得了1.3~1.41倍的加速比。在开启Cache的情况下,相较于dsplib库中高斯滤波算法在TMS320C6678平台上的运行性能,获得了1.15~1.71倍的加速效果。
-
关键词
高性能DSP
高斯滤波
向量并行优化
dma传输优化
-
Keywords
high performance DSP
Gaussian filtering
vector parallel optimization
dma transmission optimization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-