Canny边缘检测算法在飞腾平台上的实现与优化被引量：5

Implementation and Optimization of Canny Edge Detection Algorithm on FT Platform

下载PDF

导出

摘要为实现国产飞腾DSP平台对底层图像库的支持,针对原始Canny边缘检测算法计算时间过长的问题,设计一种面向FT-M7002平台的Canny梯度计算并行算法。基于FT-M7002高性能处理架构,采用单指令流多数据流向量化方式增强DSP内核指令的并行处理能力,根据FT-M7002平台向量存储器的层次结构特征,分析Canny梯度计算并行算法的访存模式,通过首地址偏移取址解决不连续访存问题,并结合双缓冲方式完成数据传输与数据计算。实验结果表明,在与原始Canny算法具有相同检测精度的情况下,该算法在卷积核大小为3×3、5×5、7×7时整体运行速度提升了1.490~2.112倍,缩小了与主流加速器件在数字图像处理领域的性能差距。 In order to support the underlying image library on the FT DSP platform,and reduce the time consumed by the calculation in the Canny edge detection algorithm,an algorithm for parallel Canny gradient computing based on FT-M7002 is proposed.On the basis of FT-M7002 high-performance processing architecture,Single Instruction Multiple Data(SIMD)is vectorized to enhance the parallel processing of the instructions of DSP cores.According to the hierarchical structure features of the vector memory of FT-M7002,the mode of data memory access of the Canny parallel gradient computing algorithm is analyzed.The first address offset is used to deal with discontinuous data memory access,and data transmission and data calculation is completed by means of double buffering mode.Experimental results show that when reaching the same detection accuracy as the original Canny algorithm,the proposed algorithm improves the overall running speed by 1.490~2.112 times when the size of convolution core is 3×3,5×5,and 7×7,bridging the performance gap with the mainstream accelerators in digital image processing.

作者郭恒亮柴晓楠韩林赫晓慧商建东 GUO Hengliang;CHAI Xiaonan;HAN Lin;HE Xiaohui;SHANG Jiandong(Henan Province Supercomputing Center,Zhengzhou University,Zhengzhou 450000,China;School of Information Engineering,Zhengzhou University,Zhengzhou 450000,China;School of Earth Science and Technology,Zhengzhou University,Zhengzhou 450000,China)

机构地区郑州大学河南省超级计算中心郑州大学信息工程学院郑州大学地球科学与技术学院

出处《计算机工程》 CAS CSCD 北大核心 2021年第7期37-43,共7页 Computer Engineering

基金国家重点研发计划(2018YFB0505000)。

关键词 FT-M7002处理器 CANNY边缘检测梯度计算并行访存优化双缓冲方式 FT-M7002 processor Canny edge detection parallel gradient computing memory access optimization double buffering mode

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1李飞,宾洋,罗文广,朱英凯.基于TMSDM6437的车道线检测[J].广西科技大学学报,2018,29(1):43-48. 被引量：4
2卢俊,张保明,黄薇,李二森.基于GPU的遥感影像数据融合IHS变换算法[J].计算机工程,2009,35(7):261-263. 被引量：18
3宋琦.DSP芯片在实时图像处理系统中的应用分析[J].电子技术与软件工程,2015(9):86-86. 被引量：2
4陈超.多阈值优化的运动图像轮廓特征提取方法[J].沈阳工业大学学报,2019,41(3):315-319. 被引量：29

二级参考文献26

1曹锋,周傲英.基于图形处理器的数据流快速聚类[J].软件学报,2007,18(2):291-302. 被引量：24
2Pharr M.GPU精粹2[M].龚敏敏,译.北京:清华大学出版社,2007:201-219.
3Castleman K R. Digital Image Processing[M]. [S. l.]: Prentice Hall Press. 1996.
4柯丽,黄廉卿.DSP芯片在实时图像处理系统中的应用[J].光机电信息,2013,01(25):13-14.
5涂晓昱.基于DSP的通用实时图像处理系统设计与研究[D].浙江大学,2014,02(01):16-17.
6卢京晶.基于DSP的实时图像处理系统的分析与应用[J].红外,2014,07(10):9-10.
7韩阳.DSP芯片在高性能图像处理技术中的应用研究[J].科技创新导报,2012,9(1):10-10. 被引量：2
8周磊,任国全,肖浩,李冬伟.结构化道路车道线快速检测的一种改进算法[J].计算机仿真,2012,29(4):362-366. 被引量：11
9谢一峰,袁建军,张伟军.车道线实时检测的形态学算法及其DSP实现[J].机电一体化,2013,19(3):26-29. 被引量：2
10王云建,孙志海,张桦.基于DM6446的车道线快速检测算法[J].杭州电子科技大学学报（自然科学版）,2013,33(2):37-40. 被引量：1

共引文献49

1党源源,王昕.CPU-GPU异构系统在光学遥感影像处理中的应用[J].红外与激光工程,2020(S01):177-185. 被引量：6
2卢浩,王少华,李绍俊,裘立,单庆超.基于OpenMP的并行化水文分析算法研究与实现[J].测绘与空间地理信息,2013,36(S1):7-10. 被引量：6
3喻君君,李刚.基于GPU的遥感影像加速处理算法[J].北京测绘,2010,24(2):88-90.
4詹总谦,卢亮.基于GPU并行处理技术的影像畸变差修正[J].测绘信息与工程,2011,36(2):1-3. 被引量：7
5王占刚,苑春方.GPU加速的二维地震波场模拟研究[J].计算机工程,2011,37(9):9-11. 被引量：1
6王结臣,王豹,胡玮,张辉.并行空间分析算法研究进展及评述[J].地理与地理信息科学,2011,27(6):1-5. 被引量：29
7傅政罗.大有拓展潜力的海湾六国市场[J].西亚非洲,2000(2):61-63. 被引量：2
8饶奋林.在VC++6.0下如何用事件与线程通讯使线程同步和终止[J].电脑编程技巧与维护,2000(5):57-59.
9苏俊英.一种多尺度高光谱影像小波分形维特征计算方法[J].遥感信息,2012,34(3):15-19. 被引量：1
10宋丽君,马骏,赖积保,余涛,李治.基于改进集群计算的遥感数据快速处理平台[J].福建电脑,2012,28(11):1-2.

同被引文献33

1郭磊,唐玉华,周杰,董亚卓.基于FPGA的Cholesky分解细粒度并行结构与实现[J].计算机研究与发展,2011,48(S1):258-265. 被引量：4
2万军,徐汀荣.基于Laplacian算子的图像边缘检测方法研究[J].现代电子技术,2004,27(21):92-93. 被引量：15
3左颢睿,张启衡,徐勇,赵汝进.基于GPU的快速Sobel边缘检测算法[J].光电工程,2009,36(1):8-12. 被引量：27
4邬贵明,窦勇,王淼.Cholesky分解细粒度并行算法[J].计算机工程与科学,2010,32(9):102-106. 被引量：6
5解庆春,张云泉,王可,李焱,许亚武.SIMD技术与向量数学库研究[J].计算机科学,2011,38(7):298-301. 被引量：10
6贾海鹏,张云泉,龙国平,徐建良,李焱.基于OpenCL的拉普拉斯图像增强算法优化研究[J].计算机科学,2012,39(5):271-277. 被引量：19
7贾迪,孟祥福,孟琭,董娜.RGB空间下结合高斯曼哈顿距离图的彩色图像边缘检测[J].电子学报,2014,42(2):257-263. 被引量：18
8李勇,陈书明,陈胜刚.一种基于FT-Matrix DSP的去块效应滤波算法的向量化实现[J].计算机工程与科学,2014,36(2):206-210. 被引量：1
9邹丹,窦勇,郭松.基于GPU的稀疏矩阵Cholesky分解[J].计算机学报,2014,37(7):1445-1454. 被引量：10
10周佩,周维超,王凯凯.TM S320C 6678多核DSP并行访问存储器性能的研究[J].微型机与应用,2014,33(13):20-24. 被引量：7

引证文献5

1范明亮,郭子涵,柴晓楠,商建东.面向FT-M7002的Sobel边缘检测算法优化实现[J].计算机工程,2022,48(6):193-199. 被引量：5
2李慧祥,张会福.面向FT-M7002的一种Cholesky分解向量处理算法[J].邵阳学院学报（自然科学版）,2022,19(3):9-17. 被引量：1
3王富平,于俊涛,张锲石.基于自适应方向导数滤波器的彩色边缘检测[J].计算机工程,2022,48(9):204-212.
4郭盼盼,陈梦雪,梁祖达,马晓畅,许邦建.面向FT-M7002平台点积算法的优化实现[J].计算机工程与科学,2022,44(11):1909-1917.
5郭子涵,范明亮,李靖,商建东.面向FT-M7002平台拉普拉斯算法的优化实现[J].计算机应用与软件,2024,41(10):276-281.

二级引证文献6

1刘泽平,刘明兴,李晓帆,姚明杰,麻方达,符朝兴.融合MOG2算法与FT算法的移动目标检测方法[J].青岛大学学报（工程技术版）,2022,37(2):61-66. 被引量：1
2郭盼盼,陈梦雪,梁祖达,马晓畅,许邦建.面向FT-M7002平台点积算法的优化实现[J].计算机工程与科学,2022,44(11):1909-1917.
3张立立,鲍喜荣,王彤,郭嘉林,杨金柱.基于图像处理技术的集成电路焊接质量监测系统研究[J].电子器件,2023,46(1):57-61. 被引量：2
4莫尚丰,周振芬,胡勇华,徐敏敏,毛春献,袁钰迪.基于FT-M7002的复数域行向量矩阵乘法移植与优化[J].计算机科学,2023,50(S02):827-832. 被引量：1
5李浩,支殿楠,张胜利,刘亚超,曾峰.基于机器视觉的码垛成品烟箱表面缺陷检测模型研究[J].制造业自动化,2023,45(11):10-14. 被引量：1
6毛羽,郑怀华,李隆,张傲.基于热红外图像的光伏板热斑检测方法研究[J].自动化仪表,2024,45(5):25-29.

1王瑞,王璐,杨卫华.涡轮叶片全表面换热特性试验研究[J].航空发动机,2019,45(4):42-46. 被引量：3
2蒋勋.生命是不会有真正的黑暗的[J].意林（原创版）,2021(7):1-1.
3本刊综合.一程山水一路诗,飞腾直欲天台去[J].浙江画报,2020(8):34-39.
4樊迪,王健,来金梅.FPGA中适用于低位宽乘累加的DSP块[J].复旦学报（自然科学版）,2020,59(5):575-584. 被引量：1

计算机工程

2021年第7期

浏览历史

内容加载中请稍等...

Canny边缘检测算法在飞腾平台上的实现与优化被引量：5

参考文献4

二级参考文献26

共引文献49

同被引文献33

引证文献5

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

Canny边缘检测算法在飞腾平台上的实现与优化 被引量：5

参考文献4

二级参考文献26

共引文献49

同被引文献33

引证文献5

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

Canny边缘检测算法在飞腾平台上的实现与优化被引量：5