面向OpenVX核心图像处理函数的并行架构设计被引量：2

Parallel Architecture Design for OpenVX Kernel Image Processing Functions

下载PDF

导出

摘要传统的可编程处理器虽然高度灵活,但其处理速度及性能不及专用集成电路(ASIC),而图像处理往往是多样、密集且重复的操作,因此处理器要兼顾速度、性能及灵活性。OpenVX是图像图形处理、图计算和深度学习等应用的预处理或者辅助处理开源标准,基于最新的OpenVX 1.3标准中的核心图像处理函数库,设计并实现了一种可编程、可扩展的专用指令集处理器(ASIP)——OpenVX并行处理器。首先分析对比了各种互联网络的拓扑特性,选择了性能比较突出的层次交叉互联网络(HCCM+)作为系统主干,在网络节点处设置处理单元(PE)构成支持动态配置的4×4 PE阵列,结合高效的路由通信方式设计了并行处理器,实现可编程的图像处理。其次所提出的架构适合数据并行计算和新兴的图计算,两种计算模式可单独或混合配置使用,分别将核心视觉函数及图计算模型映射到并行处理器上对两种模式进行验证,对比PE数目不同的情况下图像处理的速度。实验结果表明,并行处理器能够完成对基本核心函数和高复杂度的图计算模型的映射,在数据并行计算和流水线处理两种模式下,可以对图像处理线性加速,调用16个PE对各类函数的平均加速比可达15.0375。验证环境采用20 nmXCVU440平台芯片,综合实现后频率为125 MHz。 Although the traditional programmable processors are highly flexible,their processing speed and perfor mance are inferior to the application specific integrated circuit(ASIC).Image processing is often a diverse,intensive and repetitive operation,so the processor must balance speed,performance and flexibility.OpenVX is an open source standard for preprocessing or auxiliary processing of image processing,graph computing and deep learning applications.Aiming at the kernel visual function library of OpenVX 1.3 standard,this paper designs and implements a programmable and extensible OpenVX parallel processor.The architecture adopts an application specific instruction processor(ASIP).After analyzing and comparing the topological characteristics of various interconnection networks,the backbone of the ASIP chooses the hierarchically cross-connected Mesh+(HCCM+)with outstanding performance,and processing element(PE)is set at network nodes.PE array is constructed to support dynamic configuration,and a parallel processor is designed to realize programmable image processing based on efficient routing and com munication.The proposed architecture is suitable for data parallel computing and emerging graph computing.The two computing modes can be configured separately or mixed.The kernel visual function and graph computing model are mapped to the parallel processor respectively to verify the two modes and compare the image processing speed under different PE numbers.The results show that OpenVX parallel processor can complete the mapping and linear speedup of kernel functions and high complexity graph calculation model.The average speedup of scheduling 16 PEs to various functions is approximately 15.0375.When implemented on an FPGA board with a 20 nm XCVU440 device,the prototype can run at a frequency of 125 MHz.

作者潘风蕊李涛邢立冬张好聪吴冠中 PAN Fengrui;LI Tao;XING Lidong;ZHANG Haocong;WU Guanzhong(School of Electronic Engineering,Xi’an University of Posts&Telecommunications,Xi􀆳an 710121,China;School of Computer Science&Technology,Xi’an University of Posts&Telecommunications,Xi􀆳an 710121,China)

机构地区西安邮电大学电子工程学院西安邮电大学计算机学院

出处《计算机科学与探索》 CSCD 北大核心 2022年第7期1570-1582,共13页 Journal of Frontiers of Computer Science and Technology

基金陕西省科技统筹项目(2015KTCQ013) 陕西省教育厅协同创新中心项目(17JF032) 陕西省教育厅科研计划项目(20JY058)。

关键词 OpenVX核心图像处理函数专用指令集处理器(ASIP) 并行处理器层次交叉互联网络(HCCM+) 图计算模型 OpenVX kernel image processing functions application specific instruction processor(ASIP) parallel processor hierarchically cross-connected mesh+(HCCM+) graph calculation model

分类号 TP302 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献9

1李雅琪,冯晓辉,王哲.计算机视觉技术的应用进展[J].人工智能,2019,0(2):18-27. 被引量：19
2山蕊,李涛,蒋林,邓军勇,杨博文,沈绪榜.视觉阵列处理器超越函数加速单元设计[J].西安电子科技大学学报,2018,45(4):166-173. 被引量：1
3Gert Goossens.专用指令集处理器设计的架构性研究[J].中国集成电路,2013,22(10):41-43. 被引量：1
4李涛,杨婷,易学渊,蒲林,钱博文,黄光新,黄虎才,韩俊刚.萤火虫2:一种多态并行机的硬件体系结构[J].计算机工程与科学,2014,36(2):191-200. 被引量：16
5孙建,李涛,李雪丹.基于PAAG的图形图像算法的并行实现[J].计算机技术与发展,2015,25(11):61-66. 被引量：3
6李涛,孙建,王鹏博.基于PAAG的OpenVX核心库函数并行化实现[J].西安邮电大学学报,2015,20(2):7-10. 被引量：5
7李海玲,张昊.卷积边界扩展研究与实现[J].微型电脑应用,2018,34(10):47-49. 被引量：6
8艾扬利,杨兵.基于FPGA的Sobel算子并行计算研究[J].现代电子技术,2005,28(9):42-43. 被引量：11
9官鑫,王黎,高晓蓉,王泽勇.图像边缘检测Sobel算法的FPGA仿真与实现[J].现代电子技术,2009,32(8):109-111. 被引量：19

二级参考文献64

1谭会生,桂卫华,刘展良.基于EDA技术的图像边缘检测协处理器的设计[J].包装工程,2004,25(6):102-104. 被引量：7
2董冬.图像边缘检测方法简介[J].试验技术与试验机,2004,44(3):64-66. 被引量：4
3段瑞玲,李庆祥,李玉和.图像边缘检测方法研究综述[J].光学技术,2005,31(3):415-419. 被引量：377
4胡亮,段发阶,丁克勤,叶声华.基于FPGA图像处理技术在钢板表面缺陷检测系统中的应用[J].传感技术学报,2006,19(3):694-696. 被引量：15
5王鹏,于锦海.图像处理中卷积理论的数学基础[J].微计算机信息,2006(08S):209-210. 被引量：8
6严国萍,何俊峰.高斯-拉普拉斯边缘检测算子的扩展研究[J].华中科技大学学报（自然科学版）,2006,34(10):21-23. 被引量：18
7宇野由麻子大石基之成英.FPGA产品市场现状与展望.电子设计应用,2004,(12):60-62,65.
8Mohsen Sharifi, Mahmoud Fathy, Maryam Tayefeh Mah - moudi. A Classified and Comparative Study of Edge Detection Algorithms[A]. Proceedings of the International Conference on Information Technology: Coding and Computing [C]. Iran, 2002:117 - 120.
9黄剑玲,邹辉.基于高斯Laplace算子图像边缘检测的改进[J].微电子学与计算机,2007,24(9):155-157. 被引量：18
10ACEX 1K Programmable Logic Device Family.Altera Company,2001,ver.3.3.

共引文献66

1徐晨.美国计算机视觉技术发展与军事应用[J].电子元器件与信息技术,2022,6(8):8-12.
2汪祥,毛谦敏,王琳.流媒体与图像处理的多工位燃气表检定系统[J].中国计量学院学报,2010,21(3):222-226.
3江洁,邓珏琼,张广军,周富强.光条纹中心的实时快速提取[J].光学技术,2008,34(2):170-173. 被引量：13
4亓静,刘萍.基于System Generator的字符分割算法的并行实现[J].现代电子技术,2009,32(14):10-13.
5李明,赵勋杰,毛伟民.Sobel边缘检测的FPGA实现[J].现代电子技术,2009,32(16):44-46. 被引量：28
6李同宇,任文平,贾赞.图像边缘检测电路的FPGA设计[J].科技信息,2009(31).
7张丽红,凌朝东.基于FPGA的Sobel边缘检测应用[J].电子技术应用,2011,37(8):26-29. 被引量：13
8崔赫琳,党正.一种基于空域灰预测的边缘检测改进方法[J].电子设计工程,2011,19(17):156-158. 被引量：1
9付兴建,王舰,吕明丽,李丹,吕中伟.基于MFC编程的图像处理在核医学中的应用[J].微计算机信息,2012,28(4):157-159.
10谢昭莉,王壬,张德全.基于图像识别的井下机车轨道检测方法[J].计算机工程,2012,38(14):147-149. 被引量：5

同被引文献44

1屈洪春,姚献慧,尹力.多Agent系统在空间直观仿真建模中的并行化[J].系统仿真学报,2020,32(3):446-454. 被引量：4
2姚永祥,张永军,万一,刘欣怡,郭浩宇.顾及各向异性加权力矩与绝对相位方向的异源影像匹配[J].武汉大学学报（信息科学版）,2021,46(11):1727-1736. 被引量：26
3易杨,张尧,钟庆.基于蒙特卡罗方法的大型电力用户电压暂降评估[J].电网技术,2008,32(6):57-60. 被引量：35
4罗彬,刘汉伟,梅涛,肖汉.基于PSD-BPA的电网潮流稳定计算分析平台开发与应用[J].电力系统自动化,2012,36(17):119-123. 被引量：14
5张逸,杨洪耕,叶茂清,杨茂,林瑞星.基于多Agent的电能质量辅助服务平台[J].电力自动化设备,2012,32(12):92-97. 被引量：10
6易杨,常宝立,李力,毕兆东,辛拓,谭伟.PSD-BPA潮流计算数据卡的自动批量生成和修改[J].电力系统自动化,2013,37(10):124-128. 被引量：16
7曾江,蔡东阳.基于组合权重的蒙特卡洛电压暂降评估方法[J].电网技术,2016,40(5):1469-1475. 被引量：32
8李长松,陈韵竹,肖先勇,马愿谦.电压暂降保险机制的量化分析[J].电力系统自动化,2017,41(14):99-104. 被引量：13
9叶曦,刘开培,李志伟.不确定条件下计及线路保护动作特性的电压暂降频次评估[J].电力自动化设备,2018,38(3):169-176. 被引量：16
10张逸,彭灿,张默霓.基于移动Agent的电能质量监测数据管理方案[J].电力系统自动化,2015,39(22):164-169. 被引量：6

引证文献2

1黄佳铭,张逸,陈晶腾,高漩,贾荣,吴逸帆.基于多Agent系统的大型电网电压暂降评估[J].电力系统保护与控制,2023,51(10):45-53. 被引量：3
2赵丽斌,杜娇娇,贺铮,王祝先,韩宏亮,范蕊,徐翌博.无人机遥感图像几何畸变校正全过程控制方法研究[J].计算机测量与控制,2024,32(7):133-139.

二级引证文献3

1谢欣玲.减少变电站负荷损失的低压脱扣器保护配置研究[J].电工技术,2023(23):147-149.
2胡海燕.电压暂降对聚丙烯装置高压机组的暂态影响[J].安全、健康和环境,2024,24(2):17-21.
3肖先勇,宋桂山,胡文曦,梁晓锐,刘惠聪,汪颖.有源配电网电压暂降评估方法的挑战与展望[J].供用电,2024,41(8):25-34.

1张好聪,李涛,邢立冬,潘风蕊.OpenVX特征抽取函数在可编程并行架构的实现[J].计算机科学与探索,2022,16(7):1583-1593. 被引量：1
2彭日光,彭爽,杜琦.一种硬件加速OpenCV的图像处理方法研究[J].电子技术与软件工程,2022(7):66-71.
3陈炀,单译琳,杨倬波,李海,张宪民.激光诱导前向转移中传输过程对银浆薄膜均匀度影响研究[J].机床与液压,2022,50(7):12-16.
4王建梅,刘贺贺,马盛超,席洋,张荣萍,徐倩,李亮.鸟类羽色性别二态性形成机制研究进展[J].遗传,2022,44(6):491-500. 被引量：1
5程利芳.矩阵的几类常见乘积及其应用[J].郑州航空工业管理学院学报,2022,40(4):108-112.
6黄水湖,洪梅,方水凉,高珊.某三甲医院静配中心外购药使用情况调查分析[J].基层医学论坛,2022,26(19):99-101. 被引量：4
7李星.把握历史机遇推进IPv6发展[J].软件和集成电路,2022(6):54-57. 被引量：2
8胡坤焌,黄元峰.基于100G以太网的一种并行CRC算法[J].电脑知识与技术,2022,18(13):37-39.
9李建东,孟广双,严利民.用于智能机器人的数据驱动多核视觉识别系统[J].电动工具,2022(1):8-13.
10张丽,李杰,付琳,刘丽,杨恒,王高富,任航行,周鹏,董贤文.LncRNA TCONS_00153149基因在酉州乌羊皮肤黑色素沉积过程中的作用[J].农业生物技术学报,2022,30(5):908-917.

计算机科学与探索

2022年第7期

浏览历史

内容加载中请稍等...

面向OpenVX核心图像处理函数的并行架构设计被引量：2

参考文献9

二级参考文献64

共引文献66

同被引文献44

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

面向OpenVX核心图像处理函数的并行架构设计 被引量：2

参考文献9

二级参考文献64

共引文献66

同被引文献44

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

面向OpenVX核心图像处理函数的并行架构设计被引量：2