-
题名OpenVX特征抽取函数在可编程并行架构的实现
被引量:1
- 1
-
-
作者
张好聪
李涛
邢立冬
潘风蕊
-
机构
西安邮电大学电子工程学院
西安邮电大学计算机学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2022年第7期1583-1593,共11页
-
基金
陕西省科技统筹项目(2015KTCQ013)
陕西省教育厅协同创新中心项目(17JF032)
陕西省教育厅科研计划项目(20JY058)。
-
文摘
针对数字图像处理计算量大、串行结构计算速度慢等特点,完成了最新的开源OpenVX计算机视觉加速规范1.3中底层特征抽取核函数的并行实现,使用自主设计的OpenVX可编程并行处理器进行了验证。在对图像的底层特征提取中,前期滤波及平滑处理选择OpenVX规范1.3中基本像素点处理函数ColorConvert(颜色转换)和局部图像处理函数GaussianFilter(高斯滤波)、MedianFilter(中值滤波)等,核心的特征抽取操作选择HarrisCorners(哈里斯角点检测)和CannyEdgeDetector(坎尼边缘检测)核函数,通过将计算量大的复杂结点拆分为多个简单结点,构建不同的基于图的执行模型,并映射在OpenVX并行处理器上,分别实现图像的边缘检测和特征点抽取。使用Verilog语言设计整体硬件电路,经Xilinx公司的FPGA芯片xcvu440-flga-2892-2-e综合验证,与串行映射结构相比,所选核函数在OpenVX可编程并行处理器上的并行加速比最高可达14.269。实验结果表明,OpenVX规范1.3中的核函数尤其是复杂核函数能够在本并行处理结构上达到预期的加速效果,且并行与串行结构加速比呈线性增长。
-
关键词
openvx规范1.3
计算机视觉函数
底层特征抽取
图执行模型
并行处理器
-
Keywords
openvx specification 1.3
computer vision function
low level feature extraction
graph execution model
parallel processor
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-
-
题名面向OpenVX核心图像处理函数的并行架构设计
被引量:2
- 2
-
-
作者
潘风蕊
李涛
邢立冬
张好聪
吴冠中
-
机构
西安邮电大学电子工程学院
西安邮电大学计算机学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2022年第7期1570-1582,共13页
-
基金
陕西省科技统筹项目(2015KTCQ013)
陕西省教育厅协同创新中心项目(17JF032)
陕西省教育厅科研计划项目(20JY058)。
-
文摘
传统的可编程处理器虽然高度灵活,但其处理速度及性能不及专用集成电路(ASIC),而图像处理往往是多样、密集且重复的操作,因此处理器要兼顾速度、性能及灵活性。OpenVX是图像图形处理、图计算和深度学习等应用的预处理或者辅助处理开源标准,基于最新的OpenVX 1.3标准中的核心图像处理函数库,设计并实现了一种可编程、可扩展的专用指令集处理器(ASIP)——OpenVX并行处理器。首先分析对比了各种互联网络的拓扑特性,选择了性能比较突出的层次交叉互联网络(HCCM+)作为系统主干,在网络节点处设置处理单元(PE)构成支持动态配置的4×4 PE阵列,结合高效的路由通信方式设计了并行处理器,实现可编程的图像处理。其次所提出的架构适合数据并行计算和新兴的图计算,两种计算模式可单独或混合配置使用,分别将核心视觉函数及图计算模型映射到并行处理器上对两种模式进行验证,对比PE数目不同的情况下图像处理的速度。实验结果表明,并行处理器能够完成对基本核心函数和高复杂度的图计算模型的映射,在数据并行计算和流水线处理两种模式下,可以对图像处理线性加速,调用16个PE对各类函数的平均加速比可达15.0375。验证环境采用20 nmXCVU440平台芯片,综合实现后频率为125 MHz。
-
关键词
openvx核心图像处理函数
专用指令集处理器(ASIP)
并行处理器
层次交叉互联网络(HCCM+)
图计算模型
-
Keywords
openvx kernel image processing functions
application specific instruction processor(ASIP)
parallel processor
hierarchically cross-connected mesh+(HCCM+)
graph calculation model
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-