期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于GPU的快速Sobel边缘检测算法 被引量:27
1
作者 左颢睿 张启衡 +1 位作者 徐勇 赵汝进 《光电工程》 CAS CSCD 北大核心 2009年第1期8-12,共5页
传统的Soble边缘检测算法的优化和实现都是针对常用处理器(CPU、DSP和FPGA等)提出的,难以应用在图像处理器(GPU)上。本文提出了一种基于NVIDIA公司CUDA架构图形处理器(GPU)的快速Sobel边缘检测算法。快速算法根据GPU的并行结构和硬件特... 传统的Soble边缘检测算法的优化和实现都是针对常用处理器(CPU、DSP和FPGA等)提出的,难以应用在图像处理器(GPU)上。本文提出了一种基于NVIDIA公司CUDA架构图形处理器(GPU)的快速Sobel边缘检测算法。快速算法根据GPU的并行结构和硬件特点,采用了纹理存储技术、多点访问技术和对称计算技术三种加速技术,优化了数据存储结构,提高了数据访问效率,降低了算法复杂度。实验结果表明,快速算法充分利用了GPU的并行处理能力,在处理4096×4096分辨力的8位灰度图像时速度可达190fps,是基于CPU实现的122倍。 展开更多
关键词 GPU CUDA SOBEL 边缘检测
下载PDF
基于GPU的并行优化技术 被引量:23
2
作者 左颢睿 张启衡 +1 位作者 徐勇 赵汝进 《计算机应用研究》 CSCD 北大核心 2009年第11期4115-4118,共4页
针对标准并行算法难以在图形处理器(GPU)上高效运行的问题,以累加和算法为例,基于Nvidia公司统一计算设备架构(CUDA)GPU介绍了指令优化、共享缓存冲突避免、解循环优化和线程过载优化四种优化方法。实验结果表明,并行优化能有效提高算法... 针对标准并行算法难以在图形处理器(GPU)上高效运行的问题,以累加和算法为例,基于Nvidia公司统一计算设备架构(CUDA)GPU介绍了指令优化、共享缓存冲突避免、解循环优化和线程过载优化四种优化方法。实验结果表明,并行优化能有效提高算法在GPU上的执行效率,优化后累加和算法的运算速度相比标准并行算法提高了约34倍,相比CPU串行实现提高了约70倍。 展开更多
关键词 图形处理器 并行优化 累加和 统一计算设备架构
下载PDF
一种基于特征点间线段倾角的姿态测量方法 被引量:9
3
作者 赵汝进 张启衡 +3 位作者 徐智勇 徐勇 左颢睿 吴明军 《光子学报》 EI CAS CSCD 北大核心 2010年第2期320-324,共5页
基于目标特征点间线段倾角信息,提出了一种适合于目标远距离成像和相机内参未知条件下解算目标姿态的目标3维姿态测量方法.采用仿真图像对该方法的正确性进行了验证.实验结果:姿态测量误差绝对值均值小于0.6°,且目标成像尺寸为350p... 基于目标特征点间线段倾角信息,提出了一种适合于目标远距离成像和相机内参未知条件下解算目标姿态的目标3维姿态测量方法.采用仿真图像对该方法的正确性进行了验证.实验结果:姿态测量误差绝对值均值小于0.6°,且目标成像尺寸为350pixel时,姿态测量误差绝对值小于0.5°.实验表明该算法具有较高解算准确度和较强的收敛性. 展开更多
关键词 三维姿态 单目视觉 特征点 姿态估计问题
下载PDF
嵌入掩膜的SPIHT任意形状ROI编码 被引量:4
4
作者 徐勇 徐智勇 +1 位作者 张启衡 左颢睿 《光电工程》 CAS CSCD 北大核心 2009年第9期118-124,共7页
感兴趣区域(ROI)编码可以在低码率条件下获得高质量的局部感兴趣区域,或在图像渐进传输中使感兴趣区域获得优先传输。本文在分析了当前各类ROI编码方法的基础上,基于SPIHT算法提出了一种支持多个任意形状感兴趣区域并生成可任意截断码流... 感兴趣区域(ROI)编码可以在低码率条件下获得高质量的局部感兴趣区域,或在图像渐进传输中使感兴趣区域获得优先传输。本文在分析了当前各类ROI编码方法的基础上,基于SPIHT算法提出了一种支持多个任意形状感兴趣区域并生成可任意截断码流的ROI编码算法。该算法在SPIHT算法中嵌入了重要系数的ROI掩膜信息,使编码器同步地进行图像和ROI形状的编码,使得生成的码流具有任意可截断的特性。文中还就图像ROI编码的质量评价指标进行了讨论,并给出了一种充分考虑ROI和背景的重要性与面积比例差别的图像质量评价指标,称为重要性-面积加权峰值信噪比(WPSNR)。实验结果表明,该算法支持有损到无损的多个任意形状ROI的图像编码,而且ROI优先级可调,能够生成具有嵌入式可截断性质的码流,在任意地方截断仍能保证解码器所需的图像信息和ROI掩膜信息,且计算复杂度和SPIHT相当,压缩效果高于BbB移位算法。适用于低码率应用或感兴趣优先渐进传输的应用。 展开更多
关键词 感兴趣区域编码 任意形状 SPIHT 图像压缩 掩膜
下载PDF
JPEG2000的一种编码前码率分配算法 被引量:4
5
作者 徐勇 徐智勇 +1 位作者 赵汝进 左颢睿 《光电工程》 CAS CSCD 北大核心 2008年第10期81-85,共5页
针对JPEG2000推荐的码率分配算法导致的计算冗余多、编码速度慢并且编码缓存大的不足,本文提出一种编码前最优分配码率的方法以提高JPEG2000的编码速度。该方法通过对小波系数失真模型的率失真理论分析,得出在总码率限制的情况下,使得... 针对JPEG2000推荐的码率分配算法导致的计算冗余多、编码速度慢并且编码缓存大的不足,本文提出一种编码前最优分配码率的方法以提高JPEG2000的编码速度。该方法通过对小波系数失真模型的率失真理论分析,得出在总码率限制的情况下,使得总体视觉加权失真最小的最佳码率分配准则,并根据该准则给出可实现的码率分配算法。实验表明,该方法可以实现精确有效的编码前码率预分配,做到了"所编即所需",加速了JPEG2000编码,满足高速编码和低缓存需求的要求。 展开更多
关键词 视觉加权 信息熵 率失真最佳 码率分配 JPEG2000
下载PDF
基于以太网的DSP远程加载技术研究 被引量:4
6
作者 左颢睿 刘永清 +1 位作者 张傲华 韩国荣 《单片机与嵌入式系统应用》 2012年第5期24-26,35,共4页
以TI公司的DSP为例对基于以太网的DSP远程加载技术进行研究。首先介绍了远程加载需要的硬件基础与软件基础,然后重点研究了基于以太网的远程加载的方法,包括远程加载流程、网络接口程序设计以及Flash存储模型设计。该方法实现了基于以... 以TI公司的DSP为例对基于以太网的DSP远程加载技术进行研究。首先介绍了远程加载需要的硬件基础与软件基础,然后重点研究了基于以太网的远程加载的方法,包括远程加载流程、网络接口程序设计以及Flash存储模型设计。该方法实现了基于以太网的DSP远程加载,为一系列嵌入式系统的远程加载技术提供了方法和思路。 展开更多
关键词 DSP 远程加载 以太网
下载PDF
TMS320C54x与CP2200的接口设计 被引量:2
7
作者 左颢睿 《单片机与嵌入式系统应用》 2007年第9期27-29,共3页
CP2200是Silabs公司2006年推出的一款网络接口芯片。其体积小,接口简单,容易与单片机、DSP等嵌入式处理器接口,广泛应用于需要网络接口的嵌入式系统中。本文详细介绍TMS320C5410与CP2200接口的软硬件设计方法。这些方法不仅能够在TMS320... CP2200是Silabs公司2006年推出的一款网络接口芯片。其体积小,接口简单,容易与单片机、DSP等嵌入式处理器接口,广泛应用于需要网络接口的嵌入式系统中。本文详细介绍TMS320C5410与CP2200接口的软硬件设计方法。这些方法不仅能够在TMS320C54x上实现网络接口,而且能够适用于多种平台。 展开更多
关键词 CP2200 TMS320C54X 接口设计
下载PDF
复杂场景下的红外目标检测 被引量:19
8
作者 张汝榛 张建林 +2 位作者 祁小平 左颢睿 徐智勇 《光电工程》 CAS CSCD 北大核心 2020年第10期126-135,共10页
主流的目标检测网络在高质量RGB图像上的目标检测能力突出,但应用于分辨率低的红外图像上时目标检测性能则有比较明显的下降。为了提高复杂场景下的红外目标检测识别能力,本文采用了以下措施:第一、借鉴领域自适应的方法,采用合适的红... 主流的目标检测网络在高质量RGB图像上的目标检测能力突出,但应用于分辨率低的红外图像上时目标检测性能则有比较明显的下降。为了提高复杂场景下的红外目标检测识别能力,本文采用了以下措施:第一、借鉴领域自适应的方法,采用合适的红外图像预处理手段,使红外图像更接近RGB图像,从而可以应用主流的目标检测网络进一步提高检测精度。第二、采用单阶段目标检测网络YOLOv3作为基础网络,并用GIOU损失函数代替原有的MSE损失函数。经实验验证,该算法在公开红外数据集FLIR上检测的准确率提升明显。第三、针对FLIR数据集存在的目标尺寸跨度大的问题,借鉴空间金字塔思想,加入SPP模块,丰富特征图的表达能力,扩大特征图的感受野。实验表明,所采用的方法可以进一步提高目标检测的精度。 展开更多
关键词 红外目标检测 深度学习 复杂场景
下载PDF
轻量化目标检测算法研究及应用 被引量:6
9
作者 黄靖淞 左颢睿 张建林 《计算机工程》 CAS CSCD 北大核心 2021年第10期236-241,共6页
基于卷积神经网络的目标检测算法在追求较高精度的同时,忽略了检测速度,使得算法难以在有限算力的情况下实现实时检测。在YOLO目标检测算法的基础上,采用一系列轻量化的方法,运用Mobilenetv1网络替换Darknet53基础网络,将YOLO head部分3... 基于卷积神经网络的目标检测算法在追求较高精度的同时,忽略了检测速度,使得算法难以在有限算力的情况下实现实时检测。在YOLO目标检测算法的基础上,采用一系列轻量化的方法,运用Mobilenetv1网络替换Darknet53基础网络,将YOLO head部分3×3标准卷积替换为深度可分离卷积,根据灵敏度对卷积层滤波器进行排序和修剪,并在嵌入式GPU TX2平台上进行C++推理部署。在VOC数据集上的测试结果表明,改进算法在精度仅下降0.75个百分点的前提下实现了2.4倍加速,模型占用内存仅为原来的21.5%。 展开更多
关键词 目标检测 轻量化 深度可分离卷积 剪枝 嵌入式GPU C++推理部署
下载PDF
基于GPU的小尺寸FFT在实时图像复原中的优化 被引量:2
10
作者 严发宝 苏艳蕊 +2 位作者 赵占锋 左颢睿 柳建新 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第10期2693-2698,共6页
为满足跟踪识别系统对图像复原的实时性需求,在图形处理器(GPU)上进行高效实现小尺寸二维FFT的优化策略研究。首先对二维FFT算法进行分析,根据图形处理器的特点,提出基于图形处理器的并行执行模型。基于该模型,从算法的复杂度、跳转指... 为满足跟踪识别系统对图像复原的实时性需求,在图形处理器(GPU)上进行高效实现小尺寸二维FFT的优化策略研究。首先对二维FFT算法进行分析,根据图形处理器的特点,提出基于图形处理器的并行执行模型。基于该模型,从算法的复杂度、跳转指令的数量、共享存储器的访问冲突以及共享存储器的访问延迟及图形处理器的利用效率这4个方面进行优化策略的研究,提出相应的优化方法。在图像复原的实验中,先对基于GPU的小尺寸FFT优化方法与基于CPU的MATLAB传统算法进行计算精度对比,然后基于4种不同尺寸的图像在相同的GPU平台上再与NVIDIA公司提供CUFFT函数库复原算法进行计算效率对比。研究结果表明:该优化方法提供的图像复原算法复原效果好,与MATLAB效果图比较人眼观察不出差异;在计算速率上,提出的优化方法能够在19.6 ms内复原1帧128×128灰度模糊图像,计算速度与直接采用CUFFT函数库算法相比提高约1.8倍。 展开更多
关键词 图形处理器 小尺寸FFT 图像复原 并行优化 实时处理
下载PDF
特征融合的核相关滤波跟踪算法 被引量:3
11
作者 吴昭童 左颢睿 +1 位作者 徐智勇 张建林 《国外电子测量技术》 2019年第2期50-55,共6页
针对目标跟踪过程中出现的形变、遮挡等干扰问题,通过结合基于模板匹配的核相关滤波算法(KCF)与颜色直方图统计模型,提出一种基于特征融合的尺度自适应的核相关滤波目标跟踪算法。首先分别训练KCF位置滤波器、前景与背景颜色模型以及尺... 针对目标跟踪过程中出现的形变、遮挡等干扰问题,通过结合基于模板匹配的核相关滤波算法(KCF)与颜色直方图统计模型,提出一种基于特征融合的尺度自适应的核相关滤波目标跟踪算法。首先分别训练KCF位置滤波器、前景与背景颜色模型以及尺度滤波器,检测时将得到的模板响应图与颜色统计概率图线性叠加,得到最终响应图,求得目标位置,然后根据尺度滤波器得到的响应图得到目标尺度。实验结果表明,该算法对形变、遮挡、尺度变化、光照变化、运动模糊、旋转等问题都能得到比较鲁棒的结果,在OTB数据集上的实验结果明显好于KCF和DSST,精确度为72.8%,稳定度为70.87%。 展开更多
关键词 目标跟踪 相关滤波 尺度自适应 颜色特征
下载PDF
基于OpenCL的FFT算法研究 被引量:2
12
作者 贾格 彭先蓉 左颢睿 《计算机应用与软件》 2017年第3期233-237,283,共6页
快速福利叶变换在图像处理领域,尤其是在图像复原算法中作为常用的计算工具,将时域计算转变为频域计算,在工程应用中有着非常重要的意义。采取多线程分块以及并行的映射方法,可以使FFT算法最大程度并行。针对OpenCL的存储层次特点和算... 快速福利叶变换在图像处理领域,尤其是在图像复原算法中作为常用的计算工具,将时域计算转变为频域计算,在工程应用中有着非常重要的意义。采取多线程分块以及并行的映射方法,可以使FFT算法最大程度并行。针对OpenCL的存储层次特点和算法层次的优化,在AMD GPU平台上取得了明显的加速效果。优化后的算法性能比具有相同处理能力的CPU平台提高了7倍,比具有相同处理能力的CUDA提高了4倍。 展开更多
关键词 傅里叶变换 OPENCL GPU并行加速
下载PDF
C6000系列DSP Flash二次加载技术研究 被引量:4
13
作者 左颢睿 《单片机与嵌入式系统应用》 2011年第7期65-66,68,共3页
引言 TI公司C6000系列DSP具有强大的处理能力,在嵌入式系统中有着广泛的应用。由于程序在DSP内部存储器的运行速度远大于片外存储器的运行速度,通常需要将程序从外部加载到DSP内部运行。
关键词 C6000 加载技术 DSP FLASH 运行速度 嵌入式系统 内部存储器 TI公司
下载PDF
TMS320 VC5410分页烧写Flash的多页程序并行自举 被引量:1
14
作者 左颢睿 李焱 马艳 《单片机与嵌入式系统应用》 2006年第1期21-23,共3页
以TMS320VC5410为例,介绍对Am29LV200BFlash存储器进行程序分页烧写以及上电后多页用户程序并行自举的方法。对多页Flash存储器的烧写,须在烧写过程中对已烧写的数据长度进行动态判断,当达到预定烧写长度后对Flash进行换页,然后继续烧写... 以TMS320VC5410为例,介绍对Am29LV200BFlash存储器进行程序分页烧写以及上电后多页用户程序并行自举的方法。对多页Flash存储器的烧写,须在烧写过程中对已烧写的数据长度进行动态判断,当达到预定烧写长度后对Flash进行换页,然后继续烧写,重复上述换页过程,直到程序烧写完为止。对多页程序的并行自举,在系统上电后,利用TI提供的自举程序,将一个用户自己编写的前导程序载入DSP,利用该前导程序将多页程序载入DSP来实现程序的自举。此方法适用于多种Flash芯片和C5000系列DSP。 展开更多
关键词 TMS320VC5410 芯片 FLASH存储器 多页程序 并行自举 分页烧写
下载PDF
TMS320VC5410A I/O口的多种扩展与I2C接口模拟
15
作者 左颢睿 《单片机与嵌入式系统应用》 2006年第7期33-35,共3页
TMS320VC5410A是一款功能强大的定点16位DSP,提供了丰富的片上外设,可以灵活地与多种外围设备进行通信;但是片上没有专用的I/O引脚,也没有I2C接口。本文通过TMS320VC5410A与语音芯片TLV320AIC23的I2C通信,介绍DSP的3种通用I/O扩展方式... TMS320VC5410A是一款功能强大的定点16位DSP,提供了丰富的片上外设,可以灵活地与多种外围设备进行通信;但是片上没有专用的I/O引脚,也没有I2C接口。本文通过TMS320VC5410A与语音芯片TLV320AIC23的I2C通信,介绍DSP的3种通用I/O扩展方式。这些方法不仅适用于TMS320VC5410A芯片,对于TI公司C5000系列芯片都具有通用性。 展开更多
关键词 TMS320VC5410A 通用I/O口 I^2C接口模拟 DSP
下载PDF
G.729A声码器在TMS320VC5410上的优化
16
作者 左颢睿 《单片机与嵌入式系统应用》 2006年第9期34-37,共4页
G.729A是ITU最新推出的语音编码标准G.729的简化版本。其16位定点标准C代码极易移植到TMS320VC5410平台上,但是标准C代码却很难在TMS320VC5410上实时实现。本文从改写C代码为C54x汇编语言着手,提出多种优化方法,大大降低了实现G.729A声... G.729A是ITU最新推出的语音编码标准G.729的简化版本。其16位定点标准C代码极易移植到TMS320VC5410平台上,但是标准C代码却很难在TMS320VC5410上实时实现。本文从改写C代码为C54x汇编语言着手,提出多种优化方法,大大降低了实现G.729A声码器的空间复杂度和时间复杂度。这些方法不仅适用于TMS320VC5410芯片,对于TI公司C5000系列芯片都具有通用性。 展开更多
关键词 G.729A 声码器 TMS320VC5410 优化实现
下载PDF
基于DSP的千兆以太网接口设计 被引量:5
17
作者 左颢睿 张启衡 +1 位作者 徐勇 赵汝进 《通信技术》 2010年第8期1-3,共3页
在高速信息处理系统中,DSP与其他模块间的通信能力已成为限制系统处理能力的瓶颈。千兆以太网技术具有传输速率高、距离远和成本低的优点,能够满足DSP高速远程数据传输的要求。以TI公司的TMS320C6455DSP芯片和VITESSE公司的VSC8201物理... 在高速信息处理系统中,DSP与其他模块间的通信能力已成为限制系统处理能力的瓶颈。千兆以太网技术具有传输速率高、距离远和成本低的优点,能够满足DSP高速远程数据传输的要求。以TI公司的TMS320C6455DSP芯片和VITESSE公司的VSC8201物理层芯片为例,从千兆以太网的接口电路设计,硬件接口驱动程序设计两个方面进行了研究,在TMS320C6455上实现了高速千兆以太网接口。实验结果显示,基于DSP的千兆以太网传输效率可达31%。 展开更多
关键词 数字信号处理器 千兆以太网 接口设计
原文传递
一种基于直线特征的单目视觉位姿测量方法 被引量:17
18
作者 赵汝进 张启衡 +1 位作者 左颢睿 吴明军 《光电子.激光》 EI CAS CSCD 北大核心 2010年第6期894-897,共4页
提出了一种基于直线特征的单目视觉位姿测量方法SoftNewton。构造了新颖的目标直线与图像直线匹配评价函数,避免检测图像中直线的端点,最终通过软决策技术确定直线特征匹配关系,并采用高斯牛顿迭代算法基于全透视成像模型解算目标位姿。... 提出了一种基于直线特征的单目视觉位姿测量方法SoftNewton。构造了新颖的目标直线与图像直线匹配评价函数,避免检测图像中直线的端点,最终通过软决策技术确定直线特征匹配关系,并采用高斯牛顿迭代算法基于全透视成像模型解算目标位姿。和POSIT算法相比,高斯牛顿迭代算法保持了旋转矩阵的正交性,提高位姿解算精度。仿真图像实验中,在干扰直线和噪声存在的情况下算法经过29次迭代解算得到正确的直线特征匹配矩阵,姿态误差小于0.2°,位移误差小于0.5 mm。仿真图像和实际图像实验结果均表明SoftNew-ton具有较高解算精度和较强的鲁棒性。 展开更多
关键词 单目视觉 位姿 软决策 高斯牛顿法
原文传递
基于去离群点策略提高目标位姿测量精度 被引量:6
19
作者 赵汝进 张启衡 +1 位作者 左颢睿 徐勇 《光学学报》 EI CAS CSCD 北大核心 2009年第9期2463-2467,共5页
针对在单目视觉目标位姿测量过程中,特征点提取出现离群点的情况,提出一种基于去除离群点策略的位姿测量方法(ORPE)。建立了以特征点误差极大极小为原则的最优化目标函数,通过确定特征点最大观测误差值边界,判定并去除离群点,由此可消... 针对在单目视觉目标位姿测量过程中,特征点提取出现离群点的情况,提出一种基于去除离群点策略的位姿测量方法(ORPE)。建立了以特征点误差极大极小为原则的最优化目标函数,通过确定特征点最大观测误差值边界,判定并去除离群点,由此可消除离群点误差对位姿测量的影响。仿真实验使用ORPE对1 m×1 m×1 m的立方体目标进行位姿测量,验证了算法的正确性;使用ORPE测量Boeing飞机模型的位姿,平均姿态角误差2.07°,平均位移误差1.6%。通过和最小二乘测姿法(LSPE)结果对比分析可得ORPE法误差小于LSPE法误差。表明ORPE能有效去除离群点,同时提高位姿测量精度。 展开更多
关键词 机器视觉 位姿 单目视觉 离群点 N点透视
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部