期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
A Fast Depth-Map Generation Algorithm based on Motion Search from 2D Video Contents 被引量:1
1
作者 Weiwei Wang Yuesheng Zhu 《Journal of Software Engineering and Applications》 2012年第12期144-148,共5页
Generation of a depth-map from 2D video is the kernel of DIBR (Depth Image Based Rendering) in 2D-3D video conversion systems. However it occupies over most of the system resource where the motion search module takes ... Generation of a depth-map from 2D video is the kernel of DIBR (Depth Image Based Rendering) in 2D-3D video conversion systems. However it occupies over most of the system resource where the motion search module takes up 90% time-consuming in typical motion estimation-based depth-map generation algorithms. In order to reduce the computational complexity, in this paper a new fast depth-map generation algorithm based on motion search is developed, in which a fast diamond search algorithm is adopted to decide whether a 16x16 or 4x4 block size is used based on Sobel operator in the motion search module to obtain a sub-depth-map. Then the sub-depth-map will be fused with the sub-depth-maps gotten from depth from color component Cr and depth from linear perspective modules to compensate and refine detail of the depth-map, finally obtain a better depth-map. The simulation results demonstrate that the new approach can greatly reduce over 50% computational complexity compared to other existing methods. 展开更多
关键词 BLOCK-MATCHING depth-map motion SEARCH DIBR
下载PDF
Combining Multi-scale Directed Depth Motion Maps and Log-Gabor Filters for Human Action Recognition
2
作者 Xiaoye Zhao Xunsheng Ji +1 位作者 Yuanxiang Li Li Peng 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2019年第4期89-96,共8页
Recognition of the human actions by computer vision has become an active research area in recent years. Due to the speed and the high similarity of the actions, the current algorithms cannot get high recognition rate.... Recognition of the human actions by computer vision has become an active research area in recent years. Due to the speed and the high similarity of the actions, the current algorithms cannot get high recognition rate. A new recognition method of the human action is proposed with the multi-scale directed depth motion maps(MsdDMMs) and Log-Gabor filters. According to the difference between the speed and time order of an action, MsdDMMs is proposed under the energy framework. Meanwhile, Log-Gabor is utilized to describe the texture details of MsdDMMs for the motion characteristics. It can easily satisfy both the texture characterization and the visual features of human eye. Furthermore, the collaborative representation is employed as action recognition by the classification. Experimental results show that the proposed algorithm, which is applied in the MSRAction3 D dataset and MSRGesture3 D dataset, can achieve the accuracy of 95.79% and 96.43% respectively. It also has higher accuracy than the existing algorithms, such as super normal vector(SNV), hierarchical recurrent neural network(Hierarchical RNN). 展开更多
关键词 human action recognition depth motion mapS LOG-GABOR filters collaborative representation based CLASSIFIER
下载PDF
基于映射空间编码的高速运动轨道图像去模糊研究 被引量:1
3
作者 鄢化彪 刘词波 +1 位作者 黄绿娥 赵恒 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第2期812-825,共14页
针对轨道缺陷检测系统因镜头抖动或相机快速移动而导致所采集图像较为模糊的问题,提出一种基于最大后验概率估计思想的映射空间编码的高速运动轨道图像去模糊算法。首先,该算法使用深度编解码器和残差网络分别对数据集中清晰图像到模糊... 针对轨道缺陷检测系统因镜头抖动或相机快速移动而导致所采集图像较为模糊的问题,提出一种基于最大后验概率估计思想的映射空间编码的高速运动轨道图像去模糊算法。首先,该算法使用深度编解码器和残差网络分别对数据集中清晰图像到模糊图像的映射关系和模糊核进行编码,为了保证编码时频率信息的完整性,算法在传统的残差模块上引入快速傅里叶变换通道构成双通道残差网络,以补偿多次特征提取带来的频率损失;其次,算法采用深度图像先验(Deep Image Prior,DIP)将潜在的清晰图像和模糊核进行参数化,再利用先验得到的模糊核和清晰图像来调用编码空间中的映射关系;最后,通过交替优化潜在的清晰图像和模糊核,从而去逼近一个真实未知的映射,进而实现真实场景下高速运动轨道图像的去模糊。实验结果表明,双通道残差模块提取的特征图频率信息分量强度普遍高于传统的残差模块,相较于使用传统残差模块实现该算法,采用双通道残差模块可使峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)提升0.84 dB,结构相似性(Structural Similarity,SSIM)提高0.025 1。与现有的深度学习去模糊算法相比,提出的去模糊算法对高速轨道检测系统所采集图像的去模糊效果更佳,在性能方面相较于最好的去模糊算法,PSNR提高了1.84 dB,SSIM提升了0.017 3,显著提升了采集图像的质量。研究结果可为下一步识别轨道部件是否存在缺陷提供清晰图像。 展开更多
关键词 运动去模糊 编码-解码器 映射空间 深度图像先验 残差网络
下载PDF
基于深度相机和二维码的室内移动机器人定位技术 被引量:1
4
作者 唐振宇 张兆威 蒋林 《农业装备与车辆工程》 2024年第6期124-129,共6页
提出一种以ORB_SLAM2为基本框架、使用二维码辅助深度相机的室内移动机器人定位方法。针对现有的视觉SLAM在定位过程中出现的Z轴漂移现象,提出平面运动模型约束,以降低机器人定位结果中的Z轴累计误差;针对视觉SLAM在弱纹理环境中算法退... 提出一种以ORB_SLAM2为基本框架、使用二维码辅助深度相机的室内移动机器人定位方法。针对现有的视觉SLAM在定位过程中出现的Z轴漂移现象,提出平面运动模型约束,以降低机器人定位结果中的Z轴累计误差;针对视觉SLAM在弱纹理环境中算法退化、容易跟踪失败等问题,在室内环境中张贴二维码并将其数学模型作为定位约束,以提高系统的准确性与鲁棒性。真实环境下的实验结果表明:相比原始算法,所提算法在Z轴精度上提高了42.95%;以ORB_SLAM3的定位结果为真值,所提算法的定位精度提高了4.11%,该算法在室内环境下具有定位优势。 展开更多
关键词 移动机器人 同步定位 地图构建 深度相机 二维码 平面运动模型约束
下载PDF
基于Quaternion-Gabor小波运动估计的深度图获取技术
5
作者 罗桂娥 徐运彬 《计算机应用》 CSCD 北大核心 2012年第1期238-240,244,共4页
深度图是"二维视频+深度图"格式3D显示器的关键技术所在。在对四元数及Gabor滤波器进行研究的基础上提出了基于Quaternion-Gabor小波运动估计的深度图获取技术。通过计算普通视频运动图像的全局运动向量,估计出图像背景运动模... 深度图是"二维视频+深度图"格式3D显示器的关键技术所在。在对四元数及Gabor滤波器进行研究的基础上提出了基于Quaternion-Gabor小波运动估计的深度图获取技术。通过计算普通视频运动图像的全局运动向量,估计出图像背景运动模型,获得图像运动场,最后分离出图像的前景与背景,从而得到图像的深度图。将普通的Gabor滤波器扩展到Quaternion-Gabor滤波器,不仅把图像变换到频率域获得额外的信息,而且可以对每个像素的RGB分别独立滤波。实验结果表明,使用Quaternion-Gabor小波运动估计方法得到的深度图变化很平滑,边缘更突出。 展开更多
关键词 二维视频 深度图 四元数 小波 运动估计
下载PDF
一种利用MAP估计的双目运动体视算法
6
作者 杨敬安 《电子学报》 EI CAS CSCD 北大核心 1997年第1期50-53,共4页
本文提出一种融合运动和体视信息的运动与结构参数的鲁棒估计算法.算法首先通过计算瞬时FOE,实现对每个像素处位移的MAP估计,并计算关联的置信度;然后利用位移估计,从两图像序列之一计算相对深度,导出能用于匹配两体视图像... 本文提出一种融合运动和体视信息的运动与结构参数的鲁棒估计算法.算法首先通过计算瞬时FOE,实现对每个像素处位移的MAP估计,并计算关联的置信度;然后利用位移估计,从两图像序列之一计算相对深度,导出能用于匹配两体视图像序列的视差先验概率分布,使体视对的两帧图像匹配,确定3D景物深度.算法可方便地估计每个像素处的视差,不需对表面作平滑假设. 展开更多
关键词 双目运动体视 map估计 鲁棒估计算法
下载PDF
深度视频下的人体动作识别研究 被引量:1
7
作者 邢蒙蒙 杨锋 +1 位作者 辛在海 魏国辉 《中国医疗设备》 2023年第1期36-41,共6页
目的基于RGB视频序列分类是实现人体动作识别的主要方式,但是RGB视频在记录人体动作的同时会清晰地保存人体的面部信息,为保护隐私,本文提出基于深度视频进行人体动作识别。方法利用公开数据集UTD-MHAD中27种深度视频形式的动作数据进... 目的基于RGB视频序列分类是实现人体动作识别的主要方式,但是RGB视频在记录人体动作的同时会清晰地保存人体的面部信息,为保护隐私,本文提出基于深度视频进行人体动作识别。方法利用公开数据集UTD-MHAD中27种深度视频形式的动作数据进行研究。首先,将深度视频序列进行预处理转化成运动历史图,通过伪彩色编码增强运动历史图的细节信息;其次,将经过伪彩色编码的运动历史图送入经过预训练的卷积神经网络提取运动历史图的深度特征向量;最后运用分类器进行分类。结果基于深度视频序列的人体动作识别方法在UTD-MHAD数据集上取得了90.02%的准确率,误差为1.8%。结论本文提出的基于深度视频序列的人体动作识别方法具有一定的有效性,可作为人体动作识别领域一种新型的无监督康复锻炼手段,有助于促进康复评定研究进一步标准化。 展开更多
关键词 深度视频 人体动作识别 运动历史图 卷积神经网络
下载PDF
深度运动图耦合正则化表示的行为识别算法 被引量:8
8
作者 李贤阳 阳建中 +1 位作者 杨竣辉 陆安山 《电子测量与仪器学报》 CSCD 北大核心 2018年第1期119-128,共10页
为了提高图像行为的识别精度,使其能够准确判别行为识别中的微小变化以及遮挡问题,提出了基于深度运动图(depth motion maps,DMM)与正则化协同表示的行为识别算法。首先,将深度图像序列投射到3个正交平面上,得到了3个方向的投射图。对... 为了提高图像行为的识别精度,使其能够准确判别行为识别中的微小变化以及遮挡问题,提出了基于深度运动图(depth motion maps,DMM)与正则化协同表示的行为识别算法。首先,将深度图像序列投射到3个正交平面上,得到了3个方向的投射图。对于不同的投射图,通过测量两个连续映射之间的绝对差值来表示运动能量,并将所有深度图像序列中运动能量进行叠加,获得了3个方向的深度运动图。随后,根据这些投射图,DMM能从多个方向获取更多具有判别力的运动信息。再引入Hough变换(Hough transform,HT)算子,提取DMM中3个方向的HT特征,并其进行归一化融合,获取DMM-HT特征。最后,引入Tikhonov正则化计算系数向量,构建正则化协同表示分类器,对每个位置样本的分类标签完成深度行为分类学习,实现人体行为的准确识别。实验数据表明,与当前行为识别技术相比,算法具有更强的鲁棒性,能完成各种行为的识别,在遮挡、噪声等干扰条件下具有更高的识别精度。所提算法能够较好地适应复杂环境下的人体动作准确识别,在智能家居、视频监测、人机交互等领域具有良好的参考价值。 展开更多
关键词 深度运动图 行为识别 运动能量 正则化协同表示 HOUGH变换
下载PDF
特征法视觉SLAM逆深度滤波的三维重建 被引量:14
9
作者 张一 姜挺 +2 位作者 江刚武 余岸竹 于英 《测绘学报》 EI CSCD 北大核心 2019年第6期708-717,共10页
针对现有特征法视觉SLAM只能重建稀疏点云、非关键帧对地图点深度估计无贡献等问题,本文提出一种特征法视觉SLAM逆深度滤波的三维重建方法,可利用视频序列影像实时、增量式地构建相对稠密的场景结构.具体来说,设计了一种基于运动模型的... 针对现有特征法视觉SLAM只能重建稀疏点云、非关键帧对地图点深度估计无贡献等问题,本文提出一种特征法视觉SLAM逆深度滤波的三维重建方法,可利用视频序列影像实时、增量式地构建相对稠密的场景结构.具体来说,设计了一种基于运动模型的关键帧追踪流程,能够提供精确的相对位姿关系;采用一种基于概率分布的逆深度滤波器,地图点通过多帧信息累积、更新得到,而不再由两帧三角化直接获取;提出一种基于特征法与直接法的后端混合优化框架,以及基于平差约束的地图点筛选策略,可以准确、高效解算相机位姿与场景结构.试验结果表明,与现有方法相比,本文方法具有更高的计算效率和位姿估计精度,而且能够重建出全局一致的较稠密点云地图. 展开更多
关键词 视觉即时定位与地图构建 三维重建 逆深度滤波器 运动模型 后端混合优化框架
下载PDF
基于图层优化与融合的2D—3D视频转换方法 被引量:4
10
作者 刘伟 吴毅红 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2012年第11期1426-1439,共14页
为了缓解3D片源的不足,在结构化重建技术的基础上提出一种基于图层优化与融合的2D—3D视频转换方法.首先通过分段化结构重建框架得到场景离散的3D结构信息;然后以此为深度线索,使用一种扩展的GrabCut交互式分割方法提取出不同物体所在... 为了缓解3D片源的不足,在结构化重建技术的基础上提出一种基于图层优化与融合的2D—3D视频转换方法.首先通过分段化结构重建框架得到场景离散的3D结构信息;然后以此为深度线索,使用一种扩展的GrabCut交互式分割方法提取出不同物体所在的图层,在每个图层上先对深度进行稠密扩散,再结合多种约束采用优化算法来增强区域层次感;最后将不同图层的深度根据视觉显著性特征进行融合,从而完成2D—3D视频转换.实验和评估结果表明,该方法可以得到令人满意的转换效果. 展开更多
关键词 2D-3D 图层 结构重建 深度图
下载PDF
煤矿井下移动机器人深度视觉自主导航研究 被引量:39
11
作者 马宏伟 王岩 杨林 《煤炭学报》 EI CAS CSCD 北大核心 2020年第6期2193-2206,共14页
煤矿井下移动机器人是煤矿机器人的主力军,煤矿井下移动机器人的自主导航是其研究的难点和热点。目前,煤矿井下移动机器人自主导航所必须的三维环境数据库尚未形成,尤其是制作高分辨率、多信息融合的煤矿井下高精度地图还处于研究阶段... 煤矿井下移动机器人是煤矿机器人的主力军,煤矿井下移动机器人的自主导航是其研究的难点和热点。目前,煤矿井下移动机器人自主导航所必须的三维环境数据库尚未形成,尤其是制作高分辨率、多信息融合的煤矿井下高精度地图还处于研究阶段。为了有效解决煤矿井下移动机器人自主导航问题,构建了基于深度相机的机器视觉系统,提出了一种基于深度视觉的导航方法,自主导航过程分为地图创建与自主运行两个阶段。在地图创建中:①对深度视觉数据进行特征提取与匹配,利用10组煤矿井下真实视频截图,对比测试5种特征提取与匹配组合算法,结果表明SURF+SURF+FLANN与GFTT+BRIEF+BF算法能够在煤矿井下获得良好匹配结果;②建立煤矿井下移动机器人深度视觉定位与建图问题的捆集调整迭代最近点图模型(Iterative Closest Points Bundle Adjustment,ICP BA);③通过图优化方式估计当前观测下的最优位姿与环境路标点坐标。在实验室场景中利用提出的ICP-BA图优化算法,建立了包含关键位姿与三维环境点的原始点云地图。在自主运行阶段:①通过八叉树数据结构,将点云地图转化为移动机器人运动规划可使用的Octomap导航地图,实验结果表明,Octomap导航地图分辨率可调、系统资源占用低、索引效率高;②使用三维到二维映射的视觉图匹配PNP(Perspective N Points)方法进行实时在线重定位;③基于图搜索的A*(A Star)路径规划作为轨迹规划初值,自定义最小化能量损失泛函为最小化加加速度的变化率(Minimum-Snap)求解2次规划问题,生成用于煤矿井下移动机器人运动执行的轨迹。在Matlab开发环境中设计随机导航地图,生成时间分配、位置、速度、加速度、加加速度的最优轨迹规划结果,验证了运动规划算法的正确性。通过理论分析和实验验证,表明笔者提出的煤矿井下移动机器人深度视觉自主导航方法的有效性。 展开更多
关键词 煤矿井下移动机器人 自主导航 深度视觉 地图创建 重定位 运动规划
下载PDF
一种基于MEM-LBP的动作特征提取及识别方法 被引量:5
12
作者 陈恩庆 樊军博 《计算机应用研究》 CSCD 北大核心 2018年第4期1277-1280,共4页
针对动作识别中如何有效地利用人体运动的三维信息的问题,提出一种新的基于深度视频序列的特征提取和识别方法。该方法首先运用运动能量模型(MEM)来表征人体动态特征,即先将整个深度视频序列投影到三个正交的笛卡尔平面上,再把每个投影... 针对动作识别中如何有效地利用人体运动的三维信息的问题,提出一种新的基于深度视频序列的特征提取和识别方法。该方法首先运用运动能量模型(MEM)来表征人体动态特征,即先将整个深度视频序列投影到三个正交的笛卡尔平面上,再把每个投影面的视频序系列划分为能量均等的子时间序列,分别计算子序列的深度运动图能量,从而得到运动能量模型(MEM)。然后利用局部二值模式(LBP)描述符对运动能量模型编码,进一步提取人体运动的有效信息。最后用l2范数协同表示分类器进行动作分类识别。在MSR Action3D、MSR Gesture3D数据库上测试所提方法,实验结果表明该方法有较高的识别效果。 展开更多
关键词 人体动作识别 深度视频序列 运动能量模型 局部二值模式 深度运动图
下载PDF
基于深度运动图的人体行为识别 被引量:1
13
作者 史东承 李延林 《长春工业大学学报》 CAS 2017年第3期276-281,共6页
将人体行为深度映射图(depth map)连续投影到3个互相垂直的笛卡尔平面,然后对投影做绝对差分,累积各自投影面的差分图像,得到完整的人体行为三维信息——深度运动图(Depth Motion Maps,DMMs)。利用MSRAction dataset和3DAction Pairs da... 将人体行为深度映射图(depth map)连续投影到3个互相垂直的笛卡尔平面,然后对投影做绝对差分,累积各自投影面的差分图像,得到完整的人体行为三维信息——深度运动图(Depth Motion Maps,DMMs)。利用MSRAction dataset和3DAction Pairs dataset进行训练以获取人体行为字典。在识别未知动作时,利用Tikhonov矩阵计算得出权重系数向量。最后,利用L2范式正则化协同表示对待识别动作进行分类。通过上述两个数据库的验证,分别达到了95.3%和83.8%的平均识别率,已经达到对DMMs的较高识别率。 展开更多
关键词 人体行为 识别 深度运动图 L2范式
下载PDF
一种融合运动和立体的视差与运动估计算法 被引量:1
14
作者 杨敬安 《系统工程与电子技术》 EI CSCD 1995年第8期77-80,F003,共5页
本文提出融合运动和立体的视差与运动估计算法。算法首先通过计算瞬时FOE,实现对每个像素处位移的MAP估计,计算关联置信度测量,然后利用位移估计从两图像序列之一计算相对深度图并导出能用于匹配两立体对图像序列的视差先验概... 本文提出融合运动和立体的视差与运动估计算法。算法首先通过计算瞬时FOE,实现对每个像素处位移的MAP估计,计算关联置信度测量,然后利用位移估计从两图像序列之一计算相对深度图并导出能用于匹配两立体对图像序列的视差先验概率分布,使立体对的两图像序列匹配,确定3-D景物深度。算法可独立估计每个像素处的视差,不需关联的平滑假设。 展开更多
关键词 视差 运动估计 算法 三维视觉
下载PDF
基于DenseNet和深度运动图的行为识别算法 被引量:1
15
作者 张健 张永辉 何京璇 《信息技术与网络安全》 2020年第1期63-69,共7页
结合深度信息以及RGB视频序列中丰富的纹理信息,提出了一种基于DenseNet和深度运动图像的人体行为识别算法。该算法基于DenseNet网络结构,首先获取彩色纹理信息和光流信息,然后从同步的深度视频序列获取深度信息,以增强特征互补性;再将... 结合深度信息以及RGB视频序列中丰富的纹理信息,提出了一种基于DenseNet和深度运动图像的人体行为识别算法。该算法基于DenseNet网络结构,首先获取彩色纹理信息和光流信息,然后从同步的深度视频序列获取深度信息,以增强特征互补性;再将空间流、时间流和深度流三种特征信息分别作为网络的输入;最后通过LSTMs进行特征融合和行为分类。实验结果表明,在公开的动作识别库UTD-MHAD数据集上,该算法识别准确率为92.11%,与该领域中的同类算法相比表现优异。 展开更多
关键词 行为识别 深度运动图像 DenseNet 光流
下载PDF
基于Kalman滤波器运动视觉景物结构复原算法 被引量:1
16
作者 杨敬安 《微电子学与计算机》 CSCD 北大核心 1991年第12期22-26,共5页
本文首先建立了运动视觉景物结构变化的动态系统模型,然后借助于此模型产生可最优估计图象点动态深度的Kalman 滤波器.并对每个象素点利用一个滤波器恢复环境的稠密深度图即景物结构.最后,利用文中提出的方法与技术对实图象及综合图象... 本文首先建立了运动视觉景物结构变化的动态系统模型,然后借助于此模型产生可最优估计图象点动态深度的Kalman 滤波器.并对每个象素点利用一个滤波器恢复环境的稠密深度图即景物结构.最后,利用文中提出的方法与技术对实图象及综合图象进行测验,其效果良好. 展开更多
关键词 KALMAN滤波器 运动视觉 景物结构估计 光流场 人工智能
下载PDF
基于关键点滤波的深度图提取
17
作者 唐骏 张贻雄 刘虹 《科学技术与工程》 北大核心 2015年第3期111-115,共5页
基于单帧视频2D/3D转换,深度估计是关键。提出一种在伴有相机移动情况下,基于运动的深度估计新方法,采用关键点滤波获取每帧视频像素级的运动矢量。由于相机的移动会引起伪运动矢量,从而导致深度信息模糊,为解决这一问题,采用鲁棒的RAN... 基于单帧视频2D/3D转换,深度估计是关键。提出一种在伴有相机移动情况下,基于运动的深度估计新方法,采用关键点滤波获取每帧视频像素级的运动矢量。由于相机的移动会引起伪运动矢量,从而导致深度信息模糊,为解决这一问题,采用鲁棒的RANSAC算法估计相机移动模型。首先,通过无相机移动的运动矢量来估计初始深度图。然后,利用基于同类点的后置滤波修正运动物体边缘像素的深度信息。实验结果表明,在有相机移动情况下,该方法对深度图的估计可以取得较好效果。 展开更多
关键词 2D/3D的转换 深度图 关键点滤波 相机移动估计
下载PDF
基于深度图像与骨骼数据的行为识别 被引量:7
18
作者 陆中秋 侯振杰 +1 位作者 陈宸 梁久祯 《计算机应用》 CSCD 北大核心 2016年第11期2979-2984,2992,共7页
为了充分利用深度图像与骨骼数据进行人体行为识别,提出了一种基于深度图形与骨骼数据的多特征行为识别方法。该算法的多特征包括深度运动图(DMM)特征与四方形骨骼特征(Quad)。深度图像方面,将深度图像投影到一个笛卡尔坐标系的三个平... 为了充分利用深度图像与骨骼数据进行人体行为识别,提出了一种基于深度图形与骨骼数据的多特征行为识别方法。该算法的多特征包括深度运动图(DMM)特征与四方形骨骼特征(Quad)。深度图像方面,将深度图像投影到一个笛卡尔坐标系的三个平面获得深度运动图特征。骨骼数据方面,提出四方形骨骼特征,它是骨骼坐标的一种标定方式,得到的结果只与骨骼姿态有关。同时提出一种多模型概率投票的分类策略,减小了噪声数据对分类结果的影响。所提方法在MSR-Action3D和DHA数据库进行实验,实验结果表明,所提算法有着较高的识别率与良好的鲁棒性。 展开更多
关键词 深度图像 骨骼数据 行为识别 深度运动图 四方形骨骼特征
下载PDF
三维动作识别时空特征提取方法 被引量:6
19
作者 徐海宁 陈恩庆 梁成武 《计算机应用》 CSCD 北大核心 2016年第2期568-573,579,共7页
针对传统的彩色视频中动作识别算法成本高,且二维信息不足导致动作识别效果不佳的问题,提出一种新的基于三维深度图像序列的动作识别方法。该算法在时间维度上提出了时间深度模型(TDM)来描述动作。在三个正交的笛卡尔平面上,将深度图像... 针对传统的彩色视频中动作识别算法成本高,且二维信息不足导致动作识别效果不佳的问题,提出一种新的基于三维深度图像序列的动作识别方法。该算法在时间维度上提出了时间深度模型(TDM)来描述动作。在三个正交的笛卡尔平面上,将深度图像序列分成几个子动作,对所有子动作作帧间差分并累积能量,形成深度运动图来描述动作的动态特征。在空间维度上,用空间金字塔方向梯度直方图(SPHOG)对时间深度模型进行编码得到了最终的描述符。最后用支持向量机(SVM)进行动作的分类。在两个权威数据库MSR Action3D和MSRGesture3D上进行实验验证,该方法识别率分别达到了94.90%(交叉测试组)和94.86%。实验结果表明,该方法能够快速对深度图像序列进行计算并取得较高的识别率,并基本满足深度视频序列的实时性要求。 展开更多
关键词 动作识别 三维深度图像 方向梯度直方图 时空金字塔 深度运动图
下载PDF
基于视频压缩域的深度图推理算法研究
20
作者 冯杰 马汉杰 《浙江理工大学学报(自然科学版)》 2016年第3期421-426,共6页
对2D到3D视频转换过程中的深度图推理算法进行了研究。该研究以视频压缩域中的宏块为单位进行深度图推理,根据不同的宏块类型选择不同的推理策略。首先,采用基于邻块的运动估计算法对帧内宏块的运动矢量进行计算;然后,针对帧间宏块... 对2D到3D视频转换过程中的深度图推理算法进行了研究。该研究以视频压缩域中的宏块为单位进行深度图推理,根据不同的宏块类型选择不同的推理策略。首先,采用基于邻块的运动估计算法对帧内宏块的运动矢量进行计算;然后,针对帧间宏块,对直接提取出的运动矢量进行滤波处理以提升其鲁棒性;最后,采用运动补偿和上采样双边滤波技术获得深度图。实验结果表明该方法可以获得平滑而可靠的深度图像,并且具有更好的深度图像质量。 展开更多
关键词 2D到3D视频转换 深度图 运动矢量 压缩域
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部