期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于GADF与2D CNN-改进SVM的道岔故障诊断方法研究
1
作者 王彦快 孟佳东 +2 位作者 张玉 杨建刚 王贵强 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第7期2944-2956,共13页
针对道岔故障特征不易提取以及道岔故障诊断准确率较低的问题,提出一种格拉姆角差场(Gramian Angular Difference Fields, GADF)与二维卷积神经网络(Two Dimensional Convolutional Neural Network, 2D CNN)-改进支持向量机(Support Vec... 针对道岔故障特征不易提取以及道岔故障诊断准确率较低的问题,提出一种格拉姆角差场(Gramian Angular Difference Fields, GADF)与二维卷积神经网络(Two Dimensional Convolutional Neural Network, 2D CNN)-改进支持向量机(Support Vector Machine, SVM)的道岔故障诊断组合方法。首先,结合现场实际应用情况,选取道岔设备正常转换与典型故障的转辙机功率曲线,建立转辙机功率曲线样本数据库;采用GADF编码将一维转辙机功率曲线信号转换为具有时间相关性的二维特征图,分别选择16×16、32×32以及64×64大小的特征图并提取图像数据。其次,在LeNet-5模型的基础上设计2D CNN网络结构,并将图像数据输入至基于2D CNN的道岔故障特征提取模型中,经多层的卷积层、池化层以及全连接层提取特征指标,建立道岔故障诊断样本数据库。最后,通过北方苍鹰优化(Northern Goshawk Optimization, NGO)算法优化SVM算法的惩罚因子与核函数方差,构建基于NGO-SVM的道岔故障诊断模型。实验结果分析表明,将转辙机功率曲线数据经GADF编码为64×64大小的特征图,并通过2D CNN模型提取道岔典型特征数据,较其他数据处理方法具有较高的故障诊断准确率,同时提高了故障诊断实时性;将建立的道岔故障诊断样本数据库输入至NGO-SVM道岔故障诊断模型,其故障诊断准确率高达97.5%,较其他故障诊断模型具有更好的故障诊断性能,为道岔故障诊断提供了一种新方法,对现场道岔设备的日常维修具有一定的指导意义。 展开更多
关键词 道岔设备 故障诊断 GADF 2d cnn NGO-SVM
下载PDF
STFT结合2D CNN-SVM的齿轮箱故障诊断方法
2
作者 谢锋云 汪淦 +3 位作者 王玲岚 李刚 朱海燕 谢三毛 《噪声与振动控制》 CSCD 北大核心 2024年第4期103-109,共7页
为提高齿轮箱故障诊断的有效性和故障识别的准确率,提出一种基于短时傅里叶变换(Short-term Fourier transform,STFT)、二维卷积神经网络(Two-dimensional Convolutional Neural Network,2D CNN)和支持向量机(Support Vector Machine,S... 为提高齿轮箱故障诊断的有效性和故障识别的准确率,提出一种基于短时傅里叶变换(Short-term Fourier transform,STFT)、二维卷积神经网络(Two-dimensional Convolutional Neural Network,2D CNN)和支持向量机(Support Vector Machine,SVM)相结合的齿轮箱故障识别方法。搭建JZQ250型定轴齿轮箱实验平台,利用加速度传感器获得齿轮箱振动信号,并对振动信号进行短时傅里叶变换得到二维时频图,然后将时频图输入到2D CNN中进行特征信息提取,通过2D CNN前向传播和反向传播对不同类别故障时频图信息进行训练,建立不同类别特征之间更深层次的联系,通过训练集和验证集loss曲线、准确率曲线和t-SNE可视化(t-Distributed Stochastic Neighbor Embedding,t-SNE)多种方法来反映模型训练程度,最后由SVM对故障类型进行识别。通过将所提出的方法与FFT-2D CNN、1D CNN-SVM和2D CNN-SVM对齿轮箱故障识别结果进行对比,本方法故障识别准确率最高,达到97.94%,且提出的方法具有很好的鲁棒性。 展开更多
关键词 故障诊断 齿轮箱 短时傅里叶变换 二维卷积神经网络 支持向量机
下载PDF
基于2D CNN和Transformer的人体动作识别 被引量:14
3
作者 朱相华 智敏 殷雁君 《电子测量技术》 北大核心 2022年第15期123-129,共7页
人体动作识别是计算机视觉领域的研究热点之一,在人机交互、视频监控等方面具有深远的理论研究意义。为了解决2D CNN无法有效获取时间关系等问题,利用Transformer在建模长期依赖关系上的优势,引入Transformer架构并将其与2D CNN相结合... 人体动作识别是计算机视觉领域的研究热点之一,在人机交互、视频监控等方面具有深远的理论研究意义。为了解决2D CNN无法有效获取时间关系等问题,利用Transformer在建模长期依赖关系上的优势,引入Transformer架构并将其与2D CNN相结合用于人体动作识别,以更好地捕获上下文时间信息。首先使用融合通道-空间注意力模块的2D CNN提取强化的帧内空间特征,其次利用Transformer捕捉帧间的时间特征,最后应用MLP Head进行动作分类。实验结果表明在HMDB-51数据集和UCF-101数据集上分别达到了69.4%和95.5%的识别准确度。 展开更多
关键词 人体动作识别 2d cnn 通道-空间注意力模块 TRANSFORMER
下载PDF
Action Recognition Using Multi-Scale Temporal Shift Module and Temporal Feature Difference Extraction Based on 2D CNN
4
作者 Kun-Hsuan Wu Ching-Te Chiu 《Journal of Software Engineering and Applications》 2021年第5期172-188,共17页
<span style="font-family:Verdana;">Convolutional neural networks, which have achieved outstanding performance in image recognition, have been extensively applied to action recognition. The mainstream a... <span style="font-family:Verdana;">Convolutional neural networks, which have achieved outstanding performance in image recognition, have been extensively applied to action recognition. The mainstream approaches to video understanding can be categorized into two-dimensional and three-dimensional convolutional neural networks. Although three-dimensional convolutional filters can learn the temporal correlation between different frames by extracting the features of multiple frames simultaneously, it results in an explosive number of parameters and calculation cost. Methods based on two-dimensional convolutional neural networks use fewer parameters;they often incorporate optical flow to compensate for their inability to learn temporal relationships. However, calculating the corresponding optical flow results in additional calculation cost;further, it necessitates the use of another model to learn the features of optical flow. We proposed an action recognition framework based on the two-dimensional convolutional neural network;therefore, it was necessary to resolve the lack of temporal relationships. To expand the temporal receptive field, we proposed a multi-scale temporal shift module, which was then combined with a temporal feature difference extraction module to extract the difference between the features of different frames. Finally, the model was compressed to make it more compact. We evaluated our method on two major action recognition benchmarks: the HMDB51 and UCF-101 datasets. Before compression, the proposed method achieved an accuracy of 72.83% on the HMDB51 dataset and 96.25% on the UCF-101 dataset. Following compression, the accuracy was still impressive, at 95.57% and 72.19% on each dataset. The final model was more compact than most related works.</span> 展开更多
关键词 Action Recognition Convolutional Neural Network 2d cnn Temporal Relationship
下载PDF
应用混合2D-CNN-LSTM模型诊断轴承故障 被引量:1
5
作者 江跃龙 《福建电脑》 2024年第5期33-37,共5页
滚动轴承是机械设备中的核心组件。为保证滚动轴承故障诊断的准确性和实时性,本文提出了一种混合深度模型故障诊断方法。该方法结合二维卷积神经网络和长短期记忆网络,不仅提升了模型的性能,而且能准确捕捉轴承信号中的空间和时间特征... 滚动轴承是机械设备中的核心组件。为保证滚动轴承故障诊断的准确性和实时性,本文提出了一种混合深度模型故障诊断方法。该方法结合二维卷积神经网络和长短期记忆网络,不仅提升了模型的性能,而且能准确捕捉轴承信号中的空间和时间特征。实验结果表明,该方法能够准确分类轴承故障,并实现对轴承运行状态的实时监测。 展开更多
关键词 二维卷积神经网络 长短期记忆网络 轴承故障 分类识别
下载PDF
一种基于2D-CNN深度学习的钻井事故等级预测新方法 被引量:3
6
作者 赵春兰 屈瑶 +4 位作者 王兵 范翔宇 赵鹏斐 李屹 何婷 《天然气工业》 EI CAS CSCD 北大核心 2022年第12期95-105,共11页
鉴于钻井安全事故分级风险评价过程中,存在安全事故风险指标较少且多为2分类预测的实际问题。为此,在利用模糊C均值算法确定钻井事故等级的分类的基础上,根据信息增益值对多维事故风险指标进行一次降维;进而将降维后的风险指标作为模型... 鉴于钻井安全事故分级风险评价过程中,存在安全事故风险指标较少且多为2分类预测的实际问题。为此,在利用模糊C均值算法确定钻井事故等级的分类的基础上,根据信息增益值对多维事故风险指标进行一次降维;进而将降维后的风险指标作为模型输入,由卷积层提取事故特征,池化层进行二次降维,构建双层2D-CNN的事故等级预测模型,最后通过激活函数(Softmax)判断钻井事故等级,提出一种基于二维卷积神经网络(2D-CNN)的钻井事故等级预测的新方法。研究结果表明:①较之于其他方法,新方法经过两次降维将多维钻井事故指标由73维降低至4维,降低模型计算复杂度;②不同于钻井事故发生与否的二分类问题,根据事故的严重程度划分成四种事故等级,以实现多分类预测;③现场应用效果表明,新方法的准确率为91.7%,损失值为0.409,预测效果优于BP神经网络模型和1D-CNN模型。结论认为,新方法能较好地将现场作业数据用于钻井事故等级的预测,对于钻井事故风险分级评价具有广泛应用和推广价值。 展开更多
关键词 多维钻井事故 事故等级 多分类预测 深度学习 二维卷积神经网络 模糊C均值算法 信息增益
下载PDF
基于多个密集连接型2D-CNNs的脑胶质瘤MRI三维分割 被引量:2
7
作者 张小兵 田海龙 +1 位作者 王志刚 聂生东 《光学技术》 CAS CSCD 北大核心 2020年第5期603-612,共10页
准确可靠的脑胶质瘤分割是脑胶质瘤诊断、治疗方案制定和治疗效果评价的重要前提。为了有效针对脑胶质瘤MRI的特性和基于CNNs的脑胶质瘤分割方法的不足,提出了一种融合三个密集连接型2D-CNNs分割结果的方法。将三维多模态MRI数据沿轴状... 准确可靠的脑胶质瘤分割是脑胶质瘤诊断、治疗方案制定和治疗效果评价的重要前提。为了有效针对脑胶质瘤MRI的特性和基于CNNs的脑胶质瘤分割方法的不足,提出了一种融合三个密集连接型2D-CNNs分割结果的方法。将三维多模态MRI数据沿轴状面、冠状面和矢状面切片化,并在预处理后的切片上按比例截取33×33大小的图像块,得到三个视图的训练集;将三个训练集分别送入到密集连接型2D-CNNs模型中进行训练,得到三个分割模型;然后,将测试病人的各视图图像块依次输入到训练好的分割模型,得到脑胶质瘤三个视图的粗分割结果;将三个视图的粗分割结果进行融合处理和后处理,得到脑胶质瘤的最终分割结果,并具体划分为水肿、增强和坏死/非增强三种区域。本研究包含了BraTS2018和BraTS2013的数据集并利用Dice系数、阳性预测值、灵敏度三个指标对分割结果进行评价。实验结果表明,所提出的分割方法不仅能够精确的分割脑胶质瘤,而且可以利用多个2D-CNNs实现脑胶质瘤的三维分割。 展开更多
关键词 脑胶质瘤 多模态磁共振图像 图像分割 密集连接型2d-cnns
下载PDF
基于卷积注意力机制的2D-LiDAR实时人体检测算法
8
作者 刘鹏华 郑宝志 +1 位作者 姚瀚晨 戴厚德 《传感器与微系统》 CSCD 北大核心 2024年第2期153-156,164,共5页
针对激光雷达(LiDAR)数据稀疏且信息含量低,难以识别人体特征的难题,提出一种基于卷积注意力机制的人体腿部实时检测方法。通过深度引导的滑动窗口对激光点信息预处理,使对象在不同的距离上有相同的特征信息。通过时间信息聚合,获得LiDA... 针对激光雷达(LiDAR)数据稀疏且信息含量低,难以识别人体特征的难题,提出一种基于卷积注意力机制的人体腿部实时检测方法。通过深度引导的滑动窗口对激光点信息预处理,使对象在不同的距离上有相同的特征信息。通过时间信息聚合,获得LiDAR数据更丰富的空间表现,减少运算时间。通过卷积注意力模块与自回归模型卷积神经网络,对空间邻域关联错位的特征进行分析。为验证本文提出算法对行人腿部的检测效果,在DROW验证集的3种评估半径下,曲线下面积(AUC)提高21%以上,F1提高14%以上,检测时间平均降低13 ms。实验结果表明:本文算法相比于DROW算法具有更高的检测精度与更快的运算速度。 展开更多
关键词 一维卷积神经网络 注意力机制 二维激光雷达 人体腿部识别
下载PDF
基于CNN和融合目标的三通道小波滤波器组识别
9
作者 刘斌 李昕 《计算机应用与软件》 北大核心 2024年第2期209-215,285,共8页
为解决目前需要人工选取二维不可分小波滤波器实现图像融合的问题,提出一种基于CNN和融合图像清晰度的二维三通道不可分对称小波的滤波器组自动择优分类方法。构造大量分布均匀的3×5对称小波滤波器组,并用其对多聚焦图像进行融合,... 为解决目前需要人工选取二维不可分小波滤波器实现图像融合的问题,提出一种基于CNN和融合图像清晰度的二维三通道不可分对称小波的滤波器组自动择优分类方法。构造大量分布均匀的3×5对称小波滤波器组,并用其对多聚焦图像进行融合,根据融合结果对滤波器组设置融合清晰度高低的标签,并构造滤波器组的训练集和测试集;设计出分类的卷积神经网络,并进行训练得到模型;对训练集和测试集以外的滤波器样本进行识别与结果分析。实验结果表明:所设计的网络模型在测试集和测试集以外的数据集上的识别率分别为99.48%和99.58%,其分类结果中较好的滤波器类对多聚焦图像融合都有较高的清晰度。 展开更多
关键词 多聚焦图像融合 二维三通道不可分小波 cnn 滤波器组 清晰度
下载PDF
基于Mask R-CNN的复杂背景下柑橘树枝干识别与重建 被引量:27
10
作者 杨长辉 王卓 +3 位作者 熊龙烨 刘艳平 康曦龙 赵万华 《农业机械学报》 EI CAS CSCD 北大核心 2019年第8期22-30,69,共10页
为了获取自然环境下完整柑橘果树枝干信息,以引导采摘机器人进行避障采摘作业,提出了一种基于Mask R-CNN模型与多参数变量约束的柑橘果树枝干识别与重建方法。该方法采用网格化的标记方式对果树枝干进行标记,完成了对柑橘果树枝干的小... 为了获取自然环境下完整柑橘果树枝干信息,以引导采摘机器人进行避障采摘作业,提出了一种基于Mask R-CNN模型与多参数变量约束的柑橘果树枝干识别与重建方法。该方法采用网格化的标记方式对果树枝干进行标记,完成了对柑橘果树枝干的小区域识别;然后对该模型获得的离散mask进行最小外接矩处理,以获得更精确的目标区域;接着利用多参数变量约束完成同一枝干mask(掩码)的划分;最后为了使重建枝干更符合实际枝干的生长姿态,以及完善未识别区域的检测,对同一枝干mask中心点进行了四次多项式拟合。实验结果表明,模型在测试集下的平均识别精确率为98.15%,平均召回率为81.09%,果树单条枝干平均拟合误差为11.47%,果树枝干整体平均重建准确率为88.64%。 展开更多
关键词 柑橘 采摘机器人 MASK R-cnn 识别 二维重建
下载PDF
基于二维图像和CNN-BiGRU网络的滚动轴承故障模式识别 被引量:23
11
作者 张训杰 张敏 李贤均 《振动与冲击》 EI CSCD 北大核心 2021年第23期194-201,207,共9页
为确保对滚动轴承故障诊断的有效性,结合卷积神经网络(CNN)在图像特征提取与分类识别的优势,利用格拉姆角场(GAF)将滚动轴承一维振动信号转换为二维图像数据,既保留了信号完整的信息,也保持着信号对于时间的依赖性。并由此提出基于卷积... 为确保对滚动轴承故障诊断的有效性,结合卷积神经网络(CNN)在图像特征提取与分类识别的优势,利用格拉姆角场(GAF)将滚动轴承一维振动信号转换为二维图像数据,既保留了信号完整的信息,也保持着信号对于时间的依赖性。并由此提出基于卷积神经网络与双向门控循环单元(BiGRU)的诊断模型。首先将二维图像作为模型的输入数据,通过卷积神经网络提取图像的空间特征,再由双向门控循环单元筛选其时间特征,最终由分类器完成模式识别。通过对滚动轴承不同故障程度以及不同故障位置的诊断试验,准确率分别达到99.63%以及99.28%,其效果均优于其他常用算法,证明了所提方法的可行性。 展开更多
关键词 滚动轴承 故障诊断 格拉姆角场(GAF) 二维图像 卷积神经网络(cnn) 双向门控循环单元(BiGRU)
下载PDF
基于EMD-CNN的光伏逆变器开路故障诊断 被引量:2
12
作者 孟献蒙 郭兴众 +2 位作者 程凡永 陈旺斌 方骏仁 《湖南工业大学学报》 2021年第5期10-17,共8页
绝缘栅双极型晶体管(IGBT)是光伏逆变器的核心部件,其若发生开路故障,不但会影响光伏逆变系统的稳定运行,且可能会损坏系统设备。从减少传感器使用数量和融合多尺度特征的角度出发,对开路故障诊断问题进行了研究,提出了一种基于经验模... 绝缘栅双极型晶体管(IGBT)是光伏逆变器的核心部件,其若发生开路故障,不但会影响光伏逆变系统的稳定运行,且可能会损坏系统设备。从减少传感器使用数量和融合多尺度特征的角度出发,对开路故障诊断问题进行了研究,提出了一种基于经验模式分解(EMD)和二维卷积神经网络(2D-CNN)的光伏逆变器故障诊断新方法。该方法利用EMD提取电流信号的本征模函数分量和原始信号组成二维特征数据,然后将该数据输入2D-CNN模型中进行训练,最后实现IGBT开路故障的诊断。实验结果表明,该方法不仅能提高故障诊断的准确率,而且在噪声环境下具备有效性和鲁棒性。 展开更多
关键词 IGBT 光伏逆变器 多尺度特征 经验模式分解 二维卷积神经网络
下载PDF
基于改进Faster R-CNN的二维图纸中建筑构件识别方法 被引量:4
13
作者 周权 赵云凡 邓雪原 《土木工程与管理学报》 2021年第5期110-117,共8页
自2010年以来,我国既有建筑占比不断扩大,而既有建筑普遍面临能源消耗大、CO 2排放量居高等问题。BIM作为数字化产物,包含运维管理中所需要的大量数据,可通过提高运维管理效率解决既有建筑当前的难题。然而,现存的老旧建筑缺少BIM,且手... 自2010年以来,我国既有建筑占比不断扩大,而既有建筑普遍面临能源消耗大、CO 2排放量居高等问题。BIM作为数字化产物,包含运维管理中所需要的大量数据,可通过提高运维管理效率解决既有建筑当前的难题。然而,现存的老旧建筑缺少BIM,且手工重建BIM费时费力。再者,作为当前主流的重建技术,激光扫描和摄影测量因成本高和精度低而难以满足要求。因此,为了克服上述局限性,本文提出了基于二维图纸的建筑构件识别方法,通过改进的Faster R-CNN实现建筑构件信息自动提取,为后续BIM的自动重生成提供数据支持。具体地,采用ResNet-101代替传统的VGG-16作为特征提取网络,再通过改进初始锚框尺寸和非极大值抑制算法,使得改进后的Faster R-CNN更适用于建筑构件小目标识别。实验结果表明,改进后的Faster R-CNN在建筑构件的识别上具有出色表现,mAP达到93.8%。另外,通过基于Tesseract的OCR技术实现了对图纸中文本信息的识别和提取。 展开更多
关键词 既有建筑 二维图纸 Faster R-cnn 构件识别
下载PDF
基于深度学习的二维人体姿态估计综述
14
作者 王珂 陈启腾 +2 位作者 陈伟 刘珏廷 杨雨晴 《郑州大学学报(理学版)》 CAS 北大核心 2024年第4期11-20,共10页
人体姿态估计是近年来计算机视觉问题中的一个热门话题,它在改善人类生活方面具有巨大的益处和潜在的应用。近年来深度神经网络得到快速发展,相较于传统方法而言,采用深度学习的方法更能提取图像表征信息。综合分析近年来人体姿态估计... 人体姿态估计是近年来计算机视觉问题中的一个热门话题,它在改善人类生活方面具有巨大的益处和潜在的应用。近年来深度神经网络得到快速发展,相较于传统方法而言,采用深度学习的方法更能提取图像表征信息。综合分析近年来人体姿态估计的进展,根据检测人数分为单人和多人人体姿态估计。针对单人姿态估计,介绍了基于直接预测人体坐标点的坐标回归方法及基于预测人体关键点高斯分布的热图检测方法;针对多人姿态估计,采用解决多人到解决单人过程的自顶向下方法和直接处理多人关键点的自底向上方法。总结了各方法网络结构的特点和优缺点,并阐述当前面临的问题及未来发展趋势。 展开更多
关键词 深度学习 卷积神经网络(cnn) 二维人体姿态估计 关键点检测
下载PDF
基于深度学习的人体动作识别综述 被引量:34
15
作者 钱慧芳 易剑平 付云虎 《计算机科学与探索》 CSCD 北大核心 2021年第3期438-455,共18页
人体动作识别是视频理解领域的重要课题之一,在视频监控、人机交互、运动分析、视频信息检索等方面有着广泛的应用。根据骨干网络的特点,从2D卷积神经网络、3D卷积神经网络、时空分解网络三个角度介绍了动作识别领域的最新研究成果,并... 人体动作识别是视频理解领域的重要课题之一,在视频监控、人机交互、运动分析、视频信息检索等方面有着广泛的应用。根据骨干网络的特点,从2D卷积神经网络、3D卷积神经网络、时空分解网络三个角度介绍了动作识别领域的最新研究成果,并对三类方法的优缺点进行了定性的分析和比较。然后,从场景相关和时间相关两方面,全面归纳了常用的动作视频数据集,并着重探讨了不同数据集的特点及用法。随后,介绍了动作识别任务中常见的预训练策略,并着重分析了预训练技术对动作识别模型性能的影响。最后,从最新的研究动态出发,从细粒度动作识别、更精简的模型、小样本学习、无监督学习、自适应网络和视频超分辨动作识别六个角度一致探讨了动作识别未来发展的方向。 展开更多
关键词 人体动作识别 2d卷积神经网络(2d cnn) 3D卷积神经网络(3D cnn) 时空分解网络 预训练
下载PDF
基于深度学习的视频质量评价方法研究综述
16
作者 杨文兵 邱天 +2 位作者 张志鹏 施博凯 张明威 《现代信息科技》 2024年第7期73-80,85,共9页
互联网时代充斥着海量的质量参差不齐的视频,低质量的视频极大地削弱人的视觉感官体验同时对储存设备造成极大压力,进行视频质量评价(VQA)势在必行。深度学习理论的发展为视频质量评价提供了新的思路,首先简单介绍视频质量评价理论知识... 互联网时代充斥着海量的质量参差不齐的视频,低质量的视频极大地削弱人的视觉感官体验同时对储存设备造成极大压力,进行视频质量评价(VQA)势在必行。深度学习理论的发展为视频质量评价提供了新的思路,首先简单介绍视频质量评价理论知识和传统的评价方法,其次对基于深度学习的评价模型进行神经网络分类——2D-CNN和3D-CNN,并分析模型的优缺点,再次在公开数据集上分析经典模型的性能表现,最后对该领域存在的缺点和不足进行总结,并展望未来的发展趋势。研究表明:公开的数据集仍不充足;无参考的评价方法最具发展潜力,但其在公开数据集上的性能表现一般,仍有很大的提升空间。 展开更多
关键词 深度学习 视频质量评价 2d-cnn 3D-cnn
下载PDF
基于改进型多维卷积神经网络的微动手势识别方法 被引量:7
17
作者 李玲霞 王羽 +1 位作者 吴金君 王沙沙 《计算机工程》 CAS CSCD 北大核心 2018年第9期243-249,共7页
传统二维卷积神经网络因遗漏时间维度信息导致不能识别微动手势。为此,提出一种基于视频流的微动手势识别方法。对输入视频流进行简单预处理,利用改进型多维卷积神经网络提取手势的时空特征,融合多传感器信息并通过支持向量机实现微动... 传统二维卷积神经网络因遗漏时间维度信息导致不能识别微动手势。为此,提出一种基于视频流的微动手势识别方法。对输入视频流进行简单预处理,利用改进型多维卷积神经网络提取手势的时空特征,融合多传感器信息并通过支持向量机实现微动手势识别。实验结果表明,该方法对手势的背景和光照都具有较好的鲁棒性,且针对各类动态手势数据集能达到87%以上的识别准确率。 展开更多
关键词 计算机视觉 手势识别 二维卷积神经网络 多维卷积神经网络 支持向量机 鲁棒性
下载PDF
基于卷积神经网络的三维CAD模型分类 被引量:10
18
作者 丁博 伊明 《哈尔滨理工大学学报》 CAS 北大核心 2020年第1期66-72,共7页
由于三维CAD模型内在的复杂性,实现模型的自动分类是一个难题。所以提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)的三维CAD模型自动分类方法,首先采用球体将三维CAD模型完全包住,获取模型沿固定视角的二维投影视图集... 由于三维CAD模型内在的复杂性,实现模型的自动分类是一个难题。所以提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)的三维CAD模型自动分类方法,首先采用球体将三维CAD模型完全包住,获取模型沿固定视角的二维投影视图集;然后采用Apriori甄选出其中的典型视图,将典型视图作为卷积神经网的输入;在AlexNet模型的基础上进行参数调整,并将其作为三维CAD模型分类器;最后选取正向传播和反向传播相结合的方式对卷积神经网络进行训练,以提高其泛化性能。实验表明,该方法能够提高模型分类的准确性和效率。 展开更多
关键词 三维CAD模型 卷积神经网络 二维视图 APRIORI算法
下载PDF
基于细胞神经网络和网格特征的碑刻文字识别 被引量:4
19
作者 国方媛 李国东 《计算机系统应用》 2010年第11期180-184,共5页
碑刻作为文字的载体,具有极其重要的历史价值和艺术价值。但是,因为时间的久远,其拓本大量的噪声对碑刻文字的辨识产生一定的影响。针对这种情况,提出了一种新方法,首先利用细胞神经网络(CNN)技术,去除单个碑刻文字的噪声,然后用网格特... 碑刻作为文字的载体,具有极其重要的历史价值和艺术价值。但是,因为时间的久远,其拓本大量的噪声对碑刻文字的辨识产生一定的影响。针对这种情况,提出了一种新方法,首先利用细胞神经网络(CNN)技术,去除单个碑刻文字的噪声,然后用网格特征提取方法对其进行识别。本文在MATLAB平台上进行了实例模拟,取得了较好的效果。 展开更多
关键词 细胞神经网络 网格特征 二维中值滤波 碑刻 文字识别
下载PDF
基于多维神经网络深度特征融合的鸟鸣识别算法 被引量:1
20
作者 吉训生 江昆 谢捷 《信号处理》 CSCD 北大核心 2022年第4期844-853,共10页
为了进一步提高夜间迁徙鸟鸣监测的准确率,提出一种基于多维神经网络深度特征融合的鸟鸣识别算法。首先,提取鸟鸣对数尺度的梅尔谱图作为VGG Style模型的训练特征,增强时频谱图的能量分布,通过Mix up数据混合生成虚拟数据以减少模型的... 为了进一步提高夜间迁徙鸟鸣监测的准确率,提出一种基于多维神经网络深度特征融合的鸟鸣识别算法。首先,提取鸟鸣对数尺度的梅尔谱图作为VGG Style模型的训练特征,增强时频谱图的能量分布,通过Mix up数据混合生成虚拟数据以减少模型的过拟合。之后,将预训练的VGG Style作为特征提取器对每一段鸟鸣提取深度特征。鉴于不同维度模型的互补性,该文提出分别使用1维CNN-LSTM、2维VGG Style与3维DenseNet121模型作为特征提取器生成高级特征。对于1维CNN-LSTM,使用小波分解作为池化方法,分别对鸟鸣时、频域进行9层小波分解,生成多层LBP特征以获取更丰富的时频信息。最后,对CNN-LSTM与DenseNet121的全连接层进行优化,减少模型参数,提高实时性。实验结果表明,通过融合多维神经网络的深度特征,使用浅层分类器在含有43种鸟类的CLO-43SD数据集中,获得了93.89%的平衡准确率,相较于最新的Mel-VGG与Subnet-CNN融合模型,平衡准确率提高了7.58%。 展开更多
关键词 鸟鸣识别 1维cnn-LSTM 2维VGG Style 3维DenseNet121 深度特征融合
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部