期刊文献+
共找到148篇文章
< 1 2 8 >
每页显示 20 50 100
基于频空融合与3D-CNN-Attention的抑郁症识别
1
作者 王建尚 张冰涛 +1 位作者 王小敏 严大川 《中国医学物理学杂志》 CSCD 2024年第10期1307-1314,共8页
提出了一种基于频谱信息的三维特征构建方法,根据电极位置将每个通道的功率值排列成二维特征向量。将不同频段特征排列成三维积分特征张量,提取频域信息,同时,为了减少容积导体效应影响,利用功能连接将时序脑电(EEG)数据映射到空间脑功... 提出了一种基于频谱信息的三维特征构建方法,根据电极位置将每个通道的功率值排列成二维特征向量。将不同频段特征排列成三维积分特征张量,提取频域信息,同时,为了减少容积导体效应影响,利用功能连接将时序脑电(EEG)数据映射到空间脑功能网络,提取空间信息。通过对特征与目标类之间关系的分析,提出一种3D-CNN-Attention网络模型,在3D-CNN网络中加入Attention机制,以增强EEG特征学习能力。在公开数据集上的系列对比实验,结果表明基于3D-CNN-Attention网络框架的抑郁症检测性能优于其他方法,获得了最高为96.32%的准确率。本文方法能够为抑郁症检测提供一种有效的解决方案。 展开更多
关键词 抑郁症 EEG 频谱 脑功能网络 3d-cnn-Attention
下载PDF
改进3D-CNN的高光谱图像地物分类方法 被引量:4
2
作者 郑宗生 刘海霞 +3 位作者 王振华 卢鹏 沈绪坤 唐鹏飞 《自然资源遥感》 CSCD 北大核心 2023年第2期105-111,共7页
高光谱图像具有数据量大、波段多和波段间相关性强等特性,传统高光谱分类方法通常单独考虑光谱和空间信息,特征提取不充分,忽略了图像纹理构造和重要光谱信息。针对这些问题,提出一种基于卷积神经网络(convolution neural network,CNN)... 高光谱图像具有数据量大、波段多和波段间相关性强等特性,传统高光谱分类方法通常单独考虑光谱和空间信息,特征提取不充分,忽略了图像纹理构造和重要光谱信息。针对这些问题,提出一种基于卷积神经网络(convolution neural network,CNN)的高光谱分类方法。该方法基于三维CNN(3D CNN),处理多尺度空谱数据,并对双重注意力机制进行改进,提出光谱注意力机制;其次,采取跨层特征融合和多通道特征提取策略,进一步提高地物分类精度。选取“高分五号”卫星拍摄的2景影像共6043个样本作为实验数据,并将提出的方法与支持向量机(support vector machine,SVM),一维CNN(1D CNN),二维CNN(2D CNN),3D CNN和残差网络(residual network,ResNet)进行比较分析。结果表明,所提方法的总体精度(overall accuracy,OA)和Kappa系数均有显著提高,OA值均达到95%以上。其中,OA在江苏南通地区数据集上达到了95.84%,较SVM,1D CNN,2D CNN,3D CNN和ResNet方法分别提高了21.54,21.71,7.28,3.94,2.56百分点。 展开更多
关键词 高光谱图像 地物分类 三维卷积神经网络 注意力机制 特征融合
下载PDF
联合LiDAR、高光谱数据及3D-CNN方法的树种分类
3
作者 毛英伍 郭颖 +2 位作者 张王菲 苏勇 关塬 《林业科学》 EI CAS CSCD 北大核心 2023年第3期73-83,共11页
【目的】探究三维卷积神经网络(3D-CNN)在高光谱数据支持的树种分类中的有效网络构建方式,以提高树种分类精度。【方法】以美国加利福尼亚州内华达山脉南部为研究区,LiDAR数据获取的森林冠层高(CHM)进行单木分割并以此为补充建立样本,... 【目的】探究三维卷积神经网络(3D-CNN)在高光谱数据支持的树种分类中的有效网络构建方式,以提高树种分类精度。【方法】以美国加利福尼亚州内华达山脉南部为研究区,LiDAR数据获取的森林冠层高(CHM)进行单木分割并以此为补充建立样本,改进一种结构更简单、分类精度更高且无需对高光谱数据进行预处理的3D-CNN网络结构用于森林树种识别。【结果】相较于常规机器学习分类方法【支持向量机(SVM),随机森林(RF)】、传统二维卷积神经网络模型(2D-CNN)及最新多光谱分辨率三维卷积神经网络(MSR 3D-CNN)模型,本研究提出的3D-CNN模型对树种总体分类精度为99.79%,平均交并比(MIoU)为99.53%。与SVM和RF分类结果相比,本研究构建的3D-CNN模型总体分类精度提高5%左右,且具有对树种边界提取更加准确、椒盐现象更少发生的特点;与2D-CNN相比,总体分类精度提高10%左右,MIoU提高7%左右;与MSR 3D-CNN相比,总体精度相差不大,但在训练和测试过程中,本模型耗时远远小于MSR 3D-CNN模型。【结论】本研究改进的3D-CNN模型结构能够高效对原始高光谱影像进行树种分类并制图,可有效提高树种分类的精度。 展开更多
关键词 高光谱 LIDAR 卷积神经网络 树种分类 3d-cnn
下载PDF
面向3D-CNN的算法压缩-硬件设计协同优化 被引量:1
4
作者 钱佳明 娄文启 +2 位作者 宫磊 王超 周学海 《计算机工程与应用》 CSCD 北大核心 2023年第18期74-83,共10页
近年来,三维卷积神经网络(3D-CNN)在计算机视频分类领域的优异表现使其受到了广泛关注。然而,相比于2D-CNN,3D-CNN显著增大的计算、存储需求不可避免地带来了部署时的性能与能效问题,严重限制了其在硬件资源受限场景下的适用性。为了应... 近年来,三维卷积神经网络(3D-CNN)在计算机视频分类领域的优异表现使其受到了广泛关注。然而,相比于2D-CNN,3D-CNN显著增大的计算、存储需求不可避免地带来了部署时的性能与能效问题,严重限制了其在硬件资源受限场景下的适用性。为了应对该挑战,提出了一种面向3D-CNN高效部署的算法-硬件协同设计与优化方法3D FCirCNN。在算法优化层面,首次使用分块循环矩阵对3D-CNN进行压缩并且进一步通过快速傅里叶变换(fast Fourier transform,FFT)进行加速,在保证模型规则性的前提下显著降低了模型的计算和存储开销。在此基础上,引入了频域内的激活、批归一化以及池化操作,通过实现全频域推理有效消除了由于FFT所带来的时域/频域切换开销。在硬件设计层面,为分块循环矩阵压缩后的3D-CNN设计了一个专用的硬件加速架构,并作出了一系列面向硬件资源和内存带宽的优化。在Xilinx ZCU102 FPGA上的实验表明,相较于以往最先进的工作,3D FCirCNN在可接受的精度损失范围内(<2%)取得了16.68倍的性能提升和16.18倍的计算效率提升。 展开更多
关键词 三维卷积神经网络 循环矩阵 全频域 现场可编程门阵列
下载PDF
融合MS3D-CNN和注意力机制的高光谱图像分类 被引量:1
5
作者 吴庆岗 刘中驰 贺梦坤 《重庆理工大学学报(自然科学)》 CAS 北大核心 2023年第2期173-182,共10页
针对高光谱遥感图像分类中空间信息利用不充分、样本标记数量不足的问题,提出一种基于多尺度3D-CNN和卷积块注意力机制的高光谱图像分类方法。采用特征映射方式从不同感受野充分挖掘并融合高光谱图像的空间特征和光谱特征,对融合后的空... 针对高光谱遥感图像分类中空间信息利用不充分、样本标记数量不足的问题,提出一种基于多尺度3D-CNN和卷积块注意力机制的高光谱图像分类方法。采用特征映射方式从不同感受野充分挖掘并融合高光谱图像的空间特征和光谱特征,对融合后的空谱特征进行卷积块注意力机制处理;通过残差思想构建深层网络,采用Dropout方法处理过拟合问题,最后通过Softmax分类器进行分类。在Indian Pines、Pavia University和Salinas Valley 3个高光谱数据集上进行大量实验,分类结果表明:所提方法优于其他经典方法。 展开更多
关键词 高光谱图像分类 多尺度三维卷积网络 注意力机制 残差网络
下载PDF
基于高光谱图像和3D-CNN的苹果多品质参数无损检测 被引量:12
6
作者 王浩云 李晓凡 +2 位作者 李亦白 孙云晓 徐焕良 《南京农业大学学报》 CAS CSCD 北大核心 2020年第1期178-185,共8页
[目的]为解决水果品质无损检测中成本、效率、精度问题,提出了一种基于高光谱图像和三维卷积神经网络(3D-CNN)的苹果高光谱多品质参数同时检测方法。[方法]使用高光谱成像系统获取400~1000 nm波段的苹果样本的高光谱反射图像并使用S-G... [目的]为解决水果品质无损检测中成本、效率、精度问题,提出了一种基于高光谱图像和三维卷积神经网络(3D-CNN)的苹果高光谱多品质参数同时检测方法。[方法]使用高光谱成像系统获取400~1000 nm波段的苹果样本的高光谱反射图像并使用S-G平滑法对原始图像进行去噪处理,在此基础上,对采集到的高光谱图像通过多感兴趣位置的选取以及间隔波段抽取重组的方法进行样本扩充,再利用三维卷积神经网络建立样本扩充后的苹果高光谱图像与苹果糖度、硬度、含水量的多任务学习模型,通过该模型实现对苹果的糖度、硬度、含水量等品质参数的无损检测。[结果]采集245个苹果的高光谱图像及其对应的品质参数信息,通过样本扩充的方法将原始数据集扩充至9800个样本后进行建模和验证。结果表明:本算法建立的苹果糖度、硬度、水分的分类模型,在糖度类间隔为1°Brix、硬度类间隔为0.5 kg·cm-2、含水量类间隔为10%的情况下,糖度、硬度、水分的预测准确率分别为93.97%、92.29%和93.36%,回归模型糖度、硬度和水分的相关系数最高分别达到0.827、0.775和0.862,比最优的传统算法分别提高15.0%、17.0%和17.2%。[结论]本算法能够较准确实现苹果高光谱多品质参数同时检测,且相对传统方法预测精度有较大提升。 展开更多
关键词 苹果 高光谱 多品质参数 无损检测 三维卷积神经网络(3d-cnn)
下载PDF
结合MRI多模态信息和3D-CNNs特征提取的脑肿瘤分割研究 被引量:5
7
作者 杨新焕 张勇 《中国CT和MRI杂志》 2020年第9期4-6,23,共4页
目的探究结合MRI多模态信息和3D-CNNs特征提取对于脑肿瘤分割的价值。方法分析相比于未加入多模态3D-CNNs特征的方法,并对比2D-CNNs特征方法和3D-CNNs特征方法分割的结果,主要参考dice系数,假阳性率和sensitibity。结果在加入多模态3D-C... 目的探究结合MRI多模态信息和3D-CNNs特征提取对于脑肿瘤分割的价值。方法分析相比于未加入多模态3D-CNNs特征的方法,并对比2D-CNNs特征方法和3D-CNNs特征方法分割的结果,主要参考dice系数,假阳性率和sensitibity。结果在加入多模态3D-CNNs特征之后,患者的dice系数均有不同程度的提高,sensitibity系数也有改变,假阳性率显著得到改善;加上多模态3D-CNNs特征提取后,dice系数变为(88.26±4.65)%,显著优于多模态2D-CNNs特征提取的(83.67±4.22)%。而多模态2D-CNNs特征提取的运用甚至比单独使用灰度邻域结合haar小波低频系数的分割结果。结论基于多模态3D-CNNs特征提取的MRI脑肿瘤分割准确度高,适应不同患者不同模态之间的多变性和差异性,值得参考。 展开更多
关键词 3d-cnnS特征提取 MRI多模态信息 脑肿瘤分割
下载PDF
快速3D-CNN结合深度可分离卷积对高光谱图像分类 被引量:1
8
作者 王燕 梁琦 《计算机科学与探索》 CSCD 北大核心 2022年第12期2860-2869,共10页
针对卷积神经网络在高光谱图像特征提取和分类的过程中,存在空谱特征提取不充分以及网络层数太多引起的参数量大、计算复杂的问题,提出快速三维卷积神经网络(3D-CNN)结合深度可分离卷积(DSC)的轻量型卷积模型。该方法首先利用增量主成... 针对卷积神经网络在高光谱图像特征提取和分类的过程中,存在空谱特征提取不充分以及网络层数太多引起的参数量大、计算复杂的问题,提出快速三维卷积神经网络(3D-CNN)结合深度可分离卷积(DSC)的轻量型卷积模型。该方法首先利用增量主成分分析(IPCA)对输入的数据进行降维预处理;其次将输入模型的像素分割成小的重叠的三维小卷积块,在分割的小块上基于中心像素形成地面标签,利用三维核函数进行卷积处理,形成连续的三维特征图,保留空谱特征。用3D-CNN同时提取空谱特征,然后在三维卷积中加入深度可分离卷积对空间特征再次提取,丰富空谱特征的同时减少参数量,从而减少计算时间,分类精度也有所提高。所提模型在Indian Pines、Salinas Scene和University of Pavia公开数据集上验证,并且同其他经典的分类方法进行比较。实验结果表明,该方法不仅能大幅度节省可学习的参数,降低模型复杂度,而且表现出较好的分类性能,其中总体精度(OA)、平均分类精度(AA)和Kappa系数均可达99%以上。 展开更多
关键词 高光谱图像分类 空谱特征提取 三维卷积神经网络(3d-cnn) 深度可分离卷积(DSC) 深度学习
下载PDF
Dynamic Hand Gesture Recognition Using 3D-CNN and LSTM Networks 被引量:3
9
作者 Muneeb Ur Rehman Fawad Ahmed +4 位作者 Muhammad Attique Khan Usman Tariq Faisal Abdulaziz Alfouzan Nouf M.Alzahrani Jawad Ahmad 《Computers, Materials & Continua》 SCIE EI 2022年第3期4675-4690,共16页
Recognition of dynamic hand gestures in real-time is a difficult task because the system can never know when or from where the gesture starts and ends in a video stream.Many researchers have been working on visionbase... Recognition of dynamic hand gestures in real-time is a difficult task because the system can never know when or from where the gesture starts and ends in a video stream.Many researchers have been working on visionbased gesture recognition due to its various applications.This paper proposes a deep learning architecture based on the combination of a 3D Convolutional Neural Network(3D-CNN)and a Long Short-Term Memory(LSTM)network.The proposed architecture extracts spatial-temporal information from video sequences input while avoiding extensive computation.The 3D-CNN is used for the extraction of spectral and spatial features which are then given to the LSTM network through which classification is carried out.The proposed model is a light-weight architecture with only 3.7 million training parameters.The model has been evaluated on 15 classes from the 20BN-jester dataset available publicly.The model was trained on 2000 video-clips per class which were separated into 80%training and 20%validation sets.An accuracy of 99%and 97%was achieved on training and testing data,respectively.We further show that the combination of 3D-CNN with LSTM gives superior results as compared to MobileNetv2+LSTM. 展开更多
关键词 Convolutional neural networks 3d-cnn LSTM SPATIOTEMPORAL jester real-time hand gesture recognition
下载PDF
Attention Based Multi-Patched 3D-CNNs with Hybrid Fusion Architecture for Reducing False Positives during Lung Nodule Detection
10
作者 Vamsi Krishna Vipparla Premith Kumar Chilukuri Giri Babu Kande 《Journal of Computer and Communications》 2021年第4期1-26,共26页
In lung nodules there is a huge variation in structural properties like Shape, Surface Texture. Even the spatial properties vary, where they can be found attached to lung walls, blood vessels in complex non-homogenous... In lung nodules there is a huge variation in structural properties like Shape, Surface Texture. Even the spatial properties vary, where they can be found attached to lung walls, blood vessels in complex non-homogenous lung structures. Moreover, the nodules are of small size at their early stage of development. This poses a serious challenge to develop a Computer aided diagnosis (CAD) system with better false positive reduction. Hence, to reduce the false positives per scan and to deal with the challenges mentioned, this paper proposes a set of three diverse 3D Attention based CNN architectures (3D ACNN) whose predictions on given low dose Volumetric Computed Tomography (CT) scans are fused to achieve more effective and reliable results. Attention mechanism is employed to selectively concentrate/weigh more on nodule specific features and less weight age over other irrelevant features. By using this attention based mechanism in CNN unlike traditional methods there was a significant gain in the classification performance. Contextual dependencies are also taken into account by giving three patches of different sizes surrounding the nodule as input to the ACNN architectures. The system is trained and validated using a publicly available LUNA16 dataset in a 10 fold cross validation approach where a competition performance metric (CPM) score of 0.931 is achieved. The experimental results demonstrate that either a single patch or a single architecture in a one-to-one fashion that is adopted in earlier methods cannot achieve a better performance and signifies the necessity of fusing different multi patched architectures. Though the proposed system is mainly designed for pulmonary nodule detection it can be easily extended to classification tasks of any other 3D medical diagnostic computed tomography images where there is a huge variation and uncertainty in classification. 展开更多
关键词 3d-cnn Attention Gated Networks Lung Nodules Medical Imaging X-Ray Computed Tomography
下载PDF
3D-CNN在肺癌图像识别中的应用研究
11
作者 李雅迪 韩佳芳 马琳琳 《智能计算机与应用》 2022年第8期161-164,170,共5页
肺癌是长期威胁人类健康的恶性疾病之一,针对传统方法在肺癌CT图像分类中的预处理过程复杂、工作量大的问题,本文提出了基于三维卷积神经网络(3D-CNN)模型的肺部CT图像分类方法。该模型以卷积神经网络模型为基础,并在训练的过程中使用... 肺癌是长期威胁人类健康的恶性疾病之一,针对传统方法在肺癌CT图像分类中的预处理过程复杂、工作量大的问题,本文提出了基于三维卷积神经网络(3D-CNN)模型的肺部CT图像分类方法。该模型以卷积神经网络模型为基础,并在训练的过程中使用特定顺序输入策略,还在公开的Kaggle Data Science Bowl 2017数据集上进行了实验。实验表明,该方法对图像的分类准确率达到76%,比采用随机顺序的输入策略时有所提升,能够为肺部病理图像的分类研究提供有价值的参考。 展开更多
关键词 肺部CT图像分类 3d-cnn 特定顺序输入策略
下载PDF
基于CEEMDAN-小波阈值和3D-CNN的变压器铁心松动故障诊断模型 被引量:4
12
作者 崔佳嘉 马宏忠 《电机与控制应用》 2022年第10期46-52,共7页
为了解决变压器铁心松动故障的识别与诊断,提出基于完全自适应噪声集合经验模态分解(CEEMDAN)-小波阈值的环境噪声去除方法,并提出使用三维卷积神经网络(3D-CNN)去识别基于声纹的变压器铁心松动故障诊断方法。搭建变压器铁心松动故障试... 为了解决变压器铁心松动故障的识别与诊断,提出基于完全自适应噪声集合经验模态分解(CEEMDAN)-小波阈值的环境噪声去除方法,并提出使用三维卷积神经网络(3D-CNN)去识别基于声纹的变压器铁心松动故障诊断方法。搭建变压器铁心松动故障试验平台,采集铁心在不同松动程度下的噪声信号;将采集的用于故障识别的声纹信号经过CEEMDAN-小波阈值算法,利用变压器本体噪声和环境噪声在峭度上的差异滤波,得到信噪比较高的变压器声纹信号;再将滤波后的声纹信号经过短时傅里叶变化生成时频矩阵,并用Mel滤波器降维得到Mel-语谱图,制作成适合3D-CNN输入格式的数据集;搭建好网络的各层,利用3D-CNN对变压器铁心松动故障进行分类和识别。试验结果表明:所提方法在考虑环境噪声的条件下,变压器铁心松动故障的识别率达到90%以上,可用于变压器铁心松动故障的识别和诊断。 展开更多
关键词 变压器 铁心松动故障 声纹信号 故障诊断 三维卷积神经网络
下载PDF
一种基于3D-CNN的微表情识别算法 被引量:5
13
作者 吴进 闵育 +1 位作者 李聪 张伟华 《电讯技术》 北大核心 2019年第10期1115-1120,共6页
微表情是一种持续时间很短暂的面部表情。针对其识别率低的问题,提出了一种基于三维卷积神经网络(3D Convolutionnal Neural Network,3D-CNN)的微表情识别算法。使用Keras作为网络框架,在3D-VGG-Block(3Dimension Visual Geometry Group... 微表情是一种持续时间很短暂的面部表情。针对其识别率低的问题,提出了一种基于三维卷积神经网络(3D Convolutionnal Neural Network,3D-CNN)的微表情识别算法。使用Keras作为网络框架,在3D-VGG-Block(3Dimension Visual Geometry Group Block,3D-VGG-Block)的基础上加入批量归一化算法以及丢弃法,提升网络深度与训练速度的同时有效地防止过拟合;针对数据集稀少的问题,采取随机设置起始帧的位置,提前设定每次读取帧序列的长度,循环操作,在将所有数据均遍历的同时,达到数据增广的目的。该算法在CASME II数据集上的识别率最高达68.85%,在识别率上有一定优势。 展开更多
关键词 微表情识别 深度学习 三维卷积神经网络 批量归一化算法 丢弃法
下载PDF
基于I3D-CNN的自闭症分类方法
14
作者 仇喆磊 王莉 +2 位作者 王晓 韦奕 梅雪 《计算机工程与设计》 北大核心 2022年第6期1644-1650,共7页
为解决传统基于静态功能网络连接的自闭症分类算法忽略了脑功能连接的时变特性问题,提出一种基于膨胀卷积网络(inflated three dimension convolution neural network,I3D-CNN)的自闭症分类识别方法。提取被试大脑的静息态功能核磁共振... 为解决传统基于静态功能网络连接的自闭症分类算法忽略了脑功能连接的时变特性问题,提出一种基于膨胀卷积网络(inflated three dimension convolution neural network,I3D-CNN)的自闭症分类识别方法。提取被试大脑的静息态功能核磁共振影像(rest state functional magnetic resonance imaging,RS-fMRI)每个感兴趣区域(region of interest,ROI)的时间序列,基于时间序列利用随机滑动时间窗口法,构建多个3D动态脑功能连接矩阵,使用I3D-CNN从3D动态脑功能连接矩阵中提取大脑的时空特征,建立自闭症分类模型。通过在ABIDE数据集上进行实验,验证了该方法的可行性和有效性。 展开更多
关键词 三维卷积神经网络 静息态功能核磁共振影像 动态功能网络 自闭症 分类
下载PDF
基于3D-CNN和时空注意力-卷积LSTM的抑郁症识别研究 被引量:1
15
作者 何浪 《首都师范大学学报(自然科学版)》 2021年第2期17-25,共9页
针对目前抑郁症识别方法中没有有效地从序列信息中刻画长时特征表示的问题,本文提出了一种基于三维卷积神经网络(3D-CNN)、时空注意力-卷积长短时记忆网络(STA-ConvLSTM)和空间金字塔池化(SPP)的端到端的抑郁症识别方法,计算在数据库AVE... 针对目前抑郁症识别方法中没有有效地从序列信息中刻画长时特征表示的问题,本文提出了一种基于三维卷积神经网络(3D-CNN)、时空注意力-卷积长短时记忆网络(STA-ConvLSTM)和空间金字塔池化(SPP)的端到端的抑郁症识别方法,计算在数据库AVEC2013和AVEC2014测试集上的抑郁症识别结果,并将本文结果与已发表文献结果进行对比分析.结果表明:在数据库AVEC2013和AVEC2014测试集上,平均绝对误差均为8.60,均方根误差分别为10.32和10.27,文献结果比较表明本文的抑郁症识别结果优于当前大多数基于面部视频的抑郁症识别方法. 展开更多
关键词 抑郁症 时空注意力机制ConvLSTM(STA-ConvLSTM) 三维卷积神经网络 卷积长短时记忆神经网络
下载PDF
改进的残差3D-CNN的高光谱遥感影像分类 被引量:2
16
作者 苗永庆 赵泉华 孙清 《测绘科学》 CSCD 北大核心 2023年第2期148-156,184,共10页
针对高光谱遥感影像分类中空间特征和光谱特征利用率低问题,该文综合三维卷积神经网络、谷歌神经网络和残差神经网络的优势,提出融合改进Inception模块的残差三维卷积神经网络高光谱遥感影像分类方法。改进后的Inception模块包括4条不... 针对高光谱遥感影像分类中空间特征和光谱特征利用率低问题,该文综合三维卷积神经网络、谷歌神经网络和残差神经网络的优势,提出融合改进Inception模块的残差三维卷积神经网络高光谱遥感影像分类方法。改进后的Inception模块包括4条不同的卷积层分支,用以提取蕴涵在高光谱遥感影像中多尺度的特征;利用了3D卷积核代替2D卷积核能直接同时提取高光谱遥感影像中更丰富的空-谱特征;通过残差结构连接分支提取特征缓解了梯度消失的问题,提取更深层次的特征。实验表明,该文算法不仅提高了条状和线状地物区域的边缘分类准确率,对小目标的分类能力也得到了增强。 展开更多
关键词 3d-cnn Inception模块 残差神经网络 高光谱遥感影像分类
原文传递
基于3D CNN-BiLSTM-ATFA网络和步态特征的奶牛个体识别方法
17
作者 司永胜 宁泽普 +2 位作者 王克俭 马亚宾 袁明 《农业机械学报》 EI CAS CSCD 北大核心 2024年第7期315-324,共10页
针对基于花纹的奶牛个体识别中纯色或花纹较少的奶牛识别准确率较低的问题,本文提出一种基于步态特征的奶牛个体识别方法。首先,将DeepLabv3+语义分割算法的主干网络替换为MobileNetv2网络,并引入基于通道和空间的CBAM注意力机制,利用... 针对基于花纹的奶牛个体识别中纯色或花纹较少的奶牛识别准确率较低的问题,本文提出一种基于步态特征的奶牛个体识别方法。首先,将DeepLabv3+语义分割算法的主干网络替换为MobileNetv2网络,并引入基于通道和空间的CBAM注意力机制,利用改进后模型分割出奶牛的剪影图。然后,将三维卷积神经网络(3D CNN)和双向长短期记忆网络(BiLSTM)构建为3D CNN-BiLSTM网络,并进一步集成自适应时间特征聚合模块(ATFA)生成3D CNN-BiLSTM-ATFA奶牛个体识别模型。最后,在30头奶牛的共1242条视频数据集上进行了奶牛个体识别实验。结果表明,改进后DeepLabv3+算法的平均像素准确率、平均交并比、准确率分别为99.02%、97.18%和99.71%。采用r3d_18作为3D CNN-BiLSTM-ATFA的主干网络效果最优。基于步态的奶牛个体识别平均准确率、灵敏度和精确度分别为94.58%、93.47%和95.94%。奶牛躯干和腿部不同部位进行加权特征融合的个体识别实验表明识别准确率还可进一步提高。奶牛跛足对步态识别效果影响较为明显,实验期间由健康变为跛足和一直跛足的奶牛个体识别准确率分别为89.39%和92.61%。本文研究结果可为奶牛的智能化个体识别提供技术参考。 展开更多
关键词 奶牛 个体识别 步态特征 3D CNN BiLSTM
下载PDF
基于Winograd算法的3D卷积神经网络权重剪枝方法
18
作者 邹贵 秦子然 +5 位作者 吴捷 刘国梁 赵军 王迎雪 林晖 林巍峣 《长江信息通信》 2024年第8期1-3,17,共4页
针对3D卷积神经网络在资源有限的环境下高计算成本的挑战,文章提出了一种融合Winograd算法和网络剪枝技术的3D卷积神经网络优化方法。首先,将标准3D卷积层替换为效率更高的3D Winograd层,实现对卷积操作的优化。接着,对3D Winograd层的... 针对3D卷积神经网络在资源有限的环境下高计算成本的挑战,文章提出了一种融合Winograd算法和网络剪枝技术的3D卷积神经网络优化方法。首先,将标准3D卷积层替换为效率更高的3D Winograd层,实现对卷积操作的优化。接着,对3D Winograd层的权重进行重要性评估,保留重要的权重单元并剪枝获得稀疏模型。最后,对稀疏模型进行重训练,恢复剪枝后网络的性能。通过结合Winograd算法和网络剪枝技术,能够在提高识别准确度的同时,显著降低了模型的计算需求。实验结果证实,与其他优化技术相比,本方法能有效减少计算资源消耗,同时保持甚至提高识别性能。 展开更多
关键词 3D卷积神经网络优化 Winograd算法 网络剪枝
下载PDF
基于改进3D卷积神经网络的疼痛检测
19
作者 黄伟聪 周卓沂 +1 位作者 李雄彬 梁艳 《计算机系统应用》 2024年第2期291-298,共8页
在临床实践中,精确评估疼痛对于疼痛管理和诊断至关重要.但传统的评估方法主观性高且依赖医生经验,迫切需要更可靠客观的替代方法.利用深度学习的方法实现基于面部表情的疼痛检测研究近年已取得显著进展,但复杂的结构和高计算成本制约... 在临床实践中,精确评估疼痛对于疼痛管理和诊断至关重要.但传统的评估方法主观性高且依赖医生经验,迫切需要更可靠客观的替代方法.利用深度学习的方法实现基于面部表情的疼痛检测研究近年已取得显著进展,但复杂的结构和高计算成本制约了其实际应用.因此,本文提出了一个改进的3D卷积神经网络,采用轻量级的3D卷积神经网络L3D作为骨干网络,并结合改进的SE注意力机制,把多个不同尺度的特征进行融合,捕捉疼痛序列中具有较强辨别能力的时空特征.在UNBC-McMaster和BioVid数据集上进行评估,与最新方法相比,该方法在疼痛检测性能以及计算复杂度上取得了优势. 展开更多
关键词 疼痛检测 疼痛表情 3D卷积神经网络 轻量级 注意力机制 特征融合
下载PDF
双卷积池化结构的3D-CNN高光谱遥感影像分类方法 被引量:24
20
作者 李冠东 张春菊 +1 位作者 高飞 张雪英 《中国图象图形学报》 CSCD 北大核心 2019年第4期639-654,共16页
目的高光谱遥感影像数据包含丰富的空间和光谱信息,但由于信号的高维特性、信息冗余、多种不确定性和地表覆盖的同物异谱及同谱异物现象,导致高光谱数据结构呈高度非线性。3D-CNN(3D convolutional neural network)能够利用高光谱遥感... 目的高光谱遥感影像数据包含丰富的空间和光谱信息,但由于信号的高维特性、信息冗余、多种不确定性和地表覆盖的同物异谱及同谱异物现象,导致高光谱数据结构呈高度非线性。3D-CNN(3D convolutional neural network)能够利用高光谱遥感影像数据立方体的特性,实现光谱和空间信息融合,提取影像分类中重要的有判别力的特征。为此,提出了基于双卷积池化结构的3D-CNN高光谱遥感影像分类方法。方法双卷积池化结构包括两个卷积层、两个BN(batch normalization)层和一个池化层,既考虑到高光谱遥感影像标签数据缺乏的问题,也考虑到高光谱影像高维特性和模型深度之间的平衡问题,模型充分利用空谱联合提供的语义信息,有利于提取小样本和高维特性的高光谱影像特征。基于双卷积池化结构的3D-CNN网络将没有经过特征处理的3D遥感影像作为输入数据,产生的深度学习分类器模型以端到端的方式训练,不需要做复杂的预处理,此外模型使用了BN和Dropout等正则化策略以避免过拟合现象。结果实验对比了SVM(support vector machine)、SAE(stack autoencoder)以及目前主流的CNN方法,该模型在Indian Pines和Pavia University数据集上最高分别取得了99. 65%和99. 82%的总体分类精度,有效提高了高光谱遥感影像地物分类精度。结论讨论了双卷积池化结构的数目、正则化策略、高光谱首层卷积的光谱采样步长、卷积核大小、相邻像素块大小和学习率等6个因素对实验结果的影响,本文提出的双卷积池化结构可以根据数据集特点进行组合复用,与其他深度学习模型相比,需要更少的参数,计算效率更高。 展开更多
关键词 3d-cnn 双卷积池化结构 空谱联合特征 高光谱影像分类 正则化策略
原文传递
上一页 1 2 8 下一页 到第
使用帮助 返回顶部