期刊文献+
共找到146篇文章
< 1 2 8 >
每页显示 20 50 100
改进3D-CNN的高光谱图像地物分类方法 被引量:3
1
作者 郑宗生 刘海霞 +3 位作者 王振华 卢鹏 沈绪坤 唐鹏飞 《自然资源遥感》 CSCD 北大核心 2023年第2期105-111,共7页
高光谱图像具有数据量大、波段多和波段间相关性强等特性,传统高光谱分类方法通常单独考虑光谱和空间信息,特征提取不充分,忽略了图像纹理构造和重要光谱信息。针对这些问题,提出一种基于卷积神经网络(convolution neural network,CNN)... 高光谱图像具有数据量大、波段多和波段间相关性强等特性,传统高光谱分类方法通常单独考虑光谱和空间信息,特征提取不充分,忽略了图像纹理构造和重要光谱信息。针对这些问题,提出一种基于卷积神经网络(convolution neural network,CNN)的高光谱分类方法。该方法基于三维CNN(3D CNN),处理多尺度空谱数据,并对双重注意力机制进行改进,提出光谱注意力机制;其次,采取跨层特征融合和多通道特征提取策略,进一步提高地物分类精度。选取“高分五号”卫星拍摄的2景影像共6043个样本作为实验数据,并将提出的方法与支持向量机(support vector machine,SVM),一维CNN(1D CNN),二维CNN(2D CNN),3D CNN和残差网络(residual network,ResNet)进行比较分析。结果表明,所提方法的总体精度(overall accuracy,OA)和Kappa系数均有显著提高,OA值均达到95%以上。其中,OA在江苏南通地区数据集上达到了95.84%,较SVM,1D CNN,2D CNN,3D CNN和ResNet方法分别提高了21.54,21.71,7.28,3.94,2.56百分点。 展开更多
关键词 高光谱图像 地物分类 三维卷积神经网络 注意力机制 特征融合
下载PDF
基于3D CNN-BiLSTM-ATFA网络和步态特征的奶牛个体识别方法
2
作者 司永胜 宁泽普 +2 位作者 王克俭 马亚宾 袁明 《农业机械学报》 EI CAS CSCD 北大核心 2024年第7期315-324,共10页
针对基于花纹的奶牛个体识别中纯色或花纹较少的奶牛识别准确率较低的问题,本文提出一种基于步态特征的奶牛个体识别方法。首先,将DeepLabv3+语义分割算法的主干网络替换为MobileNetv2网络,并引入基于通道和空间的CBAM注意力机制,利用... 针对基于花纹的奶牛个体识别中纯色或花纹较少的奶牛识别准确率较低的问题,本文提出一种基于步态特征的奶牛个体识别方法。首先,将DeepLabv3+语义分割算法的主干网络替换为MobileNetv2网络,并引入基于通道和空间的CBAM注意力机制,利用改进后模型分割出奶牛的剪影图。然后,将三维卷积神经网络(3D CNN)和双向长短期记忆网络(BiLSTM)构建为3D CNN-BiLSTM网络,并进一步集成自适应时间特征聚合模块(ATFA)生成3D CNN-BiLSTM-ATFA奶牛个体识别模型。最后,在30头奶牛的共1242条视频数据集上进行了奶牛个体识别实验。结果表明,改进后DeepLabv3+算法的平均像素准确率、平均交并比、准确率分别为99.02%、97.18%和99.71%。采用r3d_18作为3D CNN-BiLSTM-ATFA的主干网络效果最优。基于步态的奶牛个体识别平均准确率、灵敏度和精确度分别为94.58%、93.47%和95.94%。奶牛躯干和腿部不同部位进行加权特征融合的个体识别实验表明识别准确率还可进一步提高。奶牛跛足对步态识别效果影响较为明显,实验期间由健康变为跛足和一直跛足的奶牛个体识别准确率分别为89.39%和92.61%。本文研究结果可为奶牛的智能化个体识别提供技术参考。 展开更多
关键词 奶牛 个体识别 步态特征 3D CNN BiLSTM
下载PDF
联合LiDAR、高光谱数据及3D-CNN方法的树种分类
3
作者 毛英伍 郭颖 +2 位作者 张王菲 苏勇 关塬 《林业科学》 EI CAS CSCD 北大核心 2023年第3期73-83,共11页
【目的】探究三维卷积神经网络(3D-CNN)在高光谱数据支持的树种分类中的有效网络构建方式,以提高树种分类精度。【方法】以美国加利福尼亚州内华达山脉南部为研究区,LiDAR数据获取的森林冠层高(CHM)进行单木分割并以此为补充建立样本,... 【目的】探究三维卷积神经网络(3D-CNN)在高光谱数据支持的树种分类中的有效网络构建方式,以提高树种分类精度。【方法】以美国加利福尼亚州内华达山脉南部为研究区,LiDAR数据获取的森林冠层高(CHM)进行单木分割并以此为补充建立样本,改进一种结构更简单、分类精度更高且无需对高光谱数据进行预处理的3D-CNN网络结构用于森林树种识别。【结果】相较于常规机器学习分类方法【支持向量机(SVM),随机森林(RF)】、传统二维卷积神经网络模型(2D-CNN)及最新多光谱分辨率三维卷积神经网络(MSR 3D-CNN)模型,本研究提出的3D-CNN模型对树种总体分类精度为99.79%,平均交并比(MIoU)为99.53%。与SVM和RF分类结果相比,本研究构建的3D-CNN模型总体分类精度提高5%左右,且具有对树种边界提取更加准确、椒盐现象更少发生的特点;与2D-CNN相比,总体分类精度提高10%左右,MIoU提高7%左右;与MSR 3D-CNN相比,总体精度相差不大,但在训练和测试过程中,本模型耗时远远小于MSR 3D-CNN模型。【结论】本研究改进的3D-CNN模型结构能够高效对原始高光谱影像进行树种分类并制图,可有效提高树种分类的精度。 展开更多
关键词 高光谱 LIDAR 卷积神经网络 树种分类 3d-cnn
下载PDF
面向3D-CNN的算法压缩-硬件设计协同优化
4
作者 钱佳明 娄文启 +2 位作者 宫磊 王超 周学海 《计算机工程与应用》 CSCD 北大核心 2023年第18期74-83,共10页
近年来,三维卷积神经网络(3D-CNN)在计算机视频分类领域的优异表现使其受到了广泛关注。然而,相比于2D-CNN,3D-CNN显著增大的计算、存储需求不可避免地带来了部署时的性能与能效问题,严重限制了其在硬件资源受限场景下的适用性。为了应... 近年来,三维卷积神经网络(3D-CNN)在计算机视频分类领域的优异表现使其受到了广泛关注。然而,相比于2D-CNN,3D-CNN显著增大的计算、存储需求不可避免地带来了部署时的性能与能效问题,严重限制了其在硬件资源受限场景下的适用性。为了应对该挑战,提出了一种面向3D-CNN高效部署的算法-硬件协同设计与优化方法3D FCirCNN。在算法优化层面,首次使用分块循环矩阵对3D-CNN进行压缩并且进一步通过快速傅里叶变换(fast Fourier transform,FFT)进行加速,在保证模型规则性的前提下显著降低了模型的计算和存储开销。在此基础上,引入了频域内的激活、批归一化以及池化操作,通过实现全频域推理有效消除了由于FFT所带来的时域/频域切换开销。在硬件设计层面,为分块循环矩阵压缩后的3D-CNN设计了一个专用的硬件加速架构,并作出了一系列面向硬件资源和内存带宽的优化。在Xilinx ZCU102 FPGA上的实验表明,相较于以往最先进的工作,3D FCirCNN在可接受的精度损失范围内(<2%)取得了16.68倍的性能提升和16.18倍的计算效率提升。 展开更多
关键词 三维卷积神经网络 循环矩阵 全频域 现场可编程门阵列
下载PDF
融合MS3D-CNN和注意力机制的高光谱图像分类 被引量:1
5
作者 吴庆岗 刘中驰 贺梦坤 《重庆理工大学学报(自然科学)》 CAS 北大核心 2023年第2期173-182,共10页
针对高光谱遥感图像分类中空间信息利用不充分、样本标记数量不足的问题,提出一种基于多尺度3D-CNN和卷积块注意力机制的高光谱图像分类方法。采用特征映射方式从不同感受野充分挖掘并融合高光谱图像的空间特征和光谱特征,对融合后的空... 针对高光谱遥感图像分类中空间信息利用不充分、样本标记数量不足的问题,提出一种基于多尺度3D-CNN和卷积块注意力机制的高光谱图像分类方法。采用特征映射方式从不同感受野充分挖掘并融合高光谱图像的空间特征和光谱特征,对融合后的空谱特征进行卷积块注意力机制处理;通过残差思想构建深层网络,采用Dropout方法处理过拟合问题,最后通过Softmax分类器进行分类。在Indian Pines、Pavia University和Salinas Valley 3个高光谱数据集上进行大量实验,分类结果表明:所提方法优于其他经典方法。 展开更多
关键词 高光谱图像分类 多尺度三维卷积网络 注意力机制 残差网络
下载PDF
基于改进3D卷积神经网络的疼痛检测
6
作者 黄伟聪 周卓沂 +1 位作者 李雄彬 梁艳 《计算机系统应用》 2024年第2期291-298,共8页
在临床实践中,精确评估疼痛对于疼痛管理和诊断至关重要.但传统的评估方法主观性高且依赖医生经验,迫切需要更可靠客观的替代方法.利用深度学习的方法实现基于面部表情的疼痛检测研究近年已取得显著进展,但复杂的结构和高计算成本制约... 在临床实践中,精确评估疼痛对于疼痛管理和诊断至关重要.但传统的评估方法主观性高且依赖医生经验,迫切需要更可靠客观的替代方法.利用深度学习的方法实现基于面部表情的疼痛检测研究近年已取得显著进展,但复杂的结构和高计算成本制约了其实际应用.因此,本文提出了一个改进的3D卷积神经网络,采用轻量级的3D卷积神经网络L3D作为骨干网络,并结合改进的SE注意力机制,把多个不同尺度的特征进行融合,捕捉疼痛序列中具有较强辨别能力的时空特征.在UNBC-McMaster和BioVid数据集上进行评估,与最新方法相比,该方法在疼痛检测性能以及计算复杂度上取得了优势. 展开更多
关键词 疼痛检测 疼痛表情 3D卷积神经网络 轻量级 注意力机制 特征融合
下载PDF
Review of Artificial Intelligence for Oil and Gas Exploration: Convolutional Neural Network Approaches and the U-Net 3D Model
7
作者 Weiyan Liu 《Open Journal of Geology》 CAS 2024年第4期578-593,共16页
Deep learning, especially through convolutional neural networks (CNN) such as the U-Net 3D model, has revolutionized fault identification from seismic data, representing a significant leap over traditional methods. Ou... Deep learning, especially through convolutional neural networks (CNN) such as the U-Net 3D model, has revolutionized fault identification from seismic data, representing a significant leap over traditional methods. Our review traces the evolution of CNN, emphasizing the adaptation and capabilities of the U-Net 3D model in automating seismic fault delineation with unprecedented accuracy. We find: 1) The transition from basic neural networks to sophisticated CNN has enabled remarkable advancements in image recognition, which are directly applicable to analyzing seismic data. The U-Net 3D model, with its innovative architecture, exemplifies this progress by providing a method for detailed and accurate fault detection with reduced manual interpretation bias. 2) The U-Net 3D model has demonstrated its superiority over traditional fault identification methods in several key areas: it has enhanced interpretation accuracy, increased operational efficiency, and reduced the subjectivity of manual methods. 3) Despite these achievements, challenges such as the need for effective data preprocessing, acquisition of high-quality annotated datasets, and achieving model generalization across different geological conditions remain. Future research should therefore focus on developing more complex network architectures and innovative training strategies to refine fault identification performance further. Our findings confirm the transformative potential of deep learning, particularly CNN like the U-Net 3D model, in geosciences, advocating for its broader integration to revolutionize geological exploration and seismic analysis. 展开更多
关键词 Deep Learning Convolutional Neural Networks (CNN) Seismic Fault Identification U-Net 3D Model Geological Exploration
下载PDF
基于高光谱图像和3D-CNN的苹果多品质参数无损检测 被引量:11
8
作者 王浩云 李晓凡 +2 位作者 李亦白 孙云晓 徐焕良 《南京农业大学学报》 CAS CSCD 北大核心 2020年第1期178-185,共8页
[目的]为解决水果品质无损检测中成本、效率、精度问题,提出了一种基于高光谱图像和三维卷积神经网络(3D-CNN)的苹果高光谱多品质参数同时检测方法。[方法]使用高光谱成像系统获取400~1000 nm波段的苹果样本的高光谱反射图像并使用S-G... [目的]为解决水果品质无损检测中成本、效率、精度问题,提出了一种基于高光谱图像和三维卷积神经网络(3D-CNN)的苹果高光谱多品质参数同时检测方法。[方法]使用高光谱成像系统获取400~1000 nm波段的苹果样本的高光谱反射图像并使用S-G平滑法对原始图像进行去噪处理,在此基础上,对采集到的高光谱图像通过多感兴趣位置的选取以及间隔波段抽取重组的方法进行样本扩充,再利用三维卷积神经网络建立样本扩充后的苹果高光谱图像与苹果糖度、硬度、含水量的多任务学习模型,通过该模型实现对苹果的糖度、硬度、含水量等品质参数的无损检测。[结果]采集245个苹果的高光谱图像及其对应的品质参数信息,通过样本扩充的方法将原始数据集扩充至9800个样本后进行建模和验证。结果表明:本算法建立的苹果糖度、硬度、水分的分类模型,在糖度类间隔为1°Brix、硬度类间隔为0.5 kg·cm-2、含水量类间隔为10%的情况下,糖度、硬度、水分的预测准确率分别为93.97%、92.29%和93.36%,回归模型糖度、硬度和水分的相关系数最高分别达到0.827、0.775和0.862,比最优的传统算法分别提高15.0%、17.0%和17.2%。[结论]本算法能够较准确实现苹果高光谱多品质参数同时检测,且相对传统方法预测精度有较大提升。 展开更多
关键词 苹果 高光谱 多品质参数 无损检测 三维卷积神经网络(3d-cnn)
下载PDF
结合MRI多模态信息和3D-CNNs特征提取的脑肿瘤分割研究 被引量:5
9
作者 杨新焕 张勇 《中国CT和MRI杂志》 2020年第9期4-6,23,共4页
目的探究结合MRI多模态信息和3D-CNNs特征提取对于脑肿瘤分割的价值。方法分析相比于未加入多模态3D-CNNs特征的方法,并对比2D-CNNs特征方法和3D-CNNs特征方法分割的结果,主要参考dice系数,假阳性率和sensitibity。结果在加入多模态3D-C... 目的探究结合MRI多模态信息和3D-CNNs特征提取对于脑肿瘤分割的价值。方法分析相比于未加入多模态3D-CNNs特征的方法,并对比2D-CNNs特征方法和3D-CNNs特征方法分割的结果,主要参考dice系数,假阳性率和sensitibity。结果在加入多模态3D-CNNs特征之后,患者的dice系数均有不同程度的提高,sensitibity系数也有改变,假阳性率显著得到改善;加上多模态3D-CNNs特征提取后,dice系数变为(88.26±4.65)%,显著优于多模态2D-CNNs特征提取的(83.67±4.22)%。而多模态2D-CNNs特征提取的运用甚至比单独使用灰度邻域结合haar小波低频系数的分割结果。结论基于多模态3D-CNNs特征提取的MRI脑肿瘤分割准确度高,适应不同患者不同模态之间的多变性和差异性,值得参考。 展开更多
关键词 3d-cnnS特征提取 MRI多模态信息 脑肿瘤分割
下载PDF
快速3D-CNN结合深度可分离卷积对高光谱图像分类 被引量:1
10
作者 王燕 梁琦 《计算机科学与探索》 CSCD 北大核心 2022年第12期2860-2869,共10页
针对卷积神经网络在高光谱图像特征提取和分类的过程中,存在空谱特征提取不充分以及网络层数太多引起的参数量大、计算复杂的问题,提出快速三维卷积神经网络(3D-CNN)结合深度可分离卷积(DSC)的轻量型卷积模型。该方法首先利用增量主成... 针对卷积神经网络在高光谱图像特征提取和分类的过程中,存在空谱特征提取不充分以及网络层数太多引起的参数量大、计算复杂的问题,提出快速三维卷积神经网络(3D-CNN)结合深度可分离卷积(DSC)的轻量型卷积模型。该方法首先利用增量主成分分析(IPCA)对输入的数据进行降维预处理;其次将输入模型的像素分割成小的重叠的三维小卷积块,在分割的小块上基于中心像素形成地面标签,利用三维核函数进行卷积处理,形成连续的三维特征图,保留空谱特征。用3D-CNN同时提取空谱特征,然后在三维卷积中加入深度可分离卷积对空间特征再次提取,丰富空谱特征的同时减少参数量,从而减少计算时间,分类精度也有所提高。所提模型在Indian Pines、Salinas Scene和University of Pavia公开数据集上验证,并且同其他经典的分类方法进行比较。实验结果表明,该方法不仅能大幅度节省可学习的参数,降低模型复杂度,而且表现出较好的分类性能,其中总体精度(OA)、平均分类精度(AA)和Kappa系数均可达99%以上。 展开更多
关键词 高光谱图像分类 空谱特征提取 三维卷积神经网络(3d-cnn) 深度可分离卷积(DSC) 深度学习
下载PDF
基于3D卷积神经网络的MPI新视点合成算法 被引量:1
11
作者 霍智勇 魏俊宇 +1 位作者 郭权 陈奕杭 《南京邮电大学学报(自然科学版)》 北大核心 2023年第5期77-82,共6页
多平面图像(Multiplane Image, MPI)能够构造出一种以相机为中心、按深度分层的三维场景显式表示,用于新视点合成研究与应用。由于MPI生成预测网络在训练时不能有效捕获深度平面间遮挡区域的空间特征,使得MPI合成的新视点图像往往存在... 多平面图像(Multiplane Image, MPI)能够构造出一种以相机为中心、按深度分层的三维场景显式表示,用于新视点合成研究与应用。由于MPI生成预测网络在训练时不能有效捕获深度平面间遮挡区域的空间特征,使得MPI合成的新视点图像往往存在明显的伪影和扭曲。为此提出利用3D卷积神经网络捕捉深度平面间的空间特征,用于提高对平面图像几何结构和Alpha值的预测能力,从而实现高质量MPI场景表示和新视点合成目标。在两个数据集上的数值实验表明,算法在窄基线视点外推和宽基线多视点内插任务中能够有效消除合成新视点图像中的伪影和扭曲。当参考视点水平基线宽度增大一倍且不增加MPI深度平面数量时,算法仍然能够有效地预测出不同深度平面的遮挡区域信息,从而保证了视点内插合成图像的质量。 展开更多
关键词 多平面图像 场景表示 视点图像合成 3D卷积神经网络
下载PDF
利用3D-RepVGG进行阿尔兹海默症诊断 被引量:1
12
作者 胡众义 张夏彬 《计算机应用》 CSCD 北大核心 2023年第S01期26-32,共7页
阿尔兹海默症(AD)临床症状为失忆、失语与丧失行动能力等。AD暂无有效治疗方法,但早期干预已证明有效,因此,AD早期诊断至关重要。针对该问题,基于RepVGG网络架构中的结构重参数化技术,将训练阶段的多分支卷积网络等效转换为预测阶段的... 阿尔兹海默症(AD)临床症状为失忆、失语与丧失行动能力等。AD暂无有效治疗方法,但早期干预已证明有效,因此,AD早期诊断至关重要。针对该问题,基于RepVGG网络架构中的结构重参数化技术,将训练阶段的多分支卷积网络等效转换为预测阶段的单分支卷积网络,获得多分支卷积网络性能高与单分支卷积网络速度快等优点;同时,利用3D卷积引入空间连续信息;最终,成功地将RepVGG网络架构与3D卷积融合,提出3D-RepVGG网络,以实现对AD、轻度认知障碍(MCI)和正常对照组(NC)的诊断。实验数据来自于公开数据库ADNI,原始的磁共振图像(MRI)使用SPM12进行预处理。预处理后数据输入3D-RepVGG进行AD/NC、MCI/NC、AD/MCI、AD/MCI/NC四种分类任务,分别获得了90.38%、85.90%、70.51%、62.50%的准确率。实验结果表明,3D-RepVGG在AD早期诊断任务上能获得较好的诊断结果。 展开更多
关键词 阿尔兹海默症 计算机辅助诊断 三维卷积神经网络 多分支卷积神经网络 图像分类
下载PDF
基于CEEMDAN-小波阈值和3D-CNN的变压器铁心松动故障诊断模型 被引量:4
13
作者 崔佳嘉 马宏忠 《电机与控制应用》 2022年第10期46-52,共7页
为了解决变压器铁心松动故障的识别与诊断,提出基于完全自适应噪声集合经验模态分解(CEEMDAN)-小波阈值的环境噪声去除方法,并提出使用三维卷积神经网络(3D-CNN)去识别基于声纹的变压器铁心松动故障诊断方法。搭建变压器铁心松动故障试... 为了解决变压器铁心松动故障的识别与诊断,提出基于完全自适应噪声集合经验模态分解(CEEMDAN)-小波阈值的环境噪声去除方法,并提出使用三维卷积神经网络(3D-CNN)去识别基于声纹的变压器铁心松动故障诊断方法。搭建变压器铁心松动故障试验平台,采集铁心在不同松动程度下的噪声信号;将采集的用于故障识别的声纹信号经过CEEMDAN-小波阈值算法,利用变压器本体噪声和环境噪声在峭度上的差异滤波,得到信噪比较高的变压器声纹信号;再将滤波后的声纹信号经过短时傅里叶变化生成时频矩阵,并用Mel滤波器降维得到Mel-语谱图,制作成适合3D-CNN输入格式的数据集;搭建好网络的各层,利用3D-CNN对变压器铁心松动故障进行分类和识别。试验结果表明:所提方法在考虑环境噪声的条件下,变压器铁心松动故障的识别率达到90%以上,可用于变压器铁心松动故障的识别和诊断。 展开更多
关键词 变压器 铁心松动故障 声纹信号 故障诊断 三维卷积神经网络
下载PDF
一种基于3D-CNN的微表情识别算法 被引量:5
14
作者 吴进 闵育 +1 位作者 李聪 张伟华 《电讯技术》 北大核心 2019年第10期1115-1120,共6页
微表情是一种持续时间很短暂的面部表情。针对其识别率低的问题,提出了一种基于三维卷积神经网络(3D Convolutionnal Neural Network,3D-CNN)的微表情识别算法。使用Keras作为网络框架,在3D-VGG-Block(3Dimension Visual Geometry Group... 微表情是一种持续时间很短暂的面部表情。针对其识别率低的问题,提出了一种基于三维卷积神经网络(3D Convolutionnal Neural Network,3D-CNN)的微表情识别算法。使用Keras作为网络框架,在3D-VGG-Block(3Dimension Visual Geometry Group Block,3D-VGG-Block)的基础上加入批量归一化算法以及丢弃法,提升网络深度与训练速度的同时有效地防止过拟合;针对数据集稀少的问题,采取随机设置起始帧的位置,提前设定每次读取帧序列的长度,循环操作,在将所有数据均遍历的同时,达到数据增广的目的。该算法在CASME II数据集上的识别率最高达68.85%,在识别率上有一定优势。 展开更多
关键词 微表情识别 深度学习 三维卷积神经网络 批量归一化算法 丢弃法
下载PDF
Dynamic Hand Gesture Recognition Using 3D-CNN and LSTM Networks 被引量:1
15
作者 Muneeb Ur Rehman Fawad Ahmed +4 位作者 Muhammad Attique Khan Usman Tariq Faisal Abdulaziz Alfouzan Nouf M.Alzahrani Jawad Ahmad 《Computers, Materials & Continua》 SCIE EI 2022年第3期4675-4690,共16页
Recognition of dynamic hand gestures in real-time is a difficult task because the system can never know when or from where the gesture starts and ends in a video stream.Many researchers have been working on visionbase... Recognition of dynamic hand gestures in real-time is a difficult task because the system can never know when or from where the gesture starts and ends in a video stream.Many researchers have been working on visionbased gesture recognition due to its various applications.This paper proposes a deep learning architecture based on the combination of a 3D Convolutional Neural Network(3D-CNN)and a Long Short-Term Memory(LSTM)network.The proposed architecture extracts spatial-temporal information from video sequences input while avoiding extensive computation.The 3D-CNN is used for the extraction of spectral and spatial features which are then given to the LSTM network through which classification is carried out.The proposed model is a light-weight architecture with only 3.7 million training parameters.The model has been evaluated on 15 classes from the 20BN-jester dataset available publicly.The model was trained on 2000 video-clips per class which were separated into 80%training and 20%validation sets.An accuracy of 99%and 97%was achieved on training and testing data,respectively.We further show that the combination of 3D-CNN with LSTM gives superior results as compared to MobileNetv2+LSTM. 展开更多
关键词 Convolutional neural networks 3d-cnn LSTM SPATIOTEMPORAL jester real-time hand gesture recognition
下载PDF
基于I3D-CNN的自闭症分类方法
16
作者 仇喆磊 王莉 +2 位作者 王晓 韦奕 梅雪 《计算机工程与设计》 北大核心 2022年第6期1644-1650,共7页
为解决传统基于静态功能网络连接的自闭症分类算法忽略了脑功能连接的时变特性问题,提出一种基于膨胀卷积网络(inflated three dimension convolution neural network,I3D-CNN)的自闭症分类识别方法。提取被试大脑的静息态功能核磁共振... 为解决传统基于静态功能网络连接的自闭症分类算法忽略了脑功能连接的时变特性问题,提出一种基于膨胀卷积网络(inflated three dimension convolution neural network,I3D-CNN)的自闭症分类识别方法。提取被试大脑的静息态功能核磁共振影像(rest state functional magnetic resonance imaging,RS-fMRI)每个感兴趣区域(region of interest,ROI)的时间序列,基于时间序列利用随机滑动时间窗口法,构建多个3D动态脑功能连接矩阵,使用I3D-CNN从3D动态脑功能连接矩阵中提取大脑的时空特征,建立自闭症分类模型。通过在ABIDE数据集上进行实验,验证了该方法的可行性和有效性。 展开更多
关键词 三维卷积神经网络 静息态功能核磁共振影像 动态功能网络 自闭症 分类
下载PDF
基于3D-CNN和时空注意力-卷积LSTM的抑郁症识别研究 被引量:1
17
作者 何浪 《首都师范大学学报(自然科学版)》 2021年第2期17-25,共9页
针对目前抑郁症识别方法中没有有效地从序列信息中刻画长时特征表示的问题,本文提出了一种基于三维卷积神经网络(3D-CNN)、时空注意力-卷积长短时记忆网络(STA-ConvLSTM)和空间金字塔池化(SPP)的端到端的抑郁症识别方法,计算在数据库AVE... 针对目前抑郁症识别方法中没有有效地从序列信息中刻画长时特征表示的问题,本文提出了一种基于三维卷积神经网络(3D-CNN)、时空注意力-卷积长短时记忆网络(STA-ConvLSTM)和空间金字塔池化(SPP)的端到端的抑郁症识别方法,计算在数据库AVEC2013和AVEC2014测试集上的抑郁症识别结果,并将本文结果与已发表文献结果进行对比分析.结果表明:在数据库AVEC2013和AVEC2014测试集上,平均绝对误差均为8.60,均方根误差分别为10.32和10.27,文献结果比较表明本文的抑郁症识别结果优于当前大多数基于面部视频的抑郁症识别方法. 展开更多
关键词 抑郁症 时空注意力机制ConvLSTM(STA-ConvLSTM) 三维卷积神经网络 卷积长短时记忆神经网络
下载PDF
基于3D双流网络的地下岩层破裂微震震源定位
18
作者 吴泱序 陈平 李波 《煤炭科学技术》 EI CAS CSCD 北大核心 2023年第S02期13-24,共12页
地下微震震源中心探测技术主要用于地下岩层破裂,矿井爆破振动监测,工程爆破定向拆除等定位问题。针对目前微震采集传感器采集时钟误差以及采集数据高频信息缺失的问题,提出了基于3D双流网络的方法对地下岩层破裂进行分布式微震震源定... 地下微震震源中心探测技术主要用于地下岩层破裂,矿井爆破振动监测,工程爆破定向拆除等定位问题。针对目前微震采集传感器采集时钟误差以及采集数据高频信息缺失的问题,提出了基于3D双流网络的方法对地下岩层破裂进行分布式微震震源定位。该方法通过空间扫描的方式使低维的振动波信息高维化,把地震波形数据从时间域转化为能量域,建立震源中心与高维能量分布的对应关系;然后通过3D-CNN网络提取能量域特征,convLSTM网络逐步优化震源中心区域,以得到精准的震源中心定位。结果表明,基于3D双流网络的地下岩层破裂微震震源定位明显优于传统的基于走时类震源定位方法,该方法在高信噪比数据中,具有更强的数据拟合能力和抗干扰能力。并且通过小场地静态爆炸试验结果表明,该定位方法在近场微震震源定位中优于传统方法。 展开更多
关键词 地下毁伤 微震定位 三维卷积网络 长短期记忆神经网络
下载PDF
A Lightweight Driver Drowsiness Detection System Using 3DCNN With LSTM 被引量:1
19
作者 Sara A.Alameen Areej M.Alhothali 《Computer Systems Science & Engineering》 SCIE EI 2023年第1期895-912,共18页
Today,fatalities,physical injuries,and significant economic losses occur due to car accidents.Among the leading causes of car accidents is drowsiness behind the wheel,which can affect any driver.Drowsiness and sleepin... Today,fatalities,physical injuries,and significant economic losses occur due to car accidents.Among the leading causes of car accidents is drowsiness behind the wheel,which can affect any driver.Drowsiness and sleepiness often have associated indicators that researchers can use to identify and promptly warn drowsy drivers to avoid potential accidents.This paper proposes a spatiotemporal model for monitoring drowsiness visual indicators from videos.This model depends on integrating a 3D convolutional neural network(3D-CNN)and long short-term memory(LSTM).The 3DCNN-LSTM can analyze long sequences by applying the 3D-CNN to extract spatiotemporal features within adjacent frames.The learned features are then used as the input of the LSTM component for modeling high-level temporal features.In addition,we investigate how the training of the proposed model can be affected by changing the position of the batch normalization(BN)layers in the 3D-CNN units.The BN layer is examined in two different placement settings:before the non-linear activation function and after the non-linear activation function.The study was conducted on two publicly available drowsy drivers datasets named 3MDAD and YawDD.3MDAD is mainly composed of two synchronized datasets recorded from the frontal and side views of the drivers.We show that the position of the BN layers increases the convergence speed and reduces overfitting on one dataset but not the other.As a result,the model achieves a test detection accuracy of 96%,93%,and 90%on YawDD,Side-3MDAD,and Front-3MDAD,respectively. 展开更多
关键词 3d-cnn deep learning driver drowsiness detection LSTM spatiotemporal features
下载PDF
Attention Based Multi-Patched 3D-CNNs with Hybrid Fusion Architecture for Reducing False Positives during Lung Nodule Detection
20
作者 Vamsi Krishna Vipparla Premith Kumar Chilukuri Giri Babu Kande 《Journal of Computer and Communications》 2021年第4期1-26,共26页
In lung nodules there is a huge variation in structural properties like Shape, Surface Texture. Even the spatial properties vary, where they can be found attached to lung walls, blood vessels in complex non-homogenous... In lung nodules there is a huge variation in structural properties like Shape, Surface Texture. Even the spatial properties vary, where they can be found attached to lung walls, blood vessels in complex non-homogenous lung structures. Moreover, the nodules are of small size at their early stage of development. This poses a serious challenge to develop a Computer aided diagnosis (CAD) system with better false positive reduction. Hence, to reduce the false positives per scan and to deal with the challenges mentioned, this paper proposes a set of three diverse 3D Attention based CNN architectures (3D ACNN) whose predictions on given low dose Volumetric Computed Tomography (CT) scans are fused to achieve more effective and reliable results. Attention mechanism is employed to selectively concentrate/weigh more on nodule specific features and less weight age over other irrelevant features. By using this attention based mechanism in CNN unlike traditional methods there was a significant gain in the classification performance. Contextual dependencies are also taken into account by giving three patches of different sizes surrounding the nodule as input to the ACNN architectures. The system is trained and validated using a publicly available LUNA16 dataset in a 10 fold cross validation approach where a competition performance metric (CPM) score of 0.931 is achieved. The experimental results demonstrate that either a single patch or a single architecture in a one-to-one fashion that is adopted in earlier methods cannot achieve a better performance and signifies the necessity of fusing different multi patched architectures. Though the proposed system is mainly designed for pulmonary nodule detection it can be easily extended to classification tasks of any other 3D medical diagnostic computed tomography images where there is a huge variation and uncertainty in classification. 展开更多
关键词 3d-cnn Attention Gated Networks Lung Nodules Medical Imaging X-Ray Computed Tomography
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部