期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于独立区域3D注意力机制的人群位置计数方法
1
作者 张天飞 龙海燕 +1 位作者 丁娇 周荣强 《平顶山学院学报》 2022年第2期44-49,共6页
针对密集场景下因尺度变化和遮挡等现象导致的人群计数精确率不高,在HRNet中将真值图生成为互不重叠的独立区域,便于网络密度图人群位置统计;然后引入3D注意力机制,使得网络专注于特征图的有用信息;最后在训练时将均方误差损失(MSE loss... 针对密集场景下因尺度变化和遮挡等现象导致的人群计数精确率不高,在HRNet中将真值图生成为互不重叠的独立区域,便于网络密度图人群位置统计;然后引入3D注意力机制,使得网络专注于特征图的有用信息;最后在训练时将均方误差损失(MSE loss)、L1损失和交叉熵损失(Cross Entropy loss)相结合作为总的损失函数,优化模型泛化能力.上述方法的结合提高了模型在人群计数及人群位置定位中的准确性.将该模型在公开数据集NWPU、Shanghai Tech和UCF-QNRF中与近年来的主要方法进行对比,实验结果表明该模型可有效提升人群位置计数问题的准确性和鲁棒性. 展开更多
关键词 人群计数 人群位置 独立区域 3d注意力机制 损失函数
下载PDF
融合3D注意力和Transformer的图像去雨网络 被引量:4
2
作者 王美华 柯凡晖 +2 位作者 梁云 范衠 廖磊 《中国图象图形学报》 CSCD 北大核心 2022年第5期1509-1521,共13页
目的因为有雨图像中雨线存在方向、密度和大小等各方面的差异,单幅图像去雨依旧是一个充满挑战的研究问题。现有算法在某些复杂图像上仍存在过度去雨或去雨不足等问题,部分复杂图像的边缘高频信息在去雨过程中被抹除,或图像中残留雨成... 目的因为有雨图像中雨线存在方向、密度和大小等各方面的差异,单幅图像去雨依旧是一个充满挑战的研究问题。现有算法在某些复杂图像上仍存在过度去雨或去雨不足等问题,部分复杂图像的边缘高频信息在去雨过程中被抹除,或图像中残留雨成分。针对上述问题,本文提出三维注意力和Transformer去雨网络(three-dimension attention and Transformer deraining network,TDATDN)。方法将三维注意力机制与残差密集块结构相结合,以解决残差密集块通道高维度特征融合问题;使用Transformer计算特征全局关联性;针对去雨过程中图像高频信息被破坏和结构信息被抹除的问题,将多尺度结构相似性损失与常用图像去雨损失函数结合参与去雨网络训练。结果本文将提出的TDATDN网络在Rain12000雨线数据集上进行实验。其中,峰值信噪比(peak signal to noise ratio,PSNR)达到33.01 d B,结构相似性(structural similarity,SSIM)达到0.9278。实验结果表明,本文算法对比以往基于深度学习的神经网络去雨算法,显著改善了单幅图像去雨效果。结论本文提出的TDATDN图像去雨网络结合了3D注意力机制、Transformer和编码器—解码器架构的优点,可较好地完成单幅图像去雨工作。 展开更多
关键词 单幅图像去雨 卷积神经网络(CNN) TRANSFORMER 3d注意力 U-Net
原文传递
面向时空交通栅格流量预测的3D通道注意力网络
3
作者 童凯南 林友芳 +2 位作者 刘军 郭晟楠 万怀宇 《国防科技大学学报》 EI CAS CSCD 北大核心 2022年第3期41-49,共9页
城市交通流量预测对交通管理和公共安全具有重要意义。然而,交通栅格流量数据中的规律在时刻变化,在城市中存在全局范围的时空间关系,并且不同特征通道在每个城市区域上有不同的重要性。为解决这些挑战并做出更准确的预测,设计了一种新... 城市交通流量预测对交通管理和公共安全具有重要意义。然而,交通栅格流量数据中的规律在时刻变化,在城市中存在全局范围的时空间关系,并且不同特征通道在每个城市区域上有不同的重要性。为解决这些挑战并做出更准确的预测,设计了一种新颖的时空神经网络模型--3D通道注意力网络(three-dimensional channel-wise attention networks,3D-CANet)。提出一个3D通道内注意力(three-dimensional inner channel attention,3D-InnerCA)单元来动态捕获各个通道中不同的全局时空相关性,同时设计通道间注意力(inter channel attention,InterCA)单元来自适应地重校准每个区域上不同特征通道的贡献。在3个真实交通栅格流量数据集上的实验结果表明,3D-CANet模型的预测能力优于其他对比方法,证明了模型的有效性。 展开更多
关键词 时空数据 交通栅格流量 3d通道注意力 通道内注意力 通道间注意力
下载PDF
基于多序列MRI的3D关系注意力网络预测HLA-B27阴性中轴性脊柱关节病
4
作者 邹青清 王梦虹 +2 位作者 陆紫箫 赵英华 冯前进 《南方医科大学学报》 CAS CSCD 北大核心 2023年第11期1955-1964,共10页
目的建立一种新的3D多序列关系注意力网络,通过探索不同磁共振成像(MRI)序列图像的互补和相关信息,提升对人类白细胞抗原(HLA)-B27阴性中轴性脊柱关节病(axSpA)的诊断性能。方法回顾性收集2010年1月~2021年8月南方医科大学第三附属医院(... 目的建立一种新的3D多序列关系注意力网络,通过探索不同磁共振成像(MRI)序列图像的互补和相关信息,提升对人类白细胞抗原(HLA)-B27阴性中轴性脊柱关节病(axSpA)的诊断性能。方法回顾性收集2010年1月~2021年8月南方医科大学第三附属医院(TAH组)的375例和南海医院(NHH组)的49例HLA-B27阴性参与者(TAH组:164例axSpA,211例非axSpA;NHH组:27例axSpA,22例非axSpA)的两种参数MRI,包括T1加权图像(T1WI)和压脂序列MRI(FS-MRI),以及相关临床数据。提出一个基于多序列MRI的3D关系注意力网络MSFANet,实现对HLA-B27阴性axSpA与非axSpA的自动鉴别诊断。MSFANet由一个浅层共享特征模块和一个类感知特征学习模块组成,其中类感知特征学习模块采用3D多序列关系注意力机制对多序列MRI特征进行细化和融合。提出一种混合损失函数,通过学习不同支路的损失权重系数来提升MSFANet对序列特征的识别能力,从而增强分类性能。结果实验结果表明,MSFANet优于其它几种最先进的多序列融合算法,其中内部验证集上的AUC、准确度、敏感度和特异度分别达到了0.840,77.93%,83.70%和70.29%,独立外部验证集(NHH)上的上述性能分别达到了0.783,74.47%,82.43%和70.40%。各项差异均具有统计学意义(P<0.05)。此外,消融实验显示,相同框架下,MSFANet的性能优于基于单序列MRI的模型,证实了融合多序列MRI的有效性和必要性。深度可视化技术显示MSFANet在分类过程中集中于学习图像异常区域的信息。结论本研究成功构建基于多序列MRI的3D深度神经网络对HLA-B27阴性axSpA和非axSpA进行鉴别诊断,并验证了采用多序列关系注意力机制对提升网络分类性能的有效性。 展开更多
关键词 中轴性脊柱关节病诊断 HLA-B27阴性 磁共振成像 3d多序列关系注意力机制 混合损失
下载PDF
3D卷积增强的驾驶员人物交互行为识别
5
作者 程鸣 严运兵 《物流工程与管理》 2024年第1期34-39,共6页
驾驶员抽烟和打电话的行为属于典型的人物交互行为,为提高模型在驾驶环境中,对遮挡和光照变化的抵抗能力以及人物交互行为匹配的准确性,研究首先提出一种2D扩张分组注意力机制方法对目标检测网络进行优化,提高人路和物路的小目标检测性... 驾驶员抽烟和打电话的行为属于典型的人物交互行为,为提高模型在驾驶环境中,对遮挡和光照变化的抵抗能力以及人物交互行为匹配的准确性,研究首先提出一种2D扩张分组注意力机制方法对目标检测网络进行优化,提高人路和物路的小目标检测性能;然后提出一种3D扩张分组注意力机制与3D分组卷积融合的高精度轻量化模块,构建动态视频的行为识别模型,增强时序空间的非线性特征提取能力;最后将图片的帧间交并比统计判断结果与动态视频行为识别模型预测的结果相融合以做出最终的驾驶员人物交互行为判断。实验结果证明,2D和3D扩张分组注意力机制在行为识别中的有效性,驾驶员人物交互行为平均准确率和召回率提高了12.5%及7.72%。尤其在香烟和手机遮挡或光线条件不利的场景下提升明显,并能解决驾驶员与其后排乘客的行为混淆识别问题。 展开更多
关键词 人物交互行为 3d注意力机制 3d卷积 抽烟 打电话
下载PDF
基于3D多尺度卷积的非接触心率估计模型
6
作者 潘天宝 程宁 刘金江 《传感器与微系统》 CSCD 北大核心 2023年第7期43-47,共5页
为了在真实环境下实现更准确的非接触式心率(HR)估计,提出一种远程光电容积描记术(rPPG)和HR信号恢复任务的端到端时空卷积神经网络(CNN)模型。模型使用3D多尺度卷积注意力获取多尺度特征并融合上下文信息。其次引入自注意力卷积长短期... 为了在真实环境下实现更准确的非接触式心率(HR)估计,提出一种远程光电容积描记术(rPPG)和HR信号恢复任务的端到端时空卷积神经网络(CNN)模型。模型使用3D多尺度卷积注意力获取多尺度特征并融合上下文信息。其次引入自注意力卷积长短期记忆(SA-ConvLSTM)提取具有全局依赖和局部依赖的时间空间特征。最后,根据rPPG和HR信号的强关联性,使用多任务学习方法来提高模型性能。在公开的UBFC-rPPG和COHFACE数据集上进行实验测试,结果表明:提出的网络模型在非接触式HR提取中具有更好鲁棒性。 展开更多
关键词 非接触心率提取 3d多尺度卷积注意力 注意力卷积长短期记忆 多任务学习
下载PDF
General and robust voxel feature learning with Transformer for 3D object detection 被引量:1
7
作者 LI Yang GE Hongwei 《Journal of Measurement Science and Instrumentation》 CAS CSCD 2022年第1期51-60,共10页
The self-attention networks and Transformer have dominated machine translation and natural language processing fields,and shown great potential in image vision tasks such as image classification and object detection.I... The self-attention networks and Transformer have dominated machine translation and natural language processing fields,and shown great potential in image vision tasks such as image classification and object detection.Inspired by the great progress of Transformer,we propose a novel general and robust voxel feature encoder for 3D object detection based on the traditional Transformer.We first investigate the permutation invariance of sequence data of the self-attention and apply it to point cloud processing.Then we construct a voxel feature layer based on the self-attention to adaptively learn local and robust context of a voxel according to the spatial relationship and context information exchanging between all points within the voxel.Lastly,we construct a general voxel feature learning framework with the voxel feature layer as the core for 3D object detection.The voxel feature with Transformer(VFT)can be plugged into any other voxel-based 3D object detection framework easily,and serves as the backbone for voxel feature extractor.Experiments results on the KITTI dataset demonstrate that our method achieves the state-of-the-art performance on 3D object detection. 展开更多
关键词 3d object detection self-attention networks voxel feature with Transformer(VFT) point cloud encoder-decoder
下载PDF
特征对齐与上下文引导的多视图三维重建
8
作者 熊超 王云艳 罗雨浩 《图学学报》 CSCD 北大核心 2024年第5期1008-1016,共9页
针对三维重建对细小特征及边缘区域重建欠佳的问题,提出了一个基于特征对齐与上下文引导的多视图三维重建网络,即AGA-MVSNet。首先,构建了一个特征对齐模块(FA)与特征选择模块(FS),能够将特征金字塔不同层级的特征先对齐之后再进行融合... 针对三维重建对细小特征及边缘区域重建欠佳的问题,提出了一个基于特征对齐与上下文引导的多视图三维重建网络,即AGA-MVSNet。首先,构建了一个特征对齐模块(FA)与特征选择模块(FS),能够将特征金字塔不同层级的特征先对齐之后再进行融合,提高对小尺寸物体和边缘区域的特征提取能力;然后,在代价体正则化中加入了一个上下文引导模块,该模块能够在略微增加运行内存的情况下充分利用周围信息,增强成本体积之间的相关性,提高三维重建的精度与完整度;最后,在DTU数据集上进行了实验,实验结果表明,该方法相比于基准网络CasMVSNet精度提升了2.2%,整体重建质量提升了2.5%。此外,在Tanks and Temples数据集上的表现相较一些已知的方法也十分优异,且在BlendedMVS数据集上也生成了不错的点云效果。 展开更多
关键词 深度学习 多视图三维重建 特征对齐 上下文引导 3d注意力机制
下载PDF
一种融合多要素时空特征的数值预报风场订正模型
9
作者 谢凯文 杨昊 +2 位作者 邹茂扬 徐虹 马亚宇 《软件导刊》 2024年第11期84-92,共9页
目前,数值天气预报产品已广泛应用于气象预报业务中。针对数值预报模式本身不足导致的预报误差,为进一步提高其预报准确率,提出一种融合多要素时空特征的基于U-net和3D注意力机制的风场订正模型。采用该模型对中国气象局研发的国家气象... 目前,数值天气预报产品已广泛应用于气象预报业务中。针对数值预报模式本身不足导致的预报误差,为进一步提高其预报准确率,提出一种融合多要素时空特征的基于U-net和3D注意力机制的风场订正模型。采用该模型对中国气象局研发的国家气象中心GRAPES-3KM模式预报的近地面10 m风场进行偏差订正,以RMSE、MAE作为评价指标,与原数值预报产品、传统订正方法以及U-net、CU-net模型进行比较。实验结果表明,经过所提模型订正后的10 m纬向风RMSE相较原预报数据、LASSO回归、U-net、CU-net模型降低了4.19%~42.67%,MAE降低了6.06%~45.29%;10 m经向风RMSE指标降低了8.55%~41.35%,MAE降低了6.54%~40.82%;10 m全风速RMSE降低了6.14%~29.41%,MAE降低了1.5%~21.08%。所提模型相较对照模型有更好的订正效果,同时未出现订正结果过于平滑的情况。 展开更多
关键词 数值天气预报 深度学习 偏差订正 多要素融合 3d注意力
下载PDF
基于架构搜索的雷达回波降雨强度分类算法
10
作者 柴怡君 陆冰鉴 +1 位作者 陆振宇 颜诗洋 《信息技术》 2024年第10期1-6,共6页
天气雷达是降雨监测的重要手段,基于天气雷达降雨回波特征实现准确的降雨强度分类至关重要。文中提出了基于3D注意力模块的CNN(EA-CNN)进化搜索算法,算法利用遗传算法(GA)自动搜索最优结构,快速优化CNN架构的宽度与深度,准确找到最佳CN... 天气雷达是降雨监测的重要手段,基于天气雷达降雨回波特征实现准确的降雨强度分类至关重要。文中提出了基于3D注意力模块的CNN(EA-CNN)进化搜索算法,算法利用遗传算法(GA)自动搜索最优结构,快速优化CNN架构的宽度与深度,准确找到最佳CNN结构,具有很强的泛化能力。算法引入3D注意力模块有效抑制分类中的干扰像素问题,能够准确提取各强度降雨特征,帮助相关人士从雷达回波中快速获取降雨分级结果。实验表明,与4种经典的算法(KNN、SVM、VGG、ResNet12)相比,所提出的算法在人力、物力等成本上更具竞争性,分类准确率提升7.95%。 展开更多
关键词 卷积神经网络(CNN) 神经架构搜索(NAS) 雷达降雨强度 遗传算法(GA) 3d注意力模块
下载PDF
基于YOLOx残差块融合CoA模块的改进检测网络 被引量:4
11
作者 安鹤男 杨佳洲 +2 位作者 邓武才 管聪 马超 《计算机系统应用》 2022年第8期245-251,共7页
YOLOx-Darknet53是以YOLOv3为基准增加各种技巧(trick)升级改进的检测网络,但其仍然是以Darknet53为特征提取骨干网络(backbone),因此网络的特征提取能力仍有欠缺.本文依据CoTNet中的注意力机制改进得到CoA(contextual attention)模块,... YOLOx-Darknet53是以YOLOv3为基准增加各种技巧(trick)升级改进的检测网络,但其仍然是以Darknet53为特征提取骨干网络(backbone),因此网络的特征提取能力仍有欠缺.本文依据CoTNet中的注意力机制改进得到CoA(contextual attention)模块,并将其替代YOLOx骨干网络残差块里的3×3卷积,得到融合注意力后的新残差块,加强了骨干网络的特征提取能力,并在Pascal VOC2007数据集上进行对比实验,融合CoA模块的网络比原网络的平均精度均值AP@[.5:.95]高1.4,AP@0.5高1.4;在改进骨干网络后的YOLOx检测头前加入无参3D注意力模块,得到最终改进的检测网络,进行上述对比实验,结果表明比原网络的AP@[.5:.95]高1.6,AP@0.5高1.5.因此,改进后的网络比原网络检测更加精准,在工业应用中能达到更好的检测效果. 展开更多
关键词 YOLOx 骨干网络 残差块 CoA模块 3d注意力 深度学习 目标检测
下载PDF
基于改进YOLOv7-tiny的坦克车辆检测方法 被引量:1
12
作者 郑陆石 胡晓锋 +2 位作者 于伟国 赵东志 张鸿涛 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第12期285-292,共8页
针对不同种类无人机航拍高度相差较大、图像分辨率不佳引起的坦克车辆检测算法效果不佳、速度慢等问题,提出一种基于改进YOLOv7-tiny的无人机视角坦克车辆检测算法。首先构建包含568幅图像、2132个目标的坦克车辆数据集。其次对YOLOv7-t... 针对不同种类无人机航拍高度相差较大、图像分辨率不佳引起的坦克车辆检测算法效果不佳、速度慢等问题,提出一种基于改进YOLOv7-tiny的无人机视角坦克车辆检测算法。首先构建包含568幅图像、2132个目标的坦克车辆数据集。其次对YOLOv7-tiny网络进行3个方面改进:提出了AC-ELAN网络结构并加入3D注意力机制,提高对目标信息的提取能力;引入SPPCSPC结构进一步扩大模型的感受野,同时能够有效减少训练学习时间;将损失函数计算方法替换为WIoU,聚焦于普通质量锚框,加速了模型收敛。最后实验结果表明,改进算法在自建数据集上表现优异,比传统的YOLOv7-tiny平均精度提升5.0%,在GPU设备上检测速度达到71帧/s,能够在无人机计算平台实现实时检测。 展开更多
关键词 目标检测 YOLOv7-tiny网络 非对称卷积 3d注意力机制 WIoU损失
下载PDF
基于PointPillars改进的点云目标检测算法
13
作者 何俊杰 任明武 《计算机与数字工程》 2023年第10期2313-2317,共5页
现有的点云目标检测方法虽然层出不穷,但主要以提升检测精度为主,检测效率较低,很难满足实际应用时的实时性需求。PointPillars[1]方法通过一种创新的点云特征处理方法,明显提升了点云目标检测的速度,为工业界的实际应用提供了可能性,... 现有的点云目标检测方法虽然层出不穷,但主要以提升检测精度为主,检测效率较低,很难满足实际应用时的实时性需求。PointPillars[1]方法通过一种创新的点云特征处理方法,明显提升了点云目标检测的速度,为工业界的实际应用提供了可能性,但其精度相比速度略有欠缺。论文基于多尺度特征融合和3D注意力机制,对PointPillars方法的结构进行改进,提高了原方法对于多尺度目标的检测精度,弥补了该方法相比主流方法在检测精度上的不足。改进后的方法兼具较高的检测精度和较快的检测速度,具有一定的工程应用价值。 展开更多
关键词 点云 目标检测 PointPillars 多尺度 3d注意力
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部