期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
复杂场景下自适应注意力机制融合实时语义分割
1
作者 陈丹 刘乐 +2 位作者 王晨昊 白熙茹 王子晨 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3334-3342,共9页
实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息... 实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息,再经过特征融合网络(FFN)获得准确语义图像。AAFNet采用扩展的深度可分离卷积(DDW)可增大语义特征提取感受野,提出自适应平均池化(Avp)和自适应最大池化(Amp)构成自适应注意力机制融合模块(AAFM),可细化目标边缘分割效果并降低小目标的漏分率。最后在复杂城市街道场景Cityscapes和CamVid数据集上分别进行了语义分割实验,所设计的AAFNet以32帧/s(Cityscapes)和52帧/s(CamVid)的推理速度获得73.0%和69.8%的平均分割精度(mIoU),且与扩展的空间注意力网络(DSANet)、多尺度上下文融合网络(MSCFNet)以及轻量级双边非对称残差网络(LBARNet)相比,AAFNet平均分割精度最高。 展开更多
关键词 卷积神经网络 复杂城市街道场景 扩展的深度可分离卷积 自适应注意力机制融合 分割精度
下载PDF
基于自适应注意力机制的红外与可见光图像目标检测
2
作者 赵松璞 杨利萍 +3 位作者 赵昕 彭志远 梁东兴 梁洪军 《红外技术》 CSCD 北大核心 2024年第4期443-451,共9页
针对红外和可见光目标检测方法存在的不足,将深度学习技术与多源目标检测相结合,提出了一种基于自适应注意力机制的目标检测方法。该方法首先以深度可分离卷积为核心构建双源特征提取结构,分别提取红外和可见光目标特征。其次,为充分互... 针对红外和可见光目标检测方法存在的不足,将深度学习技术与多源目标检测相结合,提出了一种基于自适应注意力机制的目标检测方法。该方法首先以深度可分离卷积为核心构建双源特征提取结构,分别提取红外和可见光目标特征。其次,为充分互补目标多模态信息,设计了自适应注意力机制,以数据驱动的方式加权融合红外和可见光特征,保证特征充分融合的同时降低噪声干扰。最后,针对多尺度目标检测,将自适应注意力机制结合多尺度参数来提取并融合目标全局和局部特征,提升尺度不变性。通过实验表明,所提方法相较于同类型目标检测算法能够准确高效地在复杂场景下实现目标识别和定位,并且在实际变电站设备检测中,该方法也体现出更高的泛化性和鲁棒性,可以有效辅助机器人完成目标检测任务。 展开更多
关键词 红外与可见光 目标检测 深度学习 自适应注意力机制
下载PDF
基于自适应注意力机制的复杂场景下牛脸检测算法 被引量:5
3
作者 齐咏生 焦杰 +2 位作者 鲍腾飞 王朝霞 杜晓旭 《农业工程学报》 EI CAS CSCD 北大核心 2023年第14期173-183,共11页
牛面部检测与识别是牛场智能化养殖的关键,但由于牧场养殖环境的复杂性,牛脸检测会受到模糊、逆光和遮挡3种常见环境因素的严重干扰。针对此问题,该研究提出一种复杂场景下基于自适应注意力机制的牛脸检测算法,该算法首先针对3种干扰因... 牛面部检测与识别是牛场智能化养殖的关键,但由于牧场养殖环境的复杂性,牛脸检测会受到模糊、逆光和遮挡3种常见环境因素的严重干扰。针对此问题,该研究提出一种复杂场景下基于自适应注意力机制的牛脸检测算法,该算法首先针对3种干扰因素分别设计了评价指标,并将3种不同类型的评价指标通过模糊隶属度函数进行归一化,并确定自适应权重系数,真实反映目标所处场景的复杂性;之后,基于YOLOV7-tiny在主干特征提取网络引入一种注意力机制CDAA(composite dual-branch adaptive attention),设计通道和空间注意力并行结构,并融合自适应权重系数,有效加强相应注意力分支的权重,提高网络在复杂场景下的特征提取能力,解决复杂场景下网络检测精度差的问题;最后,将图像场景评价指标引入损失函数,对大尺度网格损失函数的权重进行自适应调整,使网络在训练过程中更专注于数量较多的小型目标,从而提升网络整体的检测精度。为检测算法的有效性和实时性,在特定数据集上进行消融试验,并与多种经典检测算法进行对比,并移植至Jetson Xavier NX平台测试。测试结果表明,该算法检测精度达到89.58%,相较于原YOLOV7-tiny网络,牛脸检测精度提高了7.34个百分点。检测速度达到62帧/s,在检测速度几乎不损失的条件下,检测效果优于原网络与对比网络。研究结果可为复杂场景下的牛脸高效检测提供参考。 展开更多
关键词 机器视觉 算法 YOLOV7-tiny 复杂场景 自适应注意力机制 牛脸检测
下载PDF
基于全局-局部特征和自适应注意力机制的图像语义描述算法 被引量:6
4
作者 赵小虎 尹良飞 赵成龙 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2020年第1期126-134,共9页
为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法.在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对... 为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法.在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对图像的关注点,对图像细节的描述更加完善;在解码时加入注意力机制对图像特征加权输入,可以自适应选择当前时刻输出的文本单词对视觉信息与语义信息的依赖权重,有效地提高对图像语义描述的性能.实验结果表明,该方法相对于其他语义描述算法效果更有竞争力,可以更准确、更细致地识别图片中的物体,对输入图像进行更全面地描述;对于微小的物体的识别准确率更高. 展开更多
关键词 图像语义描述 图像关注点 高层语义信息 描述句子细节 全局-局部特征提取 自适应注意力机制
下载PDF
融合分散自适应注意力机制的多尺度遥感影像建筑物实例细化提取 被引量:8
5
作者 江宝得 黄威 +1 位作者 许少芬 巫勇 《测绘学报》 EI CSCD 北大核心 2023年第9期1504-1514,共11页
遥感影像建筑物准确、高效的自动提取方法有着广泛的用途。针对现有遥感影像建筑物提取方法难以兼顾不同大小的建筑物,导致小尺度建筑物不同程度上漏检及提取的建筑物轮廓边界模糊等问题,本文提出一种融合分散自适应注意力机制的多尺度... 遥感影像建筑物准确、高效的自动提取方法有着广泛的用途。针对现有遥感影像建筑物提取方法难以兼顾不同大小的建筑物,导致小尺度建筑物不同程度上漏检及提取的建筑物轮廓边界模糊等问题,本文提出一种融合分散自适应注意力机制的多尺度遥感影像建筑物实例细化提取方法(MBRef-CNN)。首先采用融合分散自适应注意力机制的遥感影像多尺度特征提取网络(SA-FPN)学习多尺度建筑物的特征,然后利用区域候选网络(RPN)预测单个建筑物实例的目标框位置,最后使用边界细化网络(BndRN)迭代获取精确的建筑物掩膜。在WHU aerial imagery dataset数据集上,通过与现有主流方法进行对比试验表明,本文方法的建筑物掩膜提取精确度比其他表现优秀的主流分割算法更高,在多尺度的建筑物提取上表现出良好的综合性能,且在小尺度的建筑物提取上具有明显的精度优势。 展开更多
关键词 建筑物细化提取 分散注意力网络 自适应注意力机制 多尺度 遥感影像 深度学习
下载PDF
基于Deeplab V3 Plus的自适应注意力机制图像分割算法 被引量:11
6
作者 杨贞 彭小宝 +1 位作者 朱强强 殷志坚 《计算机应用》 CSCD 北大核心 2022年第1期230-238,共9页
针对Deeplab V3 Plus在下采样操作中图像细节信息和小目标信息过早丢失的问题,提出了一种基于Deeplab V3 Plus网络架构的自适应注意力机制图像语义分割算法。首先,在Deeplab V3 Plus主干网络的输入层、中间层和输出层均嵌入注意力机制模... 针对Deeplab V3 Plus在下采样操作中图像细节信息和小目标信息过早丢失的问题,提出了一种基于Deeplab V3 Plus网络架构的自适应注意力机制图像语义分割算法。首先,在Deeplab V3 Plus主干网络的输入层、中间层和输出层均嵌入注意力机制模块,并且引入一个权重值与每个注意力机制模块相乘,以达到约束注意力机制模块的目的;其次,在PASCAL VOC2012公共分割数据集上训练嵌入注意力模块的Deeplab V3 Plus,以此手动获取注意力机制模块权重值(经验值);然后,探索输入层、中间层和输出层中注意力机制模块的多种融合方式;最后,将注意力机制模块的权重值更改为反向传播自动更新,从而得到注意力机制模块的最优权值和最优分割模型。实验结果表明,与原始Deeplab V3 Plus网络结构相比,引入自适应注意力机制的Deeplab V3 Plus网络结构在PASCAL VOC2012公共分割据集和植物虫害数据集上的平均交并比(MIOU)分别提高了1.4个百分点和0.7个百分点。 展开更多
关键词 语义分割 下采样操作 自适应注意力机制 注意力机制模块权重值 DeeplabV3 Plus
下载PDF
基于自适应多尺度注意力机制的CNN-GRU矿用电动机健康状态评估 被引量:1
7
作者 谭东贵 袁逸萍 樊盼盼 《工矿自动化》 CSCD 北大核心 2024年第2期138-146,共9页
利用多传感器信息融合技术进行电动机健康状态评估时,矿用电动机监测数据中存在异常值和缺失值,而卷积神经网络和循环神经网络等深度学习模型在数据质量下降严重的情况下难以有效提取数据特征和更新网络权重,导致梯度消失或爆炸等问题... 利用多传感器信息融合技术进行电动机健康状态评估时,矿用电动机监测数据中存在异常值和缺失值,而卷积神经网络和循环神经网络等深度学习模型在数据质量下降严重的情况下难以有效提取数据特征和更新网络权重,导致梯度消失或爆炸等问题。针对上述问题,提出了一种基于自适应多尺度注意力机制的CNN-GRU(CNN-GRU-AMSA)模型,用于评估矿用电动机健康状态。首先,对传感器采集的电动机运行数据进行填补、剔除和标准化处理,并以环境温度变化作为依据对矿用电动机运行数据进行工况划分。然后,根据马氏距离计算出电动机电流、电动机三相绕组温度、电动机前端轴承温度和电动机后端轴承温度等健康评估指标的健康指数(HI),采用Savitzky–Golay滤波器对指标HI进行降噪、平滑、归一化处理,并结合主成分分析法计算的不同指标对矿用电动机的贡献度,对指标HI进行加权融合得到矿用电动机HI。最后,将矿用电动机HI输入CNN-GRU-AMSA模型中,该模型通过动态调整注意力权重,实现对不同尺度特征的信息融合,从而准确输出电动机健康状态评估结果。实验结果表明,与其他常见的深度学习模型CNN,CNN-GRU,CNN-LSTM,CNN-LSTM-Attention相比,CNN-GRU-AMSA模型在均方根误差、平均绝对误差、准确率、Macro F1及Micro F1等评价指标上更优,且预测残差的波动范围更小,稳定性更优。 展开更多
关键词 电动机健康状态评估 自适应多尺度注意力机制 CNN-GRU 多传感器信息融合 主成分分析
下载PDF
基于注意力机制与神经架构搜索的实时语义分割网络 被引量:2
8
作者 施卓炜 甘兴利 施浩 《无线电工程》 北大核心 2023年第5期1214-1220,共7页
在实时语义分割的传统应用中,往往会为了加快模型推断的速度而遗失一些重要的低级细节和高级语义特征,尽管目前推出的许多方法可以使延迟和精度2个指标保证一定平衡,但在特征处理上却未实现对细节信息的高效提取以及聚合。在速度方面,... 在实时语义分割的传统应用中,往往会为了加快模型推断的速度而遗失一些重要的低级细节和高级语义特征,尽管目前推出的许多方法可以使延迟和精度2个指标保证一定平衡,但在特征处理上却未实现对细节信息的高效提取以及聚合。在速度方面,算力开销巨大的分割模型往往在图像分割的实时帧率上差强人意,为解决此问题设计出了一种使语义分割网络能够在低延迟的环境要求下实现高效像素分割的改进结构,先是通过神经架构搜索和自适应注意力机制集成多分辨率搜索分支架构生成师生网络分支,然后用师生蒸馏网络得到具备低延迟和高精度的轻量级网络模型。既可以在硬件资源约束的情况下完成对复杂环境的实时任务处理,也能在Cityspaces数据集上展现出优良的准确率,测试集的分割精度达到了72.2%。 展开更多
关键词 语义分割 深度学习 神经网络架构搜索 知识蒸馏 自适应注意力机制
下载PDF
基于改进YOLOv7的换热器板片故障检测算法研究
9
作者 王伯涛 周福强 +1 位作者 吴国新 王少红 《机床与液压》 北大核心 2024年第11期105-113,共9页
针对换热器板片装配检测成本高、检测精度低等问题,提出一种改进的YOLOv7算法检测换热器板片的装反问题。在原始数据集上采用限制对比度自适应直方图均衡化对图像进行处理,提高待检测图像的清晰度;在YOLOv7模型原有基础上,针对换热器板... 针对换热器板片装配检测成本高、检测精度低等问题,提出一种改进的YOLOv7算法检测换热器板片的装反问题。在原始数据集上采用限制对比度自适应直方图均衡化对图像进行处理,提高待检测图像的清晰度;在YOLOv7模型原有基础上,针对换热器板片层数较多、模糊且噪点多,提出一种多级自适应注意力机制添加至Backbone最后一层;针对图像识别模型计算量大、下采样特征损失严重,采用改进的MP-D模块优化原有的下采样模块;针对特征提取部分,加入F-ReLU激活函数,使得计算速度和检测准确性有了明显提高;针对Neck部分的PANet结构,融合BiFPN跨尺度连接的思想,进一步提高融合的效率和准确性。通过实验可得,改进后的网络模型和初始YOLOv7相比,mAP@0.5、召回率R、检测速度分别提高0.6%、2%、16.9帧/s,针对换热器板片检测具有良好效果。 展开更多
关键词 换热器板片 YOLOv7 多级自适应注意力机制 MP-D模块 BiFPN
下载PDF
一种基于RDNet的道路病害检测算法
10
作者 王鹏 王鹏飞 +3 位作者 游东旭 徐垚凡 白雨桭 刘加美 《人工智能与机器人研究》 2024年第3期487-496,共10页
道路病害的诊断是道路预防保养的一个关键步骤,为此本文提出了一种基于RDNet (Road Detection Network)道路病害检测算法。该算法从不同角度提高了特征的提取和表达能力,其中的改进包括跨阶段多分支卷积、残差并行空洞卷积以及自适应尺... 道路病害的诊断是道路预防保养的一个关键步骤,为此本文提出了一种基于RDNet (Road Detection Network)道路病害检测算法。该算法从不同角度提高了特征的提取和表达能力,其中的改进包括跨阶段多分支卷积、残差并行空洞卷积以及自适应尺度空间注意力模块等。通过在自建的道路病害数据集上进行端到端地训练,提高了算法的检测精度和泛化能力。实验结果表明,对比YOLOv5s,本文所提出的RDNet算法的平均精度均值mAP提高了1.3%,同时对于困难样本也有较好的检测结果,能够有效地应用于实际道路的维护工作中,从而提升道路病害检测的效率和准确性。The diagnosis of road diseases is a key step in road preventive maintenance, so this paper proposes a road disease detection algorithm based on RDNet (Road Detection Network). The algorithm improves the ability of feature extraction and expression from different perspectives, including crossstage partial multi-branch convolution, residual parallel dilated convolution, and adaptive scale spatial attention module. End-to-end training on the self-built road disease dataset improves the detection accuracy and generalization ability of the algorithm. Experimental results show that compared with YOLOv5s, the average precision of the RDNet algorithm proposed in this paper is increased by 1.3%, and the average precision mAP of the proposed RDNet algorithm is improved by 1.3%, and it also has good detection results for difficult samples, which can be effectively applied to the maintenance of actual roads, so as to improve the efficiency and accuracy of road disease detection. 展开更多
关键词 道路病害诊断 RDNet 跨阶段多分支卷积 残差并行空洞卷积、自适应尺度空间注意力机制
下载PDF
基于信息提炼与残差特征聚合网络的单通道语音增强 被引量:1
11
作者 张天骐 罗庆予 +1 位作者 方蓉 张慧芝 《信号处理》 CSCD 北大核心 2023年第7期1285-1298,共14页
针对语音增强的深层神经网络中对丰富的全局语音相关信息提取困难、未充分利用中间层次特征的问题,本文以尽可能小的参数为前提,基于注意力U型网络,设计了一种基于信息提炼和残差特征聚合的新型卷积编解码网络来进行语音增强。本文在编... 针对语音增强的深层神经网络中对丰富的全局语音相关信息提取困难、未充分利用中间层次特征的问题,本文以尽可能小的参数为前提,基于注意力U型网络,设计了一种基于信息提炼和残差特征聚合的新型卷积编解码网络来进行语音增强。本文在编解码部分提出一种2维的层次细化残差(HRR,Hierarchical Refinement Residual)模块,该模块能显著降低训练参数并扩大感受野,对多尺度上下文信息进行不同层次的提取;传输层提出一种轻量级的1维通道自适应注意力(1D-CAA,One-Dimensional Channel Dimension Adaptive Attention)模块,结合门控机制和范数归一化,选择性地传递特征并提高网络表达能力,并联合门控残差线性单元搭建了一种门控残差特征聚合(GRFA,Gating Residual Feature Aggregation)网络,增强了层间信息流动并充分利用中间层次特征细节,获取更多时序相关信息。实验部分,本文在21种噪声环境下训练和测试,最终以1.23×106的参数相比于其他方法取得更优的客观与主观指标,具备较强的增强效果与泛化能力,并在模型复杂度与精度上取得良好平衡。 展开更多
关键词 语音增强 多尺度上下文 自适应注意力机制 残差特征聚合
下载PDF
一种新的seq2seq的可控图像字幕的生成方法 被引量:3
12
作者 王源顺 段迅 吴云 《计算机应用研究》 CSCD 北大核心 2021年第11期3510-3516,共7页
针对当前的图像字幕方法只能够用一种黑盒的、从外部难以控制的架构描述图像的问题。创造性地将图像字幕问题转换为seq2seq问题,达到了可控生成图像字幕的效果。设计一个由图像区域构成的实体集合或实体序列作为控制信号,在实体块切换... 针对当前的图像字幕方法只能够用一种黑盒的、从外部难以控制的架构描述图像的问题。创造性地将图像字幕问题转换为seq2seq问题,达到了可控生成图像字幕的效果。设计一个由图像区域构成的实体集合或实体序列作为控制信号,在实体块切换的块哨兵和带视觉哨兵的自适应注意力机制的指导下,将控制信号有规律地输入到双层的长短期记忆网络(long short term memory,LSTM)中,以可控的方式指导模型生成对应的图像字幕;此外,baseline使用cross entropy loss来早停模型的训练,引入强化学习思想来解决训练时的优化目标与评估算法效果时指标不一致的问题,进一步优化模型效果。实验表明:在MSCOCO及Flickr30k数据集上,提出的算法在生成可控图像字幕、字幕质量、多样性上达到了非常好的效果。 展开更多
关键词 图像字幕 seq2seq 控制信号 哨兵机制 自适应注意力机制
下载PDF
一种用于预测航空遥感影像光谱信息的深度学习方法 被引量:1
13
作者 郝明达 普运伟 +2 位作者 周家厚 杨洋 陈如俊 《遥感信息》 CSCD 北大核心 2022年第6期123-129,共7页
为从航空RGB遥感影像中预测高光谱影像中有用的地物属性信息,提高航空RGB遥感影像光谱的分辨率,提出一种轻量型的深度学习网络模型。所提模型组合了密集卷积神经网络架构和自适应注意力机制的优点,构建了一种新型密集注意力卷积神经网... 为从航空RGB遥感影像中预测高光谱影像中有用的地物属性信息,提高航空RGB遥感影像光谱的分辨率,提出一种轻量型的深度学习网络模型。所提模型组合了密集卷积神经网络架构和自适应注意力机制的优点,构建了一种新型密集注意力卷积神经网络模型(dense attention convolutional neural network model,DACNN model)。在真实的多模态AeroRIT场景影像和同源的雄安航空遥感影像上的多种定量对比实验结果表明,所提出的网络架构可以生成与原始高光谱遥感影像相似的空间特征和光谱特征,并且所需参数量显著降低,具有较好的性能和适用性,且所提模型架构方法具有一定的通用性。 展开更多
关键词 高光谱遥感重建 光谱超分辨率 深度学习 自适应注意力机制 密集卷积神经网络
下载PDF
基于Faster R-CNN的电力系统故障的图像检测方法 被引量:2
14
作者 龙昊 何应强 +1 位作者 邢博为 周晶 《科技与创新》 2023年第11期135-138,共4页
随着电网愈加复杂,传统的人工方式故障巡检已不再适用。近年来,利用航拍图像进行数据采集代替人工巡检的方法得到应用。但由于故障元件体积小,图像背景复杂,难以实现对同种形态的不同类别目标进行分类,因此,以Faster R-CNN为基础,结合Bi... 随着电网愈加复杂,传统的人工方式故障巡检已不再适用。近年来,利用航拍图像进行数据采集代替人工巡检的方法得到应用。但由于故障元件体积小,图像背景复杂,难以实现对同种形态的不同类别目标进行分类,因此,以Faster R-CNN为基础,结合BiFPN,提出一种自适应注意力机制的加权特征融合方法。通过增加目标物体与背景的差异化特征提升故障区域的检测效果。实验结果表明,此方法平均准确率提升了17.8%,降低了细小金具检测中的误判以及漏判等问题,为国家电网输电线路的稳定运行奠定了良好基础。 展开更多
关键词 Faster R-CNN BiFPN 自适应注意力机制 电路故障
下载PDF
基于改进EfficientNet的阿尔兹海默症图像分类 被引量:1
15
作者 朱剑波 葛明锋 董文飞 《计算机与现代化》 2023年第6期56-61,共6页
为提升卷积神经网络用于阿尔兹海默症MRI图像分类的效果,提出一种融合自适应注意力机制和数据增强技术的卷积神经网络FAMENET。通过引入数据增强技术和Focal Loss损失函数缓解数据不平衡现象;重构优化主干网络Effi⁃cientNet,在保持精度... 为提升卷积神经网络用于阿尔兹海默症MRI图像分类的效果,提出一种融合自适应注意力机制和数据增强技术的卷积神经网络FAMENET。通过引入数据增强技术和Focal Loss损失函数缓解数据不平衡现象;重构优化主干网络Effi⁃cientNet,在保持精度的情况下减少模型参数量和网络的计算量;引入自适应注意力机制,解决输入图片进行特征提取下采样过程导致的信息丢失问题。在公开数据集进行大量对比实验,FAMENET的分类准确率达到79.95%,AUC值达到82.54%,设计的消融实验也充分证明了所提出的各个模块和网络的有效性。 展开更多
关键词 卷积神经网络 阿尔兹海默症 自适应注意力机制 数据增强 医学图像分类
下载PDF
Adaptive multi-modal feature fusion for far and hard object detection
16
作者 LI Yang GE Hongwei 《Journal of Measurement Science and Instrumentation》 CAS CSCD 2021年第2期232-241,共10页
In order to solve difficult detection of far and hard objects due to the sparseness and insufficient semantic information of LiDAR point cloud,a 3D object detection network with multi-modal data adaptive fusion is pro... In order to solve difficult detection of far and hard objects due to the sparseness and insufficient semantic information of LiDAR point cloud,a 3D object detection network with multi-modal data adaptive fusion is proposed,which makes use of multi-neighborhood information of voxel and image information.Firstly,design an improved ResNet that maintains the structure information of far and hard objects in low-resolution feature maps,which is more suitable for detection task.Meanwhile,semantema of each image feature map is enhanced by semantic information from all subsequent feature maps.Secondly,extract multi-neighborhood context information with different receptive field sizes to make up for the defect of sparseness of point cloud which improves the ability of voxel features to represent the spatial structure and semantic information of objects.Finally,propose a multi-modal feature adaptive fusion strategy which uses learnable weights to express the contribution of different modal features to the detection task,and voxel attention further enhances the fused feature expression of effective target objects.The experimental results on the KITTI benchmark show that this method outperforms VoxelNet with remarkable margins,i.e.increasing the AP by 8.78%and 5.49%on medium and hard difficulty levels.Meanwhile,our method achieves greater detection performance compared with many mainstream multi-modal methods,i.e.outperforming the AP by 1%compared with that of MVX-Net on medium and hard difficulty levels. 展开更多
关键词 3D object detection adaptive fusion multi-modal data fusion attention mechanism multi-neighborhood features
下载PDF
一种新的轻量化生成对抗网络及其在风电数据插补中的应用
17
作者 武甲 齐咏生 +2 位作者 马然 高胜利 刘慧文 《控制与决策》 EI CSCD 北大核心 2024年第12期4141-4150,共10页
针对风电场监控和数据采集系统(supervisory control and data acquisition, SCADA)数据在采集传输过程中常遇到的数据丢失问题,提出一种新的自适应轻量化生成对抗网络插补策略(adaptive transformer slim GAIN, ATSGAIN),旨在增强数据... 针对风电场监控和数据采集系统(supervisory control and data acquisition, SCADA)数据在采集传输过程中常遇到的数据丢失问题,提出一种新的自适应轻量化生成对抗网络插补策略(adaptive transformer slim GAIN, ATSGAIN),旨在增强数据完整性. AT-SGAIN通过简化GAIN模型结构,显著提高了计算效率;采用双判别器结构,分别用于真实数据和生成数据的鉴别,保障了速度提升过程中插补精度的维护.算法集成了Transformer (变压器模型)编码器,增强了对风电数据时间序列特征的捕捉能力,并通过自适应双分支注意力机制,精准调整通道和空间注意力权重,提升了网络对局部信息的敏感度.实验结果证明,所提算法在多项对比测试中均显著优于现有经典方法. 展开更多
关键词 风电数据插补 监控和数据采集系统数据 轻量化 变压器模型 自适应注意力机制 自适应轻量化生成对抗插补网络
原文传递
结合波段选择与改进 Shufflenetv2 的土地利用变化检测 被引量:1
18
作者 朱旭阳 韦春桃 +1 位作者 何蔚 张冬冬 《测绘地理信息》 CSCD 2023年第6期88-93,共6页
为了使轻量级深度分类模型准确检测遥感图像中的土地利用变化区域,提出结合波段选择与改进Shufflenetv2的土地利用变化检测技术。首先通过基于波段选择的图像增强方法,针对性选择遥感图像的RGB波段组成突出图像中的地物特征;然后引入自... 为了使轻量级深度分类模型准确检测遥感图像中的土地利用变化区域,提出结合波段选择与改进Shufflenetv2的土地利用变化检测技术。首先通过基于波段选择的图像增强方法,针对性选择遥感图像的RGB波段组成突出图像中的地物特征;然后引入自适应卷积核尺度注意力机制对轻量级深度分类模型Shufflenetv2进行改进,自适应选取最佳尺度卷积核,提高模型特征提取能力,同时使用空洞卷积替换注意力机制模块中的普通卷积在获得相同感受野的条件下减少模型参数量;最后训练模型并应用于土地利用变化检测。将本文方法在Euro SAT数据集中进行实验。结果表明,基于波段选择的图像增强方法能够有效提高深度学习模型的检测精度。改进模型SK_Shufflenetv2在保持模型轻量化的同时具有良好的检测性能。 展开更多
关键词 波段选择 Shufflenetv2 土地利用变化检测 自适应卷积核尺度注意力机制 空洞卷积
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部