期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于混合域注意力机制的神经网络反演大气湍流强度
1
作者 张宝银 尹伟石 +2 位作者 孟品超 周林华 齐德全 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期230-235,共6页
本文提出了一种基于混合域注意力机制的神经网络方法反演大气湍流强度。神经网络的输入为不同大气湍流强度下的退化图像,输出为表征大气湍流强度的折射率结构常数。混合域注意力机制由空间域和通道域双重注意力机制组成,其中空间域注意... 本文提出了一种基于混合域注意力机制的神经网络方法反演大气湍流强度。神经网络的输入为不同大气湍流强度下的退化图像,输出为表征大气湍流强度的折射率结构常数。混合域注意力机制由空间域和通道域双重注意力机制组成,其中空间域注意力机制用于增强退化图像中受湍流影响的区域特征,通道域注意力机制用于增强由湍流引起的颜色和纹理特征。在网络训练阶段,引入的混合域注意力机制让神经网络更专注于退化图像中与大气湍流强度相关的特征,提高了模型的精度。数值实验结果表明,本文提出的方法能够较准确地实现大气湍流强度反演。 展开更多
关键词 混合域注意力机制 折射率结构常数 湍流强度反演 退化图像
下载PDF
基于混合域注意力的深度强化学习交叉口信号控制方法
2
作者 李忠华 何子登 《计算机科学与应用》 2024年第4期177-192,共16页
针对强化学习智能体对微观交通状态感知能力有限的问题,本文提出了一种基于混合域注意力的深度强化学习交叉口信号控制算法3DQN_MDAM。首先,为减少存储开销,设计了一种轻量的混合域注意力模块(Mixed Domain Attention Module, MDAM),仅... 针对强化学习智能体对微观交通状态感知能力有限的问题,本文提出了一种基于混合域注意力的深度强化学习交叉口信号控制算法3DQN_MDAM。首先,为减少存储开销,设计了一种轻量的混合域注意力模块(Mixed Domain Attention Module, MDAM),仅使用少量的参数就能实现自适应地调整交通状态特征图中通道之间及空间位置之间权重的功能。然后,在现有基于双深度决斗Q网络(Double Dueling DQN, 3DQN)算法模型的基础上通过引入MDAM,使智能体自动地聚焦于对当前控制任务更为重要的交通状态信息,以增强智能体的状态感知能力。最后,利用仿真平台SUMO (Simulation of Urban Mobility)进行实验。实验结果显示,在低、中、高三种不同交通流条件下,3DQN_MDAM相比3DQN在各项指标上均得到改善,其中车辆平均等待时间分别缩短了20%、20%、17.6%。与其它常用的基准算法相比,3DQN_MDAM在各项指标上均得到最好的控制效果。 展开更多
关键词 混合域注意力 深度强化学习 交通信号控制 3DQN算法 SUMO
下载PDF
一种结合多尺度特征融合和混合域注意力机制的眼底疾病诊断方法
3
作者 刘辉 朱正为 +1 位作者 张徐 仲慧 《中国医学物理学杂志》 CSCD 2023年第12期1477-1485,共9页
针对眼底疾病图像细微特征多、样本数量较少、诊断难度较大的问题,结合深度学习和医学影像技术,提出一种融合多尺度特征融合和混合域注意力机制的眼底疾病诊断网络模型和方法。该方法以Resnet50作为基线网络,通过对其进行改进和优化,利... 针对眼底疾病图像细微特征多、样本数量较少、诊断难度较大的问题,结合深度学习和医学影像技术,提出一种融合多尺度特征融合和混合域注意力机制的眼底疾病诊断网络模型和方法。该方法以Resnet50作为基线网络,通过对其进行改进和优化,利用并行多分支结构提取不同感受野下的眼底疾病特征,有效提高模型的特征提取能力和计算效率,采用混合域注意力机制选择对当前任务目标更关键的信息,有效提高模型的分类性能。最后利用ODIR数据集对该方法进行实验,实验结果表明,提出的方法对正常眼和不同眼底疾病的诊断准确率达到93.2%,相较于基线网络提高5.2%,诊断效果良好。 展开更多
关键词 眼底疾病 卷积神经网络 多尺度特征融合 混合域注意力机制
下载PDF
采用混合域注意力机制的无人机识别方法 被引量:7
4
作者 薛珊 卫立炜 +1 位作者 顾宸瑜 吕琼莹 《西安交通大学学报》 EI CAS CSCD 北大核心 2022年第10期141-150,共10页
针对在城市公园、广场和大型游乐场等公共环境中,雷达和无线电识别无人机易受到电子干扰、图像识别无人机易受到光线和遮挡物干扰的问题,提出了一种经济便捷、不易受到干扰的运用声音和采用通道空间混合域注意力机制多尺度分组卷积网络(... 针对在城市公园、广场和大型游乐场等公共环境中,雷达和无线电识别无人机易受到电子干扰、图像识别无人机易受到光线和遮挡物干扰的问题,提出了一种经济便捷、不易受到干扰的运用声音和采用通道空间混合域注意力机制多尺度分组卷积网络(ECSANet)的无人机识别方法。首先,建立民用的9大类无人机声音数据集,提取数据集的对数梅尔谱图及其动态特征;其次,为了网络参数量少,避免过拟合,设计了基于分组卷积、通道混洗和残差结构的通道混洗多尺度分组卷积网络(MSSGNet);然后,为了能更多、更有效地提取无人机声音特征,设计了通道空间混合域注意力机制模块(ECSA);最后,将ECSA模块插入MSSGNet网络构成改进的通道空间混合域注意力机制的多尺度分组卷积网络(ECSANet),形成新型声音识别无人机的方法。运用设计的ECSANet网络对自建的民用无人机声音数据集和Urbansound8K环境声音数据集进行了声音识别,识别结果表明:与ResNet18、ResNet34、ResNeXt18和MobileNetV2等基准网络相比,MSSGNet网络参数更少,识别准确率更高,达到了95.1%;ECSA模块可以插入多种网络,在不增加很多参数的情况下令网络模型的识别准确率获得提升,在无人机等声音分类任务上具有很好的效果;与MSSGNet网络相比,改进的ECSANet网络识别准确率能达到95.9%,提高了0.8%,表明了该网络在识别小样本无人机方面的优越性和可行性。 展开更多
关键词 无人机 声音识别 对数梅尔谱图 神经网络 混合域注意力机制
下载PDF
基于DenseNet和混合域注意力的COVID-19低剂量CT图像质量评价
5
作者 孙荣荣 单飞 叶雯 《计算机科学》 CSCD 北大核心 2021年第S02期620-624,共5页
研究COVID-19低剂量CT图像质量评价算法具有重要意义,但基于深度学习的方法随着网络层数的增加会出现梯度消失问题,针对此问题,文中提出了基于混合域注意力的DenseNet算法。DenseNet通过特征重用和网络的紧密连接,在减少参数的同时解决... 研究COVID-19低剂量CT图像质量评价算法具有重要意义,但基于深度学习的方法随着网络层数的增加会出现梯度消失问题,针对此问题,文中提出了基于混合域注意力的DenseNet算法。DenseNet通过特征重用和网络的紧密连接,在减少参数的同时解决了梯度消失问题;基于人眼的注意力机制,将自下至上和自上而下结构相结合以实现空间注意力;基于人眼视觉具有多通道特性,针对空间域注意力忽略通道域中的信息,研究混合域注意力,并将其引入至DenseNet。分别用斯皮尔曼等级次序相关系数、皮尔逊线性相关系数来衡量客观评价方法的测试结果与主观评价之间的一致性。实验结果表明,所提方法可以较好地模拟人类的视觉特性,更加准确地对COVID-19低剂量CT进行质量评价,评价结果与人类视觉主观感受有较好的一致性。 展开更多
关键词 DenseNet 混合域注意力 COVID-19 低剂量 CT图像
下载PDF
基于混合域注意力机制的服装关键点定位及属性预测算法 被引量:2
6
作者 雷冬冬 王俊英 +2 位作者 董方敏 臧兆祥 聂雄锋 《东华大学学报(自然科学版)》 CAS 北大核心 2022年第4期28-35,共8页
针对服装形变和模特复杂姿态影响服装视觉分析准确率的问题,提出一个基于混合域注意力机制的服装关键点定位与属性预测算法,该算法利用循环十字交叉注意力(recurrent criss-cross attention,RCCA)模块得到服装图像的每个像素的上下文信... 针对服装形变和模特复杂姿态影响服装视觉分析准确率的问题,提出一个基于混合域注意力机制的服装关键点定位与属性预测算法,该算法利用循环十字交叉注意力(recurrent criss-cross attention,RCCA)模块得到服装图像的每个像素的上下文信息,从而捕获服装关键点之间潜在的空间几何关系,再融合服装图像的空间联系和通道交互信息来获得更好的服装关键点定位和属性预测效果。服装的空间特征由空间注意力分支网络在关键点热图的基础上学习得到,而通道交互信息通过局部跨通道交互策略生成通道注意力来捕获。试验结果表明,所提算法降低了服装关键点定位的归一化误差,并在一定程度上提高了服装的分类与属性预测效果。 展开更多
关键词 服装关键点定位 属性预测 混合域注意力机制 非局部空间连接 局部跨通道交互
下载PDF
基于混合域注意力YOLOv4的输送带纵向撕裂多维度检测 被引量:6
7
作者 李飞 胡坤 +2 位作者 张勇 王文善 蒋浩 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第11期2156-2167,共12页
针对输送带纵向撕裂目标检测维度单一、模型复杂度高等问题,提出一种高效的MobileNetv3及YOLOv4集成网络输送带纵向撕裂多维度实时检测方法.基于YOLOv4目标识别算法,通过将轻量化网络Mobile-Netv3代替CSPDarknet53作为骨干网络,结合高... 针对输送带纵向撕裂目标检测维度单一、模型复杂度高等问题,提出一种高效的MobileNetv3及YOLOv4集成网络输送带纵向撕裂多维度实时检测方法.基于YOLOv4目标识别算法,通过将轻量化网络Mobile-Netv3代替CSPDarknet53作为骨干网络,结合高效通道域ECA模块和空间域注意力机制(STNet)构建混合域注意力网络(ECSNet),改进了MobileNetv3嵌入ECSNet,并且提升了模型对空间和通道的关注度.引入深度可分离卷积块代替网络中3*3卷积,并将YOLOv4的检测头(Prediction Heads)缩减为2种尺度,轻量化模型降低网络复杂度和训练难度,完成ECSMv3_YOLOv4模型的搭建,使用K-means聚类6个Anchors预测目标框高宽,提高网络对表面撕裂的检测性能.研制带式输送机多维度智能巡检样机,采集制作输送带多维度面的纵向撕裂数据集,开展网络模型的训练、测试、识别和定位实验.结果表明,提出算法在测试集中的平均识别准确率为97.8%,识别速度为37帧/s,模型的计算量和参数量为4.882 G和8.851 M,通过试验不同的网络模型效果和改变光照强度,该方法体现出检测精度高、速度快和轻量化等优点,具备更强的适应性和抗干扰能力. 展开更多
关键词 纵向撕裂 多维度检测 MobileNetv3 混合域注意力机制 YOLOv4 轻量化
下载PDF
采空区地裂缝混合域注意力变形卷积网络检测方法 被引量:4
8
作者 程健 叶亮 +1 位作者 郭一楠 王瑞彬 《煤炭学报》 EI CAS CSCD 北大核心 2020年第S02期993-1002,共10页
为了保护生态环境和人员安全,周期性地对煤矿采空区的地裂缝进行检测至关重要。传统的地裂缝人工巡检方法耗时长、效率低下,且无法保障巡检人员安全。航拍视角下的地裂缝与路面、桥梁等裂缝具有相似特征,都呈现出狭长形状。但是,一般煤... 为了保护生态环境和人员安全,周期性地对煤矿采空区的地裂缝进行检测至关重要。传统的地裂缝人工巡检方法耗时长、效率低下,且无法保障巡检人员安全。航拍视角下的地裂缝与路面、桥梁等裂缝具有相似特征,都呈现出狭长形状。但是,一般煤矿采空区地裂缝分布在山区,其背景和噪声更为复杂,导致传统图像处理方法性能不佳。因此,提出一种基于混合域注意力变形卷积网络的地裂缝检测方法。针对地裂缝的狭长特性,引入变形卷积,在特征提取中自适应地确定感受野的范围。混合域注意力机制为特征图中不同通道和不同空间位置的特征信息赋予相应权值,来强化特征图中特定通道和空间位置对地裂缝检测的贡献程度。其中,通道域注意力模块利用通道池化,并经过卷积和激活函数为每个通道生成0~1的权值,强化了特定通道对检测的贡献;空间域注意力模块利用空间池化,并结合变形卷积训练得到每个空间位置的权值,使得模型能更有效地获取空间信息。基于此,给出注意力机制引导的地裂缝检测一般框架,应用无人机搭载高清摄像头采集采空区图像进行地裂缝检测。实验中,所提方法与一阶段检测模型SSD300、SSD512和RetinaNet相比,平均精度分别提升了0.246,0.101和0.034,与多阶段检测模型Faster R-CNN和Cascade R-CNN相比,精准率分别提升了0.300和0.271。自我对比实验中,引入混合域注意力提升了0.195的精准率和0.038的平均精度;较大尺寸的输入图像各方面性能更高。结果表明,所提方法通过结合变形卷积与注意力机制,相比于其它检测方法准确率更高,训练过程更平稳。 展开更多
关键词 混合域注意力 变形卷积网络 地裂缝检测 航拍图像 煤矿采空区
下载PDF
基于多尺度卷积和混合注意力机制的情绪脑电识别研究 被引量:1
9
作者 陶勇 龙多 《长春工业大学学报》 CAS 2023年第1期15-24,共10页
建立了基于深度学习框架的情绪识别模型——M-Attention-EmotionNet。采用多尺度卷积提取不同尺度的特征。为避免特征冗余,引入了混合域注意力机制,从通道和空间两个维度对特征进行赋权。在DEAP数据集上,首先提取预处理后脑电信号不同... 建立了基于深度学习框架的情绪识别模型——M-Attention-EmotionNet。采用多尺度卷积提取不同尺度的特征。为避免特征冗余,引入了混合域注意力机制,从通道和空间两个维度对特征进行赋权。在DEAP数据集上,首先提取预处理后脑电信号不同频带的功率谱密度特征作为模型的输入,然后被分类。实验结果表明,该模型在唤醒和效价两个维度上分类准确率分别为95.64%和96.49%,同时,在四分类和八分类的细粒度情感分类上,平均准确率分别为90.89%和89.22%。 展开更多
关键词 功率谱密度 多尺度卷积 混合域注意力机制
下载PDF
融合注意力机制的恶意代码家族分类研究 被引量:6
10
作者 王润正 高见 +1 位作者 仝鑫 杨梦岐 《计算机科学与探索》 CSCD 北大核心 2021年第5期881-892,共12页
近年来,随着恶意代码家族变种的多样化和混淆等对抗手段的不断加强,传统的恶意代码检测方法难以取得较好的分类效果。鉴于此,提出了一种融合注意力机制的恶意代码家族分类模型。首先,使用逆向反汇编工具获取恶意样本的各区段特征,并利... 近年来,随着恶意代码家族变种的多样化和混淆等对抗手段的不断加强,传统的恶意代码检测方法难以取得较好的分类效果。鉴于此,提出了一种融合注意力机制的恶意代码家族分类模型。首先,使用逆向反汇编工具获取恶意样本的各区段特征,并利用可视化技术将各区段转化为RGB彩色图像的各通道;其次,引入通道域和空间域注意力机制来构建基于混合域注意力机制的深度可分离卷积网络,从通道和空间两个维度提取恶意样本的图像纹理特征;最后,选取九类恶意代码家族对模型进行训练和测试。实验结果表明,使用单一区段特征对恶意代码家族分类的准确率较低,采用融合特征能够有效地区分各类恶意代码家族,同时该模型相比于传统的神经网络模型取得了更好的分类效果,模型的分类准确率达到了98.38%。 展开更多
关键词 恶意家族 多分类 混合域注意力机制 深度可分离卷积 融合特征
下载PDF
基于CBAM-CRN的面向会议场景的多通道回声消除模型
11
作者 孙慧冰 丁碧云 孙成立 《计算机科学与应用》 2024年第4期230-241,共12页
本文研究了基于深度学习的多通道回声消除方法,提出了基于卷积块注意力模块(CBAM)融合卷积循环网络(CRN)的多通道回声消除方法。该方法利用U型网络的特征提取能力和LSTM网络处理时序信号的优势,结合了时频掩蔽算法和稀疏自适应归一化处... 本文研究了基于深度学习的多通道回声消除方法,提出了基于卷积块注意力模块(CBAM)融合卷积循环网络(CRN)的多通道回声消除方法。该方法利用U型网络的特征提取能力和LSTM网络处理时序信号的优势,结合了时频掩蔽算法和稀疏自适应归一化处理,同时融合了通道注意力和空间注意力联合机制,该混合域注意力能够有效地捕获关键特征并抑制无关特征。实验表明,CBAM-CRN方法在多种通话模式下均优于自适应滤波和其他深度学习方法,有效提高了远场免提通话的语音质量。 展开更多
关键词 深度学习 多通道回声消除 U型网络 混合域注意力
下载PDF
基于改进YOLOv4的GIS红外特征识别与温度提取方法 被引量:7
12
作者 刘江 关向雨 +1 位作者 温跃泉 吕朝伟 《电力工程技术》 北大核心 2023年第1期162-168,共7页
对气体绝缘开关设备(gas insulated switchgear, GIS)典型部件的目标识别和温度提取是实现对设备发热状态红外智能检测的关键。文中提出一种基于混合域注意力机制(convolutional block attention module, CBAM)的改进YOLOv4算法,可实现... 对气体绝缘开关设备(gas insulated switchgear, GIS)典型部件的目标识别和温度提取是实现对设备发热状态红外智能检测的关键。文中提出一种基于混合域注意力机制(convolutional block attention module, CBAM)的改进YOLOv4算法,可实现对GIS母线、隔离开关等部件的快速目标检测和热点温度提取。首先,在某变电站现场采集原始红外图像,对图像进行锐化处理和部位标记,构建包含GIS典型部件的红外数据集。然后,利用深度可分离卷积网络降低模型参数量,并融入CBAM优化模型的识别能力,在此基础上构建基于改进YOLOv4的GIS红外部件目标快速检测算法。最后,采用灰阶差值方法对检测到的GIS典型目标部件进行热区温度值提取。结果表明,所提算法在GIS红外特征数据集上可以达到每秒31.5帧的识别速度和82.3%的识别准确率,明显优于其他目标算法,且GIS各部件的温升计算值与实测值误差在±1℃内。该算法可部署在无人机和巡检小车等边缘智能终端,实现对现场GIS设备温升状态的精细化识别和快速诊断,提升GIS设备健康状态管理数字化和智能化水平。 展开更多
关键词 气体绝缘开关设备(GIS) YOLOv4 红外图像 温升提取 混合域注意力机制(CBAM) 轻量级网络
下载PDF
基于深度学习的轻量级口罩检测算法研究 被引量:1
13
作者 刘凯 张寿明 《电视技术》 2022年第7期81-85,90,共6页
基于当前大多数目标检测算法不能同时在实时性和检测精度上都获得良好的表现,本文对经典的YOLOv3目标检测算法进行改进,使最终的网络模型轻量化且具有较高的检测准确率。由于YOLOv3的骨干网络DarkNet53网络结构复杂,参数量较大,将其替换... 基于当前大多数目标检测算法不能同时在实时性和检测精度上都获得良好的表现,本文对经典的YOLOv3目标检测算法进行改进,使最终的网络模型轻量化且具有较高的检测准确率。由于YOLOv3的骨干网络DarkNet53网络结构复杂,参数量较大,将其替换为EfficientNet系列网络中的EfficientNet-B1,通过简单的网络结构以及更少的网络参数量学习到较好的特征,为网络轻量化奠定基础;对骨干网络输出的3种不同尺度的特征图添加混合域注意力机制CBAM作为特征融合网络的输入,并将特征金字塔结构与CBAM结合,通过自上而下的特征信息融合以及混合域注意力机制使网络在训练时更加关注样本的有效区域,进一步提升模型的检测性能;使用Mosaic数据增强方式,有效提升模型的泛化能力。实验最终的模型评估结果表明,改进后的网络相对于YOLOv3网络而言,在mAP0.5降低2.73%的检测精度条件下,检测速度提升了3.93倍,而且模型大小仅为原网络的22%。 展开更多
关键词 深度学习 目标检测 骨干网络 混合域注意力机制 Mosaic数据增强
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部