基于通道域注意力机制的特征融合方式被引量：2

Feature fusion methods based on channel domain attention mechanism

下载PDF

导出

摘要针对在基于卷积神经网络的图像处理领域内,大部分特征融合只是通过Add或者Concat操作进行特征叠加或特征拼接而不能很好地将有效特征进行融合的问题,对Add和Concat特征融合引入通道域的注意力机制,设计了4种可学习的特征融合方式:A-Cat、B-Cat、A-Add和B-Add.为了验证方法的有效性,选择YOLOv3-Tiny作为baseline,在Pascal VOC2007数据集上进行测试.结果表明:A-Cat比原Concat的mAP提高了0.76%,比B-Cat提高了1.49%;A-Add比原Add的mAP提高了0.34%,比B-Add提高了1.41%.基于注意力机制的特征融合方式可以通过学习不同特征的重要程度并据此进行特征融合,有效地提升网络的性能. Feature fusion is widely used during image processing based on convolution neural network.Most methods only use add or Concat to fuse features,and they can not be fused effectively.Therefore,the channel domain attention mechanism is introduced into the feature fusion of Add and Concat,and four learning feature fusion methods are designed:A-Cat,B-Cat,A-Add and B-Add.In order to verify the validity of the method,YOLOv3-Tiny was selected to be baseline,and it was tested on Pascal VOC2007 data set.The test results show that the mAP of A-Cat is improved 0.76%,B-Cat is improved 1.49%,A-Add is improved 0.34%and B-Add is improved 1.41%.Experiments show that feature fusion based on attention mechanism can effectively improve network performance by learning the importance of different features and fusing them accordingly.

作者罗大为方建军刘艳霞 LUO Da-wei;FANG Jian-jun;LIU Yan-xia(Beijing Key Laboratory of Information Service Engineering,Beijing Union University,Beijing 100101,China;College of Urban Rail Transit and Logistics,Beijing Union University,Beijing 100101,China)

机构地区北京联合大学北京市信息服务工程重点实验室北京联合大学城市轨道交通与物流学院

出处《东北师大学报（自然科学版）》北大核心 2021年第3期44-48,共5页 Journal of Northeast Normal University(Natural Science Edition)

基金国家自然科学基金资助项目(61602041) 北京联合大学人才强校优选计划项目(BPHR2017CZ07).

关键词 Add操作 Concat操作特征图通道域注意力机制 Add operation Concat operation feature maps channel domain attention mechanism

分类号 TP302 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1黄俊洁,陈念年,范勇.基于全局和局部卷积特征融合的车辆目标检测[J].西南科技大学学报,2018,33(4):76-82. 被引量：3
2张富凯,杨峰,李策.基于改进YOLOv3的快速车辆检测方法[J].计算机工程与应用,2019,55(2):12-20. 被引量：103
3刘龙,孙强,宋琦军.面向目标检测的多尺度运动注意力融合算法研究[J].电子与信息学报,2014,36(5):1133-1138. 被引量：2
4穆玉理.利用Pascal VOC目标检测数据深度学习进行目标检测[J].通讯世界,2018,25(5):285-286. 被引量：3

二级参考文献14

1Stauffer C and Grimson W E L.Adaptive background mixture models for real-time tracking[C].Proceedings IEEE Computer Society Conference on Computer Vision and Pattern Recognition,Fort Collins,America 1999,2:246-252.
2Qi Bin,Ghazal Mohammed,and Amer Aishy.Robust global motion estimation oriented to video object segmentation[J].IEEE Transactions on Image Processing,2008,17(6):958-967.
3Chert Yue-meng.A joint approach to global motion estimation and motion segmentation from a coarsely sampled motion vector field[J].IEEE Transactions on Circuits and Systems for Video Technology,2011,21(9):1316-1328.
4Itti L and Koch C.Computational modeling of visual attention[J].Nature Reviews Neuroscience,2001,2(3):193-203.
5Fang Yu-ming,Lin Wei-si,Lau Chiew Tong,et al.A visual attention model combining top-down and bottom-up mechanisms for salient object detection[C].Proceedings IEEE International Conference on Acoustics,Speech and Signal Processing,Prague,Czech Republic,2011:1293-1296.
6Ozkei Motoyuki,Kashiwagi Yasuhiro,Inot Top-down visual attention control based on a paticle flit,for human-interactive robots[C].Proceedings Internatiomas Conference on Human System Interactions,Yokohama,Japse,2011:188-194.
7Ma Yu-Fei,Hua Xian-Sheng,and Lu Lie.A generic franmwork of user attention model and its application in video summarization[J].IEEE Transactions on Multimedia,2005,7(5):907-919.
8Han Jun-wei.Object segmentation from consumer video:a unified framework based on visual attention[J].IEEE Transactions on Consumer Electronics,2009,55(3):1597-1605.
9Verri A and Pggio T.Motion field and optical flow:qualitative Properties[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1989,11(5):490-498.
10曹诗雨,刘跃虎,李辛昭.基于Fast R-CNN的车辆目标检测[J].中国图象图形学报,2017,22(5):671-677. 被引量：63

共引文献107

1朱红,岑跃峰,王思泰.多任务学习的车辆结构化信息提取方法[J].计算机系统应用,2020,29(12):93-99.
2陈立潮,王彦苏,曹建芳.基于Dense-YOLOv3的车型检测模型[J].计算机系统应用,2020(10):158-166. 被引量：3
3徐世武,曾珏,张诗慧,李长征,李亭谕.一种深度卷积神经网络土地利用场景照片的分类方法[J].测绘通报,2020(2):24-28. 被引量：2
4岳希,梁云浩,何磊.基于改进YOLO算法的船舰目标检测DT-YOLO方法研究[J].成都信息工程大学学报,2022,37(5):533-537.
5汪辉,高尚兵,周君,周建,张莉雯.基于YOLOv3的多车道车流量统计及车辆跟踪方法[J].国外电子测量技术,2020,39(2):42-46. 被引量：15
6刘鸣瑄,刘惠义.基于特征融合SSD的远距离车辆检测方法[J].国外电子测量技术,2020,39(2):28-32. 被引量：13
7王平.引深管理抓回收一点一粒节资源[J].中国地质,2000,27(2):48-49.
8方浩,李艾华,王涛,苏延召.一种基于随机码本的运动目标检测算法[J].光电子．激光,2014,25(11):2158-2163. 被引量：5
9张洪瑞,卫文学,车吉鑫,邵婉露.基于DC-YOLO模型的建筑物砌体构件危险性等级鉴定方法[J].计算机应用与软件,2019,36(9):181-185. 被引量：3
10房国志,孙康瞳.多尺度YOLO人脸年龄估计方法研究[J].计算机工程与应用,2019,55(21):135-141. 被引量：7

同被引文献11

1黄浩,徐海华,王羡慧,吾守尔.斯拉木.自动发音错误检测中基于最大化F1值准则的区分性特征补偿训练算法[J].电子学报,2015,43(7):1294-1299. 被引量：8
2周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1649
3高友文,周本君,胡晓飞.基于数据增强的卷积神经网络图像识别研究[J].计算机技术与发展,2018,28(8):62-65. 被引量：50
4张善文,张晴晴,李萍.基于改进深度卷积神经网络的苹果病害识别[J].林业工程学报,2019,4(4):107-112. 被引量：23
5李淼,王敬贤,李华龙,胡泽林,杨选将,黄小平,曾伟辉,张建,房思思.基于CNN和迁移学习的农作物病害识别方法研究[J].智慧农业,2019,1(3):46-55. 被引量：34
6王东方,汪军.基于迁移学习和残差网络的农作物病害分类[J].农业工程学报,2021,37(4):199-207. 被引量：52
7刘震,纪明妹,郭志顶,阎旭东,滕霄,岳明强,刘青松,徐玉鹏.图像识别技术在病虫害防治方面的应用与展望[J].沧州师范学院学报,2022,38(1):119-123. 被引量：4
8黎英,宋佩华.迁移学习在医学图像分类中的研究进展[J].中国图象图形学报,2022,27(3):672-686. 被引量：18
9杨莲,石宝峰.基于Focal Loss修正交叉熵损失函数的信用风险评价模型及实证[J].中国管理科学,2022,30(5):65-75. 被引量：24
10卫雅娜,王志彬,乔晓军,赵春江.基于注意力机制与EfficientNet的轻量化水稻病害识别方法[J].中国农机化学报,2022,43(11):172-181. 被引量：8

引证文献2

1石瑞,艾山·吾买尔,早克热·卡德尔,王中玉,杰恩斯艾力·努尔达艾勒.体育器材数据集的构建及分类方法研究[J].东北师大学报（自然科学版）,2022,54(4):54-63. 被引量：1
2潘晨露,张正华,桂文豪,马家俊,严晨曦,张晓敏.融合ECA机制与DenseNet201的水稻病虫害识别方法[J].智慧农业（中英文）,2023,5(2):45-55. 被引量：3

二级引证文献4

1邵倩倩.基于拉普拉斯图结构的农作物病虫害识别算法[J].科技视界,2023(14):31-33.
2宋秀慧,王洪刚.基于改进卷积神经网络的胶合板霉变检测技术研究[J].粘接,2024,51(4):45-48.
3安毅,张慧,陈思秀,郑文.基于注意力多尺度融合的人脸表情识别算法研究[J].长春工程学院学报（自然科学版）,2024,25(1):59-63.
4许晓慧.利用自制体育器材提高小学体育课堂教学有效性实践分析[J].教育界,2024(12):77-79.

东北师大学报（自然科学版）

2021年第3期

浏览历史

内容加载中请稍等...

基于通道域注意力机制的特征融合方式被引量：2

参考文献4

二级参考文献14

共引文献107

同被引文献11

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于通道域注意力机制的特征融合方式 被引量：2

参考文献4

二级参考文献14

共引文献107

同被引文献11

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于通道域注意力机制的特征融合方式被引量：2