基于Transformer双线性网络的细粒度图像分类方法被引量：1

Fine grained image classification network based on transformer bilinear network

导出

摘要为了改进在细粒度图像分类过程中类别差异难以提取的问题,提出了一种基于Transformer双线性网络的细粒度网络分类优化方法(BT-Net).首先,将输入图像通过不同卷积处理成不同长度的二维向量;然后,构建重复次数不同的编码器;最后,双网络分支将图像表示为来自两个Transformer的特征集合,得到更加丰富的互补特征信息,从而提高细粒度分类的精度.实验结果表明:在CUB-200-2011,Cars196和Stanford Dogs数据集中,BT-Net分类准确率分别为89.4%,92.5%,94.8%,优于已有的双线性卷积神经网络. In order to improve the difficulty of extracting class differences in fine-grained image classification,a fine-grained network classification optimization method based on transformer bilinear network(BT-Net)was proposed.First,the input image was processed into two-dimensional vectors of different lengths through different convolutions,and then an encoder with different repetition times was constructed.Finally,the double network branch represented the image as a feature set from two transformers to obtain more abundant complementary feature information,thus improving the accuracy of fine-grained classification.The experimental results show that the classification accuracy of BT net in cub-200-2011,cars196 and Stanford dogs data sets is 89.4%,92.5%and 94.8%,respectively,which is better than the existing bilinear convolution neural network.

作者向旭宇刘亚捷曾彬谭云 XIANG Xuyu;LIU Yajie;ZHENG Bin;TAN Yun(College of Computer Science and Information Technology,Central South University of Forestry and Technology,Changsha 410000,China;College of Computer Science and Engineering,Changsha College,Changsha 410000,China)

机构地区中南林业科技大学计算机与信息工程学院长沙学院计算机科学与工程学院

出处《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2024年第2期84-89,共6页 Journal of Huazhong University of Science and Technology(Natural Science Edition)

基金国家自然科学基金青年项目(62002392) 湖南省自然科学基金资助项目(2022JJ31019,2020JJ4141) 长沙市物联网安全态势感知与风险评估技术研发创新平台建设项目.

关键词细粒度特征融合图像分类双线性 TRANSFORMER fine grained feature fusion image classification bilinear Transformer

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1种衍文,章郴,冯文强,潘少明.基于多粒度生成对齐网络的行人重识别[J].华中科技大学学报（自然科学版）,2022,50(4):64-70. 被引量：4
2罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318. 被引量：142
3曹毅,费鸿博,李平,张小勇.基于多流卷积和数据增强的声场景分类方法[J].华中科技大学学报（自然科学版）,2022,50(4):40-46. 被引量：3
4赵冬梅,李志坚.基于Transformer的网络安全态势预测[J].华中科技大学学报（自然科学版）,2022,50(5):46-52. 被引量：11

二级参考文献16

1晓莉,达飞鹏.基于排除算法的快速三维人脸识别方法[J].自动化学报,2010,36(1):153-158. 被引量：32
2王玥,钱志鸿,王雪,程光明.基于伽马通滤波器组的听觉特征提取算法研究[J].电子学报,2010,38(3):525-528. 被引量：28
3张琳波,王春恒,肖柏华,邵允学.基于Bag-of-phrases的图像表示方法[J].自动化学报,2012,38(1):46-54. 被引量：25
4颜雪军,赵春霞,袁夏.2DPCA-SIFT:一种有效的局部特征描述方法[J].自动化学报,2014,40(4):675-682. 被引量：29
5余旺盛,田孝华,侯志强.基于区域边缘统计的图像特征描述新方法[J].计算机学报,2014,37(6):1398-1410. 被引量：15
6高莹莹,朱维彬.深层神经网络中间层可见化建模[J].自动化学报,2015,41(9):1627-1637. 被引量：16
7孙慧,姜宝华.道路拥堵视频监控信息智能检测仿真[J].计算机仿真,2018,35(5):431-434. 被引量：6
8韦娟,岳凤丽,仇鹏,宁方立.基于EEMD的异常声音多类识别算法[J].华中科技大学学报（自然科学版）,2018,46(7):117-121. 被引量：7
9张任川,张玉臣,刘璟,范钰丹.应用改进卷积神经网络的网络安全态势预测方法[J].计算机工程与应用,2019,55(6):86-93. 被引量：24
10罗浩,姜伟,范星,张思朋.基于深度学习的行人重识别研究进展[J].自动化学报,2019,45(11):2032-2049. 被引量：116

共引文献156

1张哲,邵允学,吕刚.基于机器视觉的台架上钢坯位置分割[J].计算机系统应用,2022,31(10):254-260.
2赵毅力,李禹成,陈皓.云南野生鸟类图像自动识别系统[J].计算机应用研究,2020,37(S01):423-425. 被引量：2
3王铮,刘纪平,车向红,王勇,杜凯旋.基于卷积神经网络的地图相似度匹配方法研究[J].测绘科学,2022,47(7):169-175. 被引量：3
4许学斌,刘燊莲,路龙宾,刘晨光.多尺度混合注意力胶囊网络的海洋鱼类识别[J].光电子．激光,2022,33(11):1158-1164. 被引量：2
5商立军,臧益民,王四旺.耐钙心肌细胞的分离及基本电生理特性[J].第四军医大学学报,2000,21(2):247-249. 被引量：12
6田娟秀,刘国才,谷珊珊,鞠忠建,刘劲光,顾冬冬.医学图像分析深度学习方法研究与挑战[J].自动化学报,2018,44(3):401-424. 被引量：100
7张潜,桑军,吴伟群,吴中元,向宏,蔡斌.基于Xception的细粒度图像分类[J].重庆大学学报（自然科学版）,2018,41(5):85-91. 被引量：16
8胡清华,王煜,周玉灿,赵红,钱宇华,梁吉业.大规模分类任务的分层学习方法综述[J].中国科学：信息科学,2018,48(5):487-500. 被引量：14
9张号逵,李映,姜晔楠.深度学习在高光谱图像分类领域的研究现状与展望[J].自动化学报,2018,44(6):961-977. 被引量：73
10邹承明,罗莹,徐晓龙.基于多特征组合的细粒度图像分类方法[J].计算机应用,2018,38(7):1853-1856. 被引量：5

同被引文献18

1何凯,冯旭,高圣楠,马希涛.基于多尺度特征融合与反复注意力机制的细粒度图像分类算法[J].天津大学学报（自然科学与工程技术版）,2020,53(10):1077-1085. 被引量：6
2李祥霞,吉晓慧,李彬.细粒度图像分类的深度学习方法[J].计算机科学与探索,2021,15(10):1830-1842. 被引量：8
3张文轩,吴秦.基于多分支注意力增强的细粒度图像分类[J].计算机科学,2022,49(5):105-112. 被引量：6
4吕冬健,王春立.可变尺寸循环注意力模型及应用研究[J].计算机工程与应用,2022,58(12):243-248. 被引量：1
5Meng-Hao Guo,Tian-Xing Xu,Jiang-Jiang Liu,Zheng-Ning Liu,Peng-Tao Jiang,Tai-Jiang Mu,Song-Hai Zhang,Ralph R.Martin,Ming-Ming Cheng,Shi-Min Hu.Attention mechanisms in computer vision:A survey[J].Computational Visual Media,2022,8(3):331-368. 被引量：71
6申志军,穆丽娜,高静,史远航,刘志强.细粒度图像分类综述[J].计算机应用,2023,43(1):51-60. 被引量：6
7解耀华,章为川,任劼,景军锋.基于自适应特征融合的小样本细粒度图像分类[J].计算机工程与应用,2023,59(3):184-192. 被引量：1
8Yilin LYU,Liping JING,Jiaqi WANG,Mingzhe GUO,Xinyue WANG,Jian YU.Siamese transformer with hierarchical concept embedding for fine-grained image recognition[J].Science China(Information Sciences),2023,66(3):184-199. 被引量：1
9田战胜,刘立波.基于改进Transformer的细粒度图像分类模型[J].激光与光电子学进展,2023,60(2):161-168. 被引量：4
10李清格,杨小冈,卢瑞涛,王思宇,谢学立,张涛.计算机视觉中的Transformer发展综述[J].小型微型计算机系统,2023,44(4):850-861. 被引量：8

引证文献1

1孙露露,刘建平,王健,邢嘉璐,张越,王晨阳.细粒度图像分类上Vision Transformer的发展综述[J].计算机工程与应用,2024,60(10):30-46.

1Dogs Don't Bite[J].小学生时代（大嘴英语）,2024(3):23-23.
2何志祥,齐琦,何伟,郭龙源.跨层协同注意和通道分组注意的细粒度图像分类[J].计算机系统应用,2024,33(3):126-133.
3李校林,高雨薇,付国庆.基于生成对抗网络的文本转图像研究[J].计算机应用与软件,2024,41(3):188-193.
4Suzanne Robare.Doggone It[J].China Weekly,2024(3):62-62.
5赵智强,帕孜来·马合木提,刘行行,周昂.光伏逆变器IGBT器件接线故障诊断方法[J].河北大学学报（自然科学版）,2024,44(1):17-26.
6陶鹏,冯林,杜彦东,龚勋,王俊.面向元余弦损失的少样本图像分类[J].中国图象图形学报,2024,29(2):506-519. 被引量：1
7Qian GONG,Xuan LE,Pengcheng YU,Lenan ZHUANG.Therapeutic advances in atrial fibrillation based on animal models[J].Journal of Zhejiang University-Science B(Biomedicine & Biotechnology),2024,25(2):135-152.
8王玲,孙莹,王鹏,白燕娥.基于改进DPGN的少样本图像分类算法研究[J].重庆理工大学学报（自然科学）,2024,38(2):161-169.
9Mansoore Shariat Sarcheshme,Nayereh Esmaeilzadeh,Nasibeh Zerangian,Nooshin Peyman.Epidemiological characteristics and trends of animal bites in Neyshabur,Iran:A cross-sectional study[J].Journal of Acute Disease,2023,12(6):219-225. 被引量：1
10赵善琛,李华,王萌,赵艺鸿,李先杰,金圣宇.无流体剪切力条件下ADAMTS13裂解内皮细胞上特大血管性血友病因子的研究[J].中国实验血液学杂志,2024,32(2):532-540.

华中科技大学学报（自然科学版）

2024年第2期

浏览历史

内容加载中请稍等...

基于Transformer双线性网络的细粒度图像分类方法被引量：1

参考文献4

二级参考文献16

共引文献156

同被引文献18

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Transformer双线性网络的细粒度图像分类方法 被引量：1

参考文献4

二级参考文献16

共引文献156

同被引文献18

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Transformer双线性网络的细粒度图像分类方法被引量：1